如何提高IT运维的效率

如题所述

运维的效率主要是采用监控软件, 市场上有开源的商业2种,开源的采用nagios zabbix ,商业的监控易、摩卡等公司。
对于大型互联网公司,开源更好,因为有专门的团队进行开发,可以把它们改造成适合自己的,而且规模比较大,购买商业的节约的费用也值。
对于中型规模公司,没有开发团队,最好采用商业的,目前商业软件的价格已经下降的很厉害了,监控易还有租用方式,每年就更便宜了。采用开源的,维护一个团队就很不值了,雇佣一个使用商业软件的人的费用会明显低于使用开源软件的,而且如果他离职了你会更发愁。没有的话这些软件很难使用,标准的服务器监控都不好配置,中间件,存储,数据库我看到一个比较有规模的运维团队都没有配置出来,我了解大量公司都用不起来这些监控,造成监控不完全,出了事情还是没有办法。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-11-19
这个其实就是说的有效监控、监管你的IT设备资源,IT应用的问题。下面的只重点说一下个人对服务器与服务器应用进行有效监管,其实,下面这个软件对网络设备、机房环境等IT运维同样有效,只是有其它的模块里。
我今天想说的是,你们服务器硬件都配置好后,怎么来监管你们家的服务器的,而且个人觉得服务器购置的时候,供应商那个亲热,与你以后的服务器运行维护的孤独冷清就如今年的天气,春夏秋冬,让你找不到北。
   服务器我们装好了系统,运行应用后,就开始把我们的小心肝挂上了地雷线。什么时候CPU持续过高、内存占用太多,磁盘空间又不够了,系统又有日志报错,网卡流量太多,还在狂发包,数据库死锁,中间件又连不上,网站服务崩了,ERP报错运行不了,存储访问不了,一大堆千奇百怪的问题随时都有可能引爆从而带来老板的质询与质疑之声,也许中间还夹杂着同事的轻声抱怨,那时的我,表现机会与想死的风险齐飞。
   可是一台服务器运维中这样,两台服务器又那样,特别是虚拟机构建的应用服务问题更多,十台,二十台,甚至更多的服务器与应用,你一个人管理的过来吗。疲惫与不定时的加班电话让我们这么有责任心的网管员的身体活在催魂的惊恐之中。
   这些如何解决,如何有效监管服务器与服务器上的应用,你是一台一台地装上远程工具去远程查看,还是不定时去突击察看一下,还是每个早上上班下班都必备检查一遍,还是出了问题再查看,反正我有时还还得这个厂区跑那外厂区的机房中坐镇坚守半天,可这些基础、繁琐、重复的工作让我们的日常时间不堪重负。如何有效监管,记得我一直强调的是有效,
相似回答