5、记录服务器维护日志和技术文档这点都是在处理完问题后记录下,方便加快日后处理同类问题的速度和效率;至于技术文档,身为运维人员一定要认真编写,写的很糟糕的文档会给人误导作 用,internet上这类文章不在少数,本身IT这个行业就是很浮躁的,如果不能静下心来好好整理知识,总有一天会被淘汰的;对于过去整理的文档要定期的去温习,有错的要及时更正。所谓温故而知新,孔夫子的教诲还是要听的,否则等你有天在搜索引擎搜到自己的文章的时候,怎么想也想不明白当初为什么要这样 做。笔者一直倡导和internet的朋友分享自己的知识,这样有利于自己和他人的共同进步
二、企业运维工具的选择随着企业的业务对IT的依赖越来越多,企业的服务器的架构规模不断扩展,为了更有效率的执行任务,为了我们运维人员不再像流水线上的一名工人一样不断重复的做着同样的工作,我们将会用一类工具,这类工具是可编程的,我们只是需要写上一些代码就可以帮我们自动完成所有的工作。像我们公司用的是瑞宁CAM,集中审计管控系统,除了能完成自动化运维的工作,比如系统安装、系统升级、批量修改密码、主机名规范、终端资源监控、批量配置管理、终端批量实时操控等等,还有事后审计回放的功能,对于事后总结自己的工作,查找错误点非常有帮助。此外常见的运维工具还有:Kickstart、Chef、Nagios、Cobbler、ControlTier、OpenNMS、OpenQRM、Func、Zabbix、Spacewalk、Puppet、Cacti等。
三、企业运维的主要难题1、 IDC服务商的选择服务器多了,自然要找好的IDC运营商;这点很重要,差的IDC会把你服务器装错,会无缘无故把你的域名白名单取消,机柜的带宽流量无法实时监控,CDN效果不佳,服务器出问题的不是先想着如何处理问题,而是找各种各样的借口,什么机房网络被攻击,电源跳闸之类的,各种悲剧!2、服务器提供商和型号的选择这个也很重要,笔者先前遇到一批DELL R410固件问题,每当服务器高流量的时候,服务器网卡会自动断流,需要手动重启网卡,这个问题悲剧了许久,到最后也未能完全解决;之前还遇到过内存,主板故障等问题,服务器的硬件一旦出现问题,就意味着停机检修,服务自然要中断。所以在服务器的选择上也要慎重,而不是只考虑价格问题
(责任编辑:晨鸿) |