IT运维管理是软件全程质量保障的重要组成部分,山东省软件评测中心根据多年经验总结了以下方法,希望能给大家带来帮助。
一、 做好运维的三个关键点:IT运维流程管理、监控及一体化管理、应急管理。
加强IT运维流程管理。进一步完善运维管理流程,健全运维管理制度和标准,重点加强事件管理、问题管理、变更管理、配置管理等关键管理流程和数据管理、机房管理等制度标准建设与执行力。加强管理流程整合,完善信息交互机制,形成闭环管理。强化事件分级制度,建立有效的事件升级及响应机制;加强事件后续分析与处理,不断优化管理流程;建立变更分类标准和变更分级审批流程,完善变更窗口管理制度,有效降低变更对生产运行的负面影响;制定配置参数移植、修改、备份、存储、更新、销毁等方面的管理制度,控制配置操作引发的风险。完善数据存储、使用、传输以及备份管理,进一步制定标准、规范,重点强化客户信息和经营分析数据等敏感数据访问控制、清理、销毁以及数据变形使用管理;进一步加强机房人员、供电、空调、防火管理。
加大集中监控及一体化管理力度。健全生产系统软硬件、网络及应用系统性能监测指标体系,优化监控策略;在实现对系统、设备、网络、基础环境等监控基础上,重点加强对核心应用系统和电子银行渠道监控;构建统一监控平台,统一管理和展现各种监控资源,实现集中告警方式,全面、及时掌握系统整体运行状态,快速定位故障、缩短处理时间;加大对总分行监控系统整合力度,提高总行对分行生产系统监管能力,进一步完善监控、响应、处理、报告、反馈和跟踪机制,实现全行范围基础设施和主要应用系统生产运行情况的全面监控,提高运行管理的全面控制能力。提高运维管理自动化水平,整合操作、维护、监控、响应、处理等管理流程,推进企业级总控中心(ECC)建设,促进运维管理一体化。
应急管理。应急管理包括故障应急处理、高可用冗余建设、灾难恢复计划DRP或业务连续性计划BCP等几方面。应急管理的一部分也是可以利用一些流程化管理的。同时融合运维绩效考核KPI及SLA进ITIL运维流程管理系统,以KPI引导,转化被动的基础的IT运维工作到主动的高阶段的IT服务管理。
二、做好运维的基础工作方法是“实现四化”:“合规化、透明化、标准化、系统化”。实现这个基础后,会有更好的方法和更好的基础去做好运维工作。
1、合规化从监管以及管理高层与风险管理迫切压力需求的角度来说特别重要;内容是“做好信息安全及应急管理”,需要管理流程与安全及应急管理控制手段结合,如ITIL事件升级到重大事件,再升级到灾难等升级流程及应急流程管理,包括灾备恢复演练的流程。所以说“应急管理的一部分也是可以利用一些流程化管理实现的”;
2、系统化就是利用这种管理系统将各种IT管理流程、运维管理经验、IT服务管理思想系统化,并能不断优化,扩展;
3、“透明化”就是运维的管理要对内对下透明,对上对外透明;
4、实现方法是“健全运维绩效考核评价机制以及SLA,服务级别协议与服务报告管理”这几点。“透明化”这一点其中有一点奥妙。指标只是其中表象的一部分,关键是如何融合进工作流程中,让每个人都知道KPI,并实时了解掌握自己的当前绩效,真正发挥出的KPI导向作用:好用、易用、有用。做好从时效、质量、满意度等考虑的事件、问题、变更管理的基础工作,包括以SLA、系统可用率考核的重大事件或故障、系统容量、性能管理等工作,做好基础、接口与系统化,才能将 “透明化”有了实现的基础,能使得运维部门有压力和动力从IT运维 转向做IT服务管理,变被动运维向主动服务转变,然后从对内、对下的透明化,转向SLA做到对外、对上的透明化。
网页标题:做好IT运维管理基础工作的对策
分享地址:
http://cxhlcq.com/article/pjohop.html