网络安全 频道

业界自动化程度最低的是 IT 行业

    IT 管理自动化对实现ITIL具有重要意义

    Tim Howes 介绍道:“PAS 7,这个最新版本增强了企业级功能,并为 ITIL 流程提供大量的即拆即用工作流程,以便能够与各种领先的应用服务器整合,更好地支持各种异构环境,以及深入整合整套 Opsware 软件。它还含有各种重要的可用性增强功能,进一步强化了流程自动化软件中本已非常好的的用户界面。”

    ITIL(IT Infrastructure Library)是目前比较广泛应用的与IT 服务管理相关的框架,被企业用户广泛采用,作为设计整个企业IT 服务管理框架的指导思想和理论支持。

    在ITIL的框架中,与IT运维管理紧密相关的就是服务管理中的“服务支持”和“服务提供”部分。我们考察其中的主要内容,就能够发现Opsware自动化运维操作平台对于成功实施ITIL具有极其重要的作用。

1. 意外事件管理

    ITIL定义了意外事件管理主要是处理发生的故障,包括对实际的故障从发现,请求,报告的整个过程,其目的是快速恢复由于故障造成的业务中断,可能是对故障的彻底解决,也可能采用应急或临时的解决办法。在故障恢复后,一定要进行问题分析,以彻底解决问题,防止故障的再次发生。

    很多客户在实践ITIL的过程中会率先实施这部分功能,通过HP Openview、IBM Tivoli、CA Unicenter等网络/系统监控软件来实现“意外事件管理”。然而多数情况下,只做到了了“监”,而没有做到“控”。也就是说,IT人员可以通过上述软件看到发生了什么故障,甚至可以了解若干故障之间的关联和受影响的业务等,但是解决这些问题往往还是需要运维人员手工的操作,这就使得运维的效率出现了“延迟”;如果故障数量太多,超过了运维人员的处理极限,哪怕是很小的、很容易解决的故障,都会因为延迟累积而放大故障效果,直到影响业务的正常运转。因此,一个自动化的运维平台对于实现ITIL“意外事件管理”是至关重要的。

2. 问题管理

    问题管理主要关注于跟踪已经确定的已知问题的处理和IT基础架构的长期的稳定性。与意外事件管理的侧重不同,问题管理流程侧重于发现故障的真正的原因,并避免问题的再次发生。对于意外事件管理中虽然已经恢复但是还没有找到原因和采用临时措施解决的问题,需要通过问题管理流程进行问题的分析、诊断,找到问题原因和避免问题再次发生,或者在发生相同故障时,可以快速恢复。

    一个强大的运维操作平台,能够向IT技术专家提供丰富、即时的系统配置信息,可视化地展现网络、服务器、存储、应用之间的映射关系,帮助运维人员快速定位、诊断问题。

    当问题得以解决,形成宝贵的运维经验或知识,通常情况下,这些知识被记录在纸上或者录入到知识管理系统,以备将来发生类似问题时查询。而运维操作平台可以将这些知识固化到企业的IT系统之中,当问题再次发生时,IT系统可以自动的做出反应,将问题解决。

3. 变更管理

    变更管理流程目标是实现在可控制的方式下处理变更的过程。在影响网络可用性的诸多因素中,非法或者随意变更造成的故障占有重要的比例,有统计数据表明,80%的网络故障都与变更有关,因此需要严格控制变更,以提高数据中心的可用性。

    其实,变更就是操作。对于数据中心,变更操作往往是针对一批设备,可能是几十、上百甚至数千台,人工实施变更无疑效率低,出错概率高。运维操作平台的主要功能之一,就是要提供一个自动化的操作工具,使得运维人员能够高效准确的完成对批量设备的变更操作,并自动进行验证;同时,任何一个变更都是在严格的权限控制和记录下进行,做到“按章办事,有据可查”。

4. 配置管理

配置管理负责产生和维护基础架构的资源配置信息。对于每天发生的意外事件,问题,变更处理,新服务的部署,与提供一个服务有关的所有组件的信息都是至关重要的。“配置管理”的职责就是提供和维护这些信息,配置管理是与“服务管理”有关的最复杂但是又是非常重要的任务之一。

    配置管理在ITIL的框架中,是所有流程的一个基础信息,被所有的服务管理功能组件使用,需要保持其信息的准确和及时性。配置数据库保存当前的,历史的配置数据;必须定义和维护属性以便实时追踪CI的配置。同时需要通过相配套的变更管理流程,确保数据库的信息准确。

    根据Gartner对CMDB调查和总结,确定了CMDB的几项关键要素,也就是说CMDB需要符合这些要素才能有效的支持企业IT服务管理的建设目标:
1) 联邦:将来自不同数据源的配置项目信息整合到一个统一的CMDB中。
2) 调整:通过对来自每个数据源的匹配字段进行对比,自动保证 CMDB中的记录在多个数据源中没有重复现象,维持 CMDB 中每个配置项目数据源的完整性
3) 同步:确保数据是更新的,反应真实状况。
4) 映射与可视化:通过可视化的视图将配置项的依赖关系和服务的支撑关系展示出来

    与上面Gartner对CMDB定义的关键要素相对照,现实情况是客户往往实施的CMDB是静态的,靠人工来将不同数据源的配置信息更新到CMDB中。这样建立的CMDB无法真实地反应当下IT基础设施的真实状态,原因就是CMDB没有与运维平台紧密集成。建设运维操作平台,不但需要对IT基础设施的方方面面进行高效自动化的操作,还应当提供统一的数据模型,自动化地更新CMDB相关配置项

5. 版本管理

    版本管理主要指规划和实施版本,一般针对软件和配置。企业保持对版本信息的控制和一致对于提高可用性非常有帮助。比如网络设备的IOS版本,或者配置参数应该尽可能的统一管理,减少随意性。

    版本管理与变更管理流程需要协同工作,因为任何一个版本的下发,都是一个变更的过程。版本管理落实到IT系统中也是变更操作,统一的、标准化的操作平台必不可少。

    6. Service Desk服务台

    服务台不是一种流程而是一种功能,其主要目的是为服务的用户提供一个唯一的接入点。服务台充当着服务用户和支持服务的人员之间的信息沟通通道。

    提供高品质的服务需要处理方法和流程,以便尽可能快的发现和纠正问题。当一个问题被报告,它被服务台记录为一个事件。这种事件控制机制需要不断的确认问题已经有人去关心了,同时也要确认同样的问题报告只被处理一次。当一个问题被报告,服务台将进行响应,并针对问题提出解决方案。服务台可以,但是并不一定需要去鉴别,测试以及实施这个解决方案,服务台的责任是继续跟踪这个问题,确认它能在服务水平规定的时间内被解决,并且在必要时提升这个问题的优先级别。

    自动化的运维平台能够将监控系统、工单系统、诊断操作、变更操作、审计工具等各个运维子系统整合在一起,形成闭环的自动化服务流程。这样,服务台不仅仅是IT服务流程的入口和跟踪报告的窗口,它被赋予了更多的能力,甚至是解决问题的能力。

    将服务流程自动化,实现的目标第一是“提高效率”,第二是“标准化”,这也是实施ITIL非常好的实践最终目标。

    在ITIL管理框架中衍生出来的安全管理和知识管理中,无一例外的均需要一个强大的运维操作平台与之结合,强制落实安全策略、进行安全审计、提供补救措施、积累企业运维经验、固化非常好的实践。

0
相关文章