网络安全 频道

“云网管” 大规模服务器监测破局

  “云网管”解决之道

  随着新型的互联网和IT应用层出不穷,用户的数据中心越来越大,服务器和网络设备的数量越来越多,这些海量设备的存在为运维管理提出了新的挑战。陈新刚表示:“为了从根本上解决以上网络运维管理所面临的困境,美信将云计算的概念引入到这个领域中,推出了CreCloud 云网管产品。云计算有两个最根本的特征:虚拟化和动态扩容,在CreCloud的产品设计中,我们充分地体现了这两个特征,CreCloud通过把多台服务器的监测能力虚拟成一台超级服务器,实现了虚拟化监测。当数据中心的服务器和网络设备增加时,CreCloud通过增加‘监测云’中的服务器来实现动态扩容” 。

  以往当需要对大规模服务器进行海量监测时,传统的方法是使用多台性能配置高的硬件服务器,部署多套网管产品来分割进行。而现在应用CreCloud 的“云管理”技术,用户可以将多台PC Server进行虚拟,构建出一个性能强劲的虚拟服务器,CreCloud完全满足了用户对大规模监测的稳定可靠性、持久安全性、灵活扩展性的需求。

  CreCloud的工作原理见图一

“云网管”解决之道

  如图一所示,CreCloud云网管主要创新成就包括如下几个部分:

  中央控制器(Central Control Unit,简称CCU),是CreCloud云网管的大脑,主要负责协调、管理、分配众多的任务管理器和实时数据库,实现云管理方案中的各项功能。

  TaskDispatcher任务管理器,主要负责调度管理由CCU中央控制器分配过来的监测任务,通常情况下,一个TaskDispatcher任务管理器可以完成对1000台服务器(或者网络设备)的监测。如上图所示,TaskDispatcher任务管理器所管理下的监测服务器组成监测云,完成对大规模设备的海量监控。该监测云具备动态监测负载均衡、多机容灾备份、监测服务器热插拔等众多功能。

  RealDB实时数据库,主要实现对海量监测数据的实时存储和报表数据的生成。

  在陈新刚看来:“用户的核心需求是管理设备,而不仅仅是购买工具。由于CreCloud可以使主控机实现双机热备和虚拟可动态扩容,两台主控制台服务器组成高效的‘主’—‘备’模式,‘主’服务器和‘备’服务器之间通过‘智能心跳’技术实时关联,一旦主控制服务器宕机,备份服务器马上启动执行任务。不但解决了用户目前7*24小时的不间断监测需求,也为用户未来系统扩容的需求做好了准备。”

  在部署方面, CreCloud提供了真正意义上的分布式部署,实现了在不同工作区域一套管理软件、一套配置、一套报警,构成了强大的虚拟后台和简洁的前台呈现。陈新刚强调:“其实云网管可以提供给用户的不仅仅是一套工具,而是一整套解决方案。网络运维管理的主要瓶颈之一就是数据库分析这一层,能否把监测采集到的数据进行快速存贮和精准分析是衡量网络管理系统优劣的重要指标。MXsoft通过自主开发数据库与用户指定数据库相结合,满足了不同客户对监测数据的存储需求,既可以将数据存在用户指定的数据库中,同时也可以在自己的数据库中进行备份。”

  另外在报警形式上采用了比较多样化的手机短信和声音报警相结合的方式。一旦出现性能故障或性能指标达到报警标准,警报便会通过界面颜色显示、声音、邮件、手机短信息等方式自动发送,及时通知相关管理人员在故障发生前及时消除故障隐患。

  据介绍,这种“云网管”技术所面向的用户群体是比较高端、拥有大量服务器的用户,MXsoft已经瞄准了例如门户网站、网络游戏和大型国企、电信等多个领域,准备发力。陈新刚还透露,明年可能会发布CreCloud的日本版和英文版,进军海外市场。在谈到网络运维领域未来的技术趋势时陈新刚自信地指出,“越是听上去简单易懂的技术,越需要深厚的积累和复杂的工作。云网管是一个势在必行的趋势。因为目前面对大规模服务器监控,传统网管产品已经无法满足需要。所以我们对这个市场的前景充满信心。”

0
相关文章