1. CreCloud云网管介绍
CreCloud云网管是全球创新的、具有划时代意义的、第一套大规模服务器监控完整解决方案,由美信科技于2010年推出。CreCloud云网管可以实时监控数据中心的大规模服务器和网络设备,监控数量从100台到10万台。
CreCloud云网管的推出主要是为了满足客户对不断扩大的数据中心和不断增加的服务器及网络设备的监控需求。CreCloud云网管的产生背景主要和以下三大因素有关:
1) 不断扩大的数据中心和网络,随着新型互联网应用的层出不群,企业IT应用和业务的种类越来越多,以及IBM和HP等公司的大力宣传和推动,企业和政府的数据中心越来越大、服务器和网络设备的数量越来越多,这些海量设备的存在为运维管理提出了新的挑战,这是CreCloud云网管产生的市场基础;
2) 云计算概念的广泛传播,云计算技术首先产生于Google和Amazon,然后在IBM和微软等公司的大力推广下扩展到整个IT行业,云计算的理念使CreCloud云网管的技术实现成为可能,这是CreCloud云网管产生的技术基础;
3) 原有网管类产品的局限性,原有的系统管理或者网络管理产品,不管是软件还是硬件,都是以工具或者工具集的形式出现;不管是简单还是复杂,都是以单套产品部署的原理来工作;不管是部署在1台机器还是几台机器上,都不能真正实现虚拟化的分布式管理,这是CreCloud云网管产生的决定条件。
1.1. CreCloud是什么
不同于过去单机部署的系统管理或者网络管理产品, CreCloud是一个完整的“云管理”解决方案,具有以下技术特征:
首先是完全基于云计算理念开发的“云管理”技术
强大的虚拟计算能力:把多台监测服务器的监测能力虚拟到一起,实现对数据中心大规模服务器的海量监控,监测范围从100台到10万台
高效的动态扩容能力:监测能力动态扩容,以后当数据中心的新设备增加时,只要相应增加“监测云”中的服务器即可实现动态扩容
便捷的分布式部署:把一套系统通过多台机器进行分布式部署,通过一个界面进行统一集中管理,大大提升维护工程师的工作效率
其次是一套完整的“工业级”解决方案,具备以下主流方案特征
动态负载均衡:监测云中的服务器根据数量和计算能力动态承担各自的监测任务,当数量和计算能力发生变化时,通过自动调节机制去重新调整各自的监测任务量
可靠双机热备:两台主控制台服务器组成高效的“主”—“备”模式,“主”服务器和“备”服务器之间通过“心跳线”技术实时关联,一旦主控制服务器宕机,备份服务器马上启动执行任务
多机容灾备份:监测云和存储云中的多台服务器实现多机容灾互备,如果监测云和存储云中有服务器宕机,这些服务器的监测任务马上就会被重新分配到其它正常运行的服务器上,保证了监控的连续性
12. 技术架构
CreCloud是完全自主知识产权的管理平台,CreCloud核心模块完全由美信科技独立自主开发, 囊括了美信科技众多的创新成就,请见下图。
如上图所示,CreCloud云网管主要创新成就包括如下几个部分:
1) 中央控制器(Central Control Unit,简称CCU),是CreCloud云网管的大脑,主要负责协调、管理、分配众多的任务管理器和实时数据库,实现云管理方案中的各项功能。
2) TaskDispatcher任务管理器,主要负责调度管理由CCU中央控制器分配过来的监测任务,通常情况下,一个TaskDispatcher任务管理器可以完成对1000台服务器(或者网络设备)的监测。如上图所示,TaskDispatcher任务管理器所管理下的监测服务器组成监测云,完成对大规模设备的海量监控。该监测云具备动态监测负载均衡、多机容灾备份、监测服务器热插拔等众多功能。
3) RealDB实时数据库,主要实现对海量监测数据的实时存储和报表数据的生成。
1.3. 适合哪些用户
CreCloud云网管的目标用户主要是服务器和网络设备数量在100台以上的政府和企事业单位以及新兴的互联网企业。这些客户包括:游戏、电信、银行、电力、石化、证券、基金、保险、互联网企业及大型网站。
CreCloud云网管的目标用户一般具有以下特征:
1) IT设备数量多
服务器和网络设备数量在100台以上(100台以下用户建议选择美信科技的CreScope综合IT业务管理软件);
2) 监控品质要求高
对运营、监控和服务的品质要求比较高,服务器和网络设备一般不能宕机,如果宕机则会对个人工作、单位或部门业绩、企业收益造成重大影响;
3) 追求高效便捷的管理
希望能够通过一套完整解决方案来监控所有的服务器、应用和网络设备,通过1个产品界面入口进行统一管理,而不是通过部署多套产品来完成任务;
1.4. 解决哪些问题
1) 数据中心大规模服务器的海量监控问题(从100到10万台)
当数据中心变得越来越大,服务器数量越来越多时,监控管理就成为一个棘手的问题,CreCloud云网管专门为解决这一问题而开发,实现实时海量监控、故障及时告警、性能数据分析。
2) 一套平台、一个界面的集中统一管理
按照传统的管理方法,用户需要部署多套软件来对海量服务器进行监控,这样就会造成复杂的管理工作,因为用户需要面对多个登录界面和多套监控程序。而CreCloud云网管采用新型云管理技术,通过CCU中央控制器统一管理后台多个监测模块的协作运行,实现监测动态负载均衡、多机容灾备份、监测增量热插拔等先进技术,前台通过统一的界面来登录、展示、管理,实现简单化管理。
3) 大大提升数据中心运维工作效率
CreCloud云网管的部署大大简化了数据中心海量服务器的运维工作,极大的提升了工作效率,下面是一些不同行业用户的典型案例。
l 某石油公司,数据中心+遍布全国的加油站系统一共有大概10万设备,以前部署过一些国内外不同厂商的产品,但是只能进行小范围的局部监控。通过美信的CreCloud云网管第一次实现全国范围、全部IT设备的海量监控,不仅可以实时监控故障情况,而且可以通过CreCloud云网管采集的数据对不同运营商提供的带宽和业务做性能分析;
l 某游戏公司,有几千台服务器遍布全国的数据中心,有几十万活跃的游戏玩家,以前通过部署共享软件(Nagios+Cacti)的方法来进行监控,共享软件部署了几十台服务器,由于每套程序单独运行,给管理工作造成了巨大的障碍。通过部署美信的CreCloud云网管,C语言开发的监测效率非常高,光是监测服务器就帮助用户节省了75%。因为CreCloud云网管通过一个平台界面进行统一配置、告警和用户管理,所以帮助用户消除了管理障碍,使复杂的工作简单化。
l 某电信运营商,遍布全省的数据中心有上万台IT设备,以前通过人工+国外商业软件的方式进行管理,国外软件操作复杂,基于传统技术开发,给用户的运维工作造成极大的不便。通过部署美信CreCloud云网管平台,从省会城市实现了对全省IT设备的集中统一监控,极大的提高了运维效率,节省了运维时间。
1.5. 为何选择CreCloud云网管
选择既能满足目前的监控需求,又能在未来随数据中心而扩展的新一代大规模服务器完整监控解决方案,从而将您公司的运营转化为竞争优势。作为全球先进套云管理平台,CreCloud云网管提供了最优秀、最可靠的完整解决方案,帮助您实现过去几乎是不可能完成的海量监控工作,在节省成本的同时大幅提高管理效率。
1) 海量监控,经济可行
全面监控数据中心的大规模服务器和其他设备 — 包括WINSOWS和UNIX/LINUX系统服务器、网络设备、数据库、中间件、Web Server、URL、PING及其它应用业务程序。CreCloud云网管是“工业级”的解决方案,具有无可比拟的性能和强大的可扩展性优势,
即使与“免费”的共享软件相比,它整体部署成本也更低。更重要的是,帮助您大幅的提升了管理效率,节省了由于使用其它软件而花费的大量不必要的时间。
2) 更强的掌控力
CreCloud云网管最全面的可用性和多机容灾备份技术不间断地监视着您数据中心的海量设备和程序,从而让您高枕无忧。无论您的数据中心在什么地方,CreCloud云网管都可以助您实现统一集中管理。CreCloud云网管全面的解决方案帮您轻松驾驭数据中心的海量IT设备,防止由于监控不到位而导致的故障损失。
3) 更好的灵活性
通过CreCloud非常好的伸缩性,您可以轻松监控100到10万台IT设备的大型数据中心。CreCloud云网管的监测模块可以安装在数据中心和网络上的任何位置,监测数据采集后既可以存放在监测模块本机,也可以穿透防火墙传回到数据统一存储中心。当数据中心IT设备增加时,只要通过简单增加监测服务器就可以实现扩展监控。
1.6.和传统网管产品比较
美信CreCloud“云网管”和传统网管软件比较 | ||||
序号 | 比较项目 | 相同/ 不同点 | 传统网管产品 | CreCloud云网管 |
1 | 产品特质 | 不同 | 软件或者硬件产品 | 1套完整的解决方案 |
2 | 技术架构 | 不同 | 传统架构 | “云”架构 |
3 | 部署方式 | 不同 | 单台部署 | 分布式部署 |
4 | 管理方式 | 相同 | 通过一个界面进行管理 | 通过一个界面进行集中统一管理 |
5 | 监控对象 | 相同 | 服务器、应用和网络设备等 | 服务器、应用和网络设备等 |
6 | 监测能力 | 不同 | 监测到100台设备就会出现严重瓶颈 | 轻松监测100台,最多可达几十万台 |
7 | 扩容能力 | 不同 | 每个产品都是单一的,不容易扩展 | 无缝动态扩容,只需要增加监测服务器即可实现 |
8 | 负载均衡 | 不同 | 不支持 | 监测云中的各台服务器自动实现负载均衡 |
9 | 虚拟能力 | 不同 | 不支持 | 把多台监测服务器的监测能力虚拟到一起,实现大规模监控 |
10 | 容灾能力 | 不同 | 不支持 | 支持,有一台监测服务器宕机了,这台服务器的任务就会自动被其它监测服务器接管,实现自动无缝容灾备份 |
11 | 热插拔 | 不同 | 不支持 | 支持,拔掉一台监测服务器,这台监测服务器的任务就会自动被分配给其它监测服务器;插入一台安装好监测模块的服务器后,其它服务器上的负载就被自动被分配给这台服务器 |
12 | 双机热备 | 不同 | 大多数不支持 | 支持,每一套云网管解决方案都支持双机热备 |
13 | 适合用户 | 不同 | IT设备数量在100台以下的中小用户 | 游戏、电信、金融、石化、电力、政府、网站等服务器和网络数量在100台以上的大中客户 |