网络安全 频道

在危险中运行的实时数据依然有希望

    【IT168专稿】如果你第一次遇见Priceline.com的CIO Ron Rose,他非常愿意告诉你这家网站上可能出大问题的数据点多达7万个左右。网站完全是这家消费者旅行公司的立足之本:2006年,其网站每天网页访问量多达1000万次;全年接受的旅行交易预订额将近30亿美元。

    通常而言,这些7万个数据点在实时IT系统仪表板上受到监控。该公司一直在测试新的仪表板,希望提供有关众多系统的最新信息和关联分析,包括基础设施和网络运行状态、CPU占用率、各种应用度量指标(系统内部传送数据需要多少时间)、Oracle数据库性能、BMC软件监控的I/O利用率等方面的性能、操作系统的页式调度(多少数据进出系统磁盘;操作系统是否用完了所能处理的内存)及其他更多信息。

    所有诸如此类的度量指标对Priceline.com的业务来说至关重要,哈里斯互动公司最近开展的一项消费者调查表明了这点。调查发现,如果与某网站的首次互动很失败,40%的网上消费者会放弃交易,或者转投另一家竞争网站。

    于是,Rose及其IT人员收集及分析源源不断的实时数据,以便发现、预防及解决问题,免得问题出现。他说,这几年下来,公司因而避免了停机时间造成的数百万美元及修复成本。他称之为“做到不损失就是我们的成功之道。”

    不是只有Rose的IT部门得益于Priceline的实时功能。Priceline的业务分析师也可以利用业务活动监控(BAM)系统,该系统能够对最新信息进行交叉分析。这些详细信息涉及航空机票、酒店客房或者出租汽车的类别、不同类型订单的完成比例及更多方面。

    所有诸如此类的数据点让业务用户能够发现对某几种机票或者客房的趋势需求,或者发现访客完成了交易,还是在最后一刻放弃购买某些产品。然后,业务用户就能调整相应数据,获得更多的销售额。Rose说:“业务部门的每小时报告概述了在整个公司流动的财务数据,可以说是技术部门的MTV。他们喜欢保持消息灵通。”

    尽管依赖这种快速进入的变化数据,但Rose承认,用户也得留意系统里面隐藏的各种杂音——比方说可能存在从统计学而言无效的数据(比如Priceline的某个销售类别样本太少,如其中一家小酒店的预订情况),业务用户可能认为这是一种趋势,实际上不是。他提醒说:“绝不是单单几分钟就能得出趋势的。”

    不过,Rose充满信心地认为,Priceline在使用所有这些近实时数据做出更明智的业务决策,并让这个高可用网站出现7万个数据点中任何一个出问题的情况越来越少。

    人人喜欢数据

    改用像Priceline这样的实时信息提供环境向来是许多公司的宏伟目标。由于许多公司竭力满足全球24/7运营的要求,业务性能仪表板、系统监控应用软件、商业智能软件和供应链管理工具里面的实时功能随之大量出现。据Teradata公司开展的一项调查显示,接受调查的公司主管中85%表示,决策者需要比过去更多的最新信息。

    但正如许多公司早就知道的那样,更频繁地提供更多信息并不总是让决策更快速或者更明智。

    实时热潮带来了一些意外的失败:业务用户和IT经理陷在太多的信息中无力招架,潮水般毫不相干的业务活动警报信息和系统性能数据促使他们匆促做出决策,或者索性关闭实时应用软件。Gartner公司负责IT运营管理的调研副总裁David Williams说:“如果你没有在合适时间把实时数据提供给合适人员,实际上给自己带来了很大风险。”

    当然,实时提供数据本身没有什么危险。斯坦福大学研究生商学院管理、信息科技专业的Thoma讲座教授Hau Lee 说:“如果你知道如何理解信息的意思,实时信息总是有用的。”

    的确,这需要漫长的学习过程;实时环境会带来文化上的变化,但许多公司低估了这些。喜力美国公司的IT主管Carol Schillat说:“人人吵着要实时数据;但你提供了实时数据后,他们又老是怪罪于数据。其实错就错在他们不知道如何利用数据。”据Teradata的调查显示,未经认真规划就实施实时数据系统会带来灾难,对客户、利润和生产力带来消极影响。

    为了避免实时系统失败带来的苦果,CIO们就要明白本公司真正需要哪些信息;这些信息与业务用户完成工作的方式有多适合;何时如何提供这些信息最有帮助。一旦完成了这种分析,CIO就可以落实流程和IT系统来提供更有实用价值、选择时机更准的数据流。凯捷咨询公司的咨询业务主管Kevin Poole说:“如果业务人员没有提供这么详细的信息,IT人员也没有要求这些信息,系统就无法提供足够或者太多的信息。”在任何一种情况下,“业务用户都会开始忽视系统。”

    实时是相对的

    与高科技界的大多数术语一样,实时对不同行业的不同人来说有着不同定义。埃森哲信息管理服务部门的CEO Royce Bell说,不过大多数人的定义有一个共同点,就是数据是“在可以付诸行动的时间段”提供的,无论这时间段指秒还是指小时。

    在金融行业,实时数据的定义势必要有即时性。交易员、经纪人和经理管理人要有每时每刻提供的全球股票、证券和商品等市场方面的信息。个中原委不难理解。据业界消息人士声称,在金融服务业,要是系统停运一小时,损失的收入就高达140万到650万美元。像Priceline.com这些电子商务公司、航空行业(空中交通管制人员)、公用事业行业(监控电网的管制人员)以及医疗人员(监护病人的护士),情况也很类似:数据出现再小的变动,也会带来重大影响。

    不过在这些行业之外,即时性开始以分钟、小时甚至天为单位。到底提供多少数据、多频繁,这个问题变得更不确定了。AMR研究公司的副总裁兼研究员John Hagerty说:“大多数公司认为,自己需要实时数据,而实际上他们往往只是按每天的周期来使用数据。”

    因而出现了与实时密切相关的其他术语,包括近实时数据(比每天一次更频繁更新的任何数据)和适时数据(按公司觉得最合适的一天或者一周的任何时间更新的数据)。

    在Delta Apparel这家年收入2.7亿美元的名牌及自主品牌休闲运动服生产商兼经销商,CIO Keith Smith谈到了他面临的“两个世界”。在一个世界,不到1秒就提供的实时数据用于的Delta Apparel生产业务决策——从跟踪马球衬衫订单何时完成,到弄清楚美国哪些配送中心最适合在最短的时间内配送这些衬衫。他说:“这时候,实时数据起到了关键作用。”在涉及销售信息和预算编制的另一个世界,“实时数据完全失去了意义,”Smith说。实时数据根本不实用也没必要。

    虽然Delta Apparel和Priceline能区别这两个世界,并且相应调整数据收集及提供系统,但许多公司缺少这种能力。这时候,实时数据会变得非常危险。

    被实时数据冲昏头脑

    对大多数处于21世纪的公司而言,实时数据流带来的前景具有莫大的诱惑力,于是纷纷使用PC上的业务活动仪表板、通过电子邮件发来的网络监控警报信息及适时制造系统,旨在帮助人们做出更明智的决策。

    但事实真是这样吗?

    埃森哲公司的Bell说:“太多信息会把人的大脑给冻住。如果面临太多的选择,普通人无法做出选择。”公司是不是处在信息过载的引爆点(tipping point)吗?

    Malcolm Gladwell在其2005年畅销书《Blink》中分析了人们如何处理信息来做出决策。他提到医生在急诊室误诊心脏病发作病人,是因为他们试图收集太多的信息,从而往往让实际上会心脏病发作的病人出院,却收治了不会发作的病人。据Gladwell声称,医生收集的信息远远多于实际需要,“因为信息越多,他觉得越有信心……不过具有讽刺意味的是,恰恰正是渴望有信心,最终导致了低估了决策的正确性。他们的头脑里本来就塞满了太多东西,现在塞入了更多信息,结果变得更晕头转向了。”

    这种类似情况就出现在IT部门。实时分析软件供应商Netuitive公司在2006年的一项调查发现,大公司当中41%的调查对象每天接到的警报信息不少于100则,其中至少一半(大多数情况下超过一半)是误报。在接受调查的195家IT组织中,39%表示它们故意把阈值设得高于非常好的值,避免过多的警报信息;或者索性关闭了警报功能。在这两种情况下,系统就基本上失去了作用。

    Delta Apparel的Smith对众多警报信息会导致阻塞深有体会。比方说,Delta的一名员工生成订单后,电子邮件会发给需要知道此事的另一批员工。Smith说:“从理论上讲,这做法很好。但如果我们每天录入一千份订单,我又是收件人,那我根本没有办法来管理这众多信息。没有人处理得了每天收到上千封邮件的情形。”

    但面对的不只是电子邮件警报信息。制造公司的决策者通常认为,自己每天需要材料需求规划(MRP)系统的更新信息,以便每天改变计划、更新预测及库存。而销售MRP系统的供应商通常也这样认为。可事实上,谁也处理不了那么多的信息。Smith表示,许多公司根本无法每天做出这些决策,因为有太多的信息和太大的变数。他说:“这种想法是不切实际的。”

    换句话说,实时系统投入使用后,数据量之大、生成速度之快有时会让业务经理及其他决策者感到惊讶、应接不暇。AMR公司的Hagerty说:“你得到的只是索要的,而不是预期的。”

    如何校准实时数据?

    2005年,分别来自佐治亚理工学院和北卡罗来纳大学的两名研究人士:Nicholas Lurie和Jayashankar Swaminathan着手分析加快实时数据的更新频率会不会“提高公司业绩”。他俩想知道,能不能更迅即地响应环境出现的变化、看到采取的行动带来的影响。

    结果他们发现,更频繁地收到数据点的经理做出的决策反而更糟。Lurie说:“实时数据的危险在于,它可能频繁出现在你面前,也许是每小时;如果你响应这些数据,要是存在某种随机性事件,而你把它当成系统性事件,确实可能会让你犯错。”

    麻省理工学院交通与物流中心主任Yossi Sheffi著有《弹性企业》一书,他觉得实时数据没有错,而是错在人们使用数据的方式。

    Sheffi说:“问题不是‘实时信息是好还是坏?’实时信息有益无害。实时数据的危险在于,如果你过快响应,没有等趋势显露出来。”Sheffi举例说明:宝洁公司不会根据每5分钟收到的数据,就开始针对沃尔玛销售“汰渍”洗衣粉的情况做出库存或者计划决策。

    他说:“你不需要对买走5箱洗衣粉的顾客作出响应。你应当找出产品销售的趋势,并结合历史数据——比方说在过去的几天或者几周,然后与其他事件型数据关联起来,比如可能影响销售额的店内促销或者天气信息。”他说:“使用实时数据一定要明智。”眼下有些公司在这方面比其他公司要做得好。

    在Priceline.com,Rose似乎找到了把实时数据提供给IT用户和业务用户的这个最有效点。公司创办于1998年,此后实时数据文化就发展起来。Rose说:“一开始我们就在动态收集业务度量指标。”

    被问及为什么公司更喜欢每小时的报告,他回答虽然能够为用户提供每分钟的数据(业务活动监控系统具有这功能),但他们发现,15分钟内提供的任何数据极有可能不足以构成需要注意的趋势或者其他方面。

    Rose说:“每小时提供的数据足够准确了。”

    袜子市场

    国际袜子集团(ILG)生产很多袜子。作为美国第三大袜子生产商,ILG每周都要运行处理客户订单的周期,客户大到沃尔玛、小至夫妻店。总的来说,ILG的规划和预测人员能够满足零售商的袜子需求,并且让这些需求与ILG在全球各地的供应商的需求保持同步。

    但如果你对袜子市场有所了解,就知道ILG规划人员的工作其难度有多大。ILG的CIO Alex Moore说:“袜子销售非常依赖天气。如果炎热的天气持续到秋天,我们的销售额就不会开始攀升。”或者,如果南部地区出现寒冷天气,袜子销售额就会上升;这种天气延续多久,上升势头就会保持多久。他说:“我不关心你的软件预测系统有多好;你无法预测何时天气会变冷。”

    导致公司供应链系统出错的不可预测性和随机性就是所谓的杂音——无论是冰暴、地震、大肠杆菌发作还是恐怖分子袭击。杂音只会导致计算机系统、尤其是实时系统神经紧张。这样一来,需求和库存规划面临的危险显得更大了。Moore说:“若使用神经紧张的系统,你对每一丁点信息都会响应。如果每出现一丁点信息,你就改变计划,这确实很糟糕。”

    因而,公司制订过滤掉杂音和紧张的某种战略就显得很重要。对销售突然出现随机性增长反应过度,会引发供应链出现致命的连锁反应:从上到下的每个供应商会增加订单和供应需求,因为它希望有足够库存来适应这种虚假的增长需求。这就是所谓的“牛鞭效应”(bullwhip effect)。

    1997年,斯坦福大学的Lee与人合著了这方面的重要文章:《供应链的信息失真:牛鞭效应》。文章以宝洁公司帮宝适产品的需求规划方面的变化及挑战为例,如今这成了最有名的一个典例。Lee提醒:“你一定要能够区别杂音和真正的系统性转变。”

    啤酒数据

    过去,每月的第五个营业日对喜力美国公司来说是个重要日子。这一天,员工要查看前一个月的销售数据,大致了解这家荷兰酿酒厂的美国分公司取得的销售业绩。IT主管Schillat说:“每个月的数据是这家公司的生命线。”虽然业务用户要等上整整一个月才能查看喜力公司的关键绩效指标,但员工们没有为此而烦心。他们认为,啤酒行业就是这样运作的。

    但到了2000年,Schillat却有了不同认识。当时啤酒业两大巨头百威和米勒公司开始投入巨资,构建实时系统与其他分销商联系起来。于是,她求助于佛蒙特信息处理公司,该公司的供应链产品已在市场取得了长足进展。不到一年后,她就能把分销商每天的销售数据(价格、数量及啤酒送到了哪些零售商店)发给公司。她回忆说:“这对我们来说成效显著。我们突然有了每天的销售数据。”

    虽然这谈不上真正的实时数据,但接近喜力公司看到过的实时数据。但不是每个人都喜欢看到的数据。Schillat回忆:“人们不是很相信实时数据”,原因是他们仍收到以前每个月的信息,这两套信息不是始终一致。

    此后,Schillat与业务用户就一直在努力设计新流程,以适应更快的数据流。但需要做更多工作的是处理用户的培训和发展,以及弄清楚到底哪些数据最适合、最有实用价值以及业务用户应如何响应。

    应对实时数据

    当然,不管什么系统或者项目,CIO的其中一项重要工作就是,促进大家谈论公司真正需要什么数据;谈论何时、何处提供实时、近实时或者适时数据最合适。

    埃森哲公司的Bell说:“这不是公司开几次会后、决定交给IT部门就能办到的,而是要谈论数据源、如何使用数据;因为目前理想的东西在12到18个月后,可能会全然不同。这需要不断谈论。”

    AMR公司的Hagerty建议CIO提出以下三个问题:人们如何管理本部门的信息流?人们果真需要什么数据都实时,还是只要经常更新?IT部门如何响应来支持业务部门的数据需要?

    Hagerty说:“你要事先弄清这些问题。如果有人说‘我需要实时数据’,IT部门要问‘用来干嘛?’有时,业务用户不喜欢这样,但IT部门需要弄清楚。”

    最后,实时数据的作用完全取决于它的用途及支持其使用的流程。Delta Apparel的Smith说:“我认为努力获得实时环境没有什么危险。但你往往会把很多钱投入到获得不切实际的想法;随后认识到信息过载问题过于严重。”

    “不是所有人都明白实时信息带来的影响。”

0
相关文章