【IT168专稿】根据赛门铁克的一份报告显示,目前垃圾邮件已经占到邮件总数的70%。反垃圾邮件系统的屏蔽、过滤功能升级也带动了垃圾邮件制造商们改进技术。2月份有38%的垃圾邮件是以图片方式发送的,这对于反垃圾邮件产品来说,检测变得更为困难,而且图片垃圾包含的信息具有独一性,能够较容易通过安全过滤。除此之外,垃圾软件制造商也开始大规模使用文字堆砌以及符号堆积,对传统文字识别过滤系统造成不小的困扰。
现有技术力不从心
种种迹象表明,现有的反垃圾邮件产品对图片垃圾邮件的拦截能力还不强,图片垃圾邮件将会继续呈现直线上升趋势。
图片垃圾邮件在2005年开始出现。而在2006年初,图片垃圾邮件在所有的垃圾邮件中所占比例仅为1%,而到了2006年7月份,所占比例已经飙升至15%,到2006年10月更是占据了整体垃圾邮件的25%,目前这个比例是38%。
图片垃圾邮件的持续增长给网络带来了明显的压力。图片垃圾邮件加重了电子邮件系统的负担,因为每封图片垃圾邮件所占空间大约是普通垃圾邮件的10倍。垃圾邮件所占用的空间从平均的8.9KB上升为13KB,增长了46%。垃圾邮件所占用的带宽从2005年10月的每天275千兆增长至2006年10月的每天819千兆,增长了200%。
目前,光学识别(OCR)技术被更广泛地用于防范图片垃圾邮件。利用OCR技术,防垃圾邮件设备能够识别图片中的文字,并根据特定的规则予以相应的评分,再结合邮件的其他部分,如信头、信体的各种特征,最终判断这封邮件是否是垃圾邮件并阻断。
但是OCR技术存在着一个问题:利用这种技术,需要先将图片中的文字信息完全转换成文本文字,然后对文本文字进行检测,从而判断邮件是否为垃圾邮件。这种方法非常容易出现错误,而且对识别垃圾邮件的效率很低。另外,由于需要将图片中的文字信息先转换成文本文字并进行过滤,因此将会占用邮件系统大量的资源。
有一种改进方案是,对图片中的各个可变因素进行集合分析,使防垃圾邮件设备能通过采用核心标识法来对这些可变因素进行阻隔。使用这种方法,可通过应用一些特定签名来阻隔图片垃圾邮件。这种新的OCR技术仅仅查看图片垃圾邮件中的关键字,不需要对图片中的所有文字进行检测,它将对系统的影响减少到最小,而且更有效率地检查垃圾邮件。该技术不仅仅可用于反垃圾邮件,还可用来防止数据流失。
指纹算法效果更好
另一种拦截技术与邮件的内容、格式无关,对付图片格式的垃圾邮件具有理想的效果。该技术的核心引擎采用数字指纹算法,能够用一个数字DNA来标记一封具有相似内容的邮件。一封邮件只要在内容上有一定的相似度,只要是无节制地进行发送,那么很快就能够被遍布全球的检测中心监测到并形成DNA的分布图和爆发模式。对于图片格式的垃圾邮件,即使图片的背景、部分文字等有所变换,由于其指纹特性并未改变,因此将会按照同样的DNA对待。当一封邮件到达网关的时候,网关将以速度远高于关键字扫描的速度快速提取DNA,并实时到就近的数据中心进行比对,从而获得该邮件的垃圾评分等级。
图片垃圾分层防
图片垃圾邮件一般是由三部分组成,一小段文字、含有垃圾信息的图片正文以及用来迷惑邮件过滤网关的后缀文字。如何有效识别并过滤这些披着图片外衣的恶意邮件呢?有一种比较有效的方法是分层处理。当分层处理的解决方案加上有效的过滤规则,用户就会解决图片垃圾邮件所带来的网络资源和网络带宽的大量浪费。
防范垃圾邮件的分层过滤解决方案运用了多种图片垃圾邮件检测技术,其中包括良好的启发式扫描引擎、高效的名誉评估机制以及定向光学字符识别技术。其技术优势在于:每一层都分配有防护机制,多层防护体系将用户邮件服务器遭受恶意入侵的风险降至最低。以上特征保障了企业邮件系统能够在完全可控的前提下有效而顺畅地运行,企业业务也不会因为图片垃圾邮件造成的大量带宽消耗而受到影响。