网络安全 频道

围剿垃圾邮件 OCR指纹分析技术

  邮件过滤短板

  很多邮件服务器在网关层面针对一些敏感的词语过滤。若邮件内容中出现了这类词语,则该邮件将被拒收。此技术可有效地阻止利用电子邮件进行非法、反动、色情宣传,但如果发送者将这些词汇稍微改变就可以轻易地突破这道防线,而一些正当往来的业务邮件,如果包含了设定的词汇也可能被屏蔽。

  早期过滤技术所依赖的就是规则匹配。规则匹配技术指邮件服务器或用户可制订一些硬性规则,拒收或过滤符合规则的邮件。该项技术存在的问题在于:一是采用规则匹配,尤其是正则表达式匹配,对用户要求较高,且易用性不好;二是规则的制订总是落后于垃圾邮件特征的变化。

  随之改进的技术是采用机器学习、文本分类技术自动进行邮件阻挡。这项技术的优势在于可以根据垃圾邮件内容特征的变化,自适应地更新过滤器,从而使过滤器和垃圾邮件自动同步。该类技术易用性好,不需要用户过多参与。但只能针对邮件的文本内容进行处理,对邮件附件中的图像、声音等内容无法分析。

  经历了一段时间的势均力敌的较量,狡猾的垃圾邮件发送者通常会改变他们的垃圾邮件发送方法。只包含图片的垃圾邮件开始盛行起来,现有的过滤系统很难发现或进行智能重组,因为原有的反垃圾邮件技术根本无法知道图片的内容。

  新兴技术与特点

  一般的垃圾邮件防火墙产品,可以拦截住95%以上的普通文字垃圾邮件,但对于图片型邮件的防范力度都显得不足。在针对此类邮件的防治技术中,OCR(光学字符识别)指纹分析技术和可变陌生访问限制技术值得我们关注。

  指纹分析

  指纹分析系统的核心一般是OCR技术。目前,很多厂商都是配合蜜罐系统及用户的举报来收集垃圾邮件并予以分析,在此基础上形成垃圾邮件指纹库。分析邮件并与指纹库中的数据进行比较,自动地阻断、隔离、标记邮件,这样指纹分析就能够阻断图片垃圾邮件,提高识别率与命中率。

  可变陌生访问限制

  可变陌生访问限制是一种控制垃圾邮件发送的技术,但它并不只是一种单纯的发送端控制技术,而是一个需要邮件发送与接收处理各个环节共同参与的新一代邮件构建体系。它的核心思想是:根据邮件接收人对垃圾邮件的投诉,计算发信人的信用,以此控制垃圾邮件的发送,采用邮件服务器与邮件地址两级白名单控制垃圾邮件的接收。

  面对汹涌而来的垃圾邮件,“自扫门前雪”已经不足以宣泄很多互联网用户胸中的愤懑,对垃圾邮件的深恶痛绝和思维中流淌的公益道德使得很多用户正在行动起来,向垃圾邮件发起最有力的反击。事实上,我们每一个受到过垃圾邮件侵害的用户都应该积极响应这种行动,以法律、道德的两把利剑惩罚那些忽视消费者利益的厂商和个人。

0
相关文章