设为首页收藏本站language→→ 语言切换

鸿鹄论坛

 找回密码
 论坛注册

QQ登录

先注册再绑定QQ

查看: 1835|回复: 0
收起左侧

降低误杀率 八个技巧改进邮件过滤

[复制链接]
发表于 2009-11-29 13:11:36 | 显示全部楼层 |阅读模式
<div><font size="2">  </font></div><div><font size="2">  </font></div><div><font size="2">  垃圾邮件——扰乱我们的生活,浪费我们的时间,带来更多恶意软件——让我们遭受更大的破坏。根据Ferris研究中心统计预测,在2008年将有近40万亿的垃圾邮件被发送,从而进一步导致近140亿美元的利益受损。而在2007年,这一数字分别为18万亿垃圾邮件和30亿美元,增长之快,令人吃惊。</font></div><p><font size="2">   </font></p><center><font size="2"><img height="438" alt="" src="http://image4.it168.com/2008/8/20/07e135f0-18ce-4db2-b85f-3191d3d8b39a.jpg" width="366" /></font></center><p><font size="2"></font></p><p align="center"><font size="2">图1:垃圾邮件对企业的影响</font></p><p><font size="2">   </font></p><center><font size="2"><img height="412" alt="" src="http://image4.it168.com/2008/8/20/4f3116ed-55d8-448c-add7-aa70b6520820.jpg" width="394" /></font></center><p><font size="2"></font></p><p align="center"><font size="2">图2:垃圾邮件对个人的影响</font></p><p><font size="2">  理论上,垃圾邮件过滤器可以拦截垃圾邮件,允许“良好”或者“真实”邮件进入邮件系统。但是过滤器也有出错的时候,垃圾邮件过滤器不可避免的一个副作用就是误报(false positive)和漏报(false negative)。</font></p><p><font size="2">  一般而言,当垃圾邮件过滤器检测出某个邮件为垃圾邮件时,要么阻止其进入邮件系统,要么对其进行隔离,放置在一个专门的文件夹里,以供用户手动识别并删除。对于后一种方法,它需要人工的参与,会消耗用户一定的精力。实际情况是,有一些用户从来都不会去检查这些隔离区。</font></p><p><font size="2">  另外,Ferris研究指出,用户删掉垃圾邮件所承担的成本大约在0.04美元每封。但是该研究所分析师Richi Jennings 也指出,查找丢失的有用邮件所承担的成本远远大于删除所花费的成本,大约每封为3.5美元。更糟糕的是,过滤器漏报、误报给用户带来的损失则会更大。下面,我们将先浅述有关垃圾邮件过滤器方面的技术。</font></p><p><font size="2">  为了尽量减少过滤器导致的误报,我们需要先了解它们的工作原理。</font></p><p><font size="2">   </font></p><center><font size="2"><img height="468" alt="" src="http://image4.it168.com/2008/8/20/e51e1f4e-b9ad-4fe1-9e85-2a9bf2ff4ff0.jpg" width="500" /></font></center><p><font size="2"></font></p><p align="center"><font size="2">图3:垃圾邮件过滤体系结构中的邮箱过滤</font></p><p><font size="2">  <strong>●基于关键字和 Bayesian 过滤器</strong></font></p><p><font size="2">  最早的过滤器,主要是检索邮件主题和正文中的关键字,更高级些的过滤器,则采用了Bayesian算法,可以针对邮件提高过滤准确率。</font></p><p><font size="2">   </font></p><center><font size="2"><img height="226" alt="" src="http://image4.it168.com/2008/8/20/3997cdbe-8a91-45ea-851d-53a3b68a9ca3.jpg" width="500" /></font></center><p><font size="2"></font></p><p align="center"><font size="2">图4:贝叶斯垃圾邮件过滤</font></p><p><font size="2"> <strong> ●Captcha技术</strong></font></p><p><font size="2">  CAPTCHA 是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机和人的公共全自动程序。在一个CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。此种技术可以防止通过软件自动发送垃圾邮件的产生。</font></p><p><font size="2">   </font></p><center><font size="2"><img height="456" alt="" src="http://image4.it168.com/2008/8/20/a92eea10-1022-4e85-8fe7-bc6a8cbbb3f5.jpg" width="500" /></font></center><p><font size="2"></font></p><p align="center"><font size="2">图5: CAPTCHA验证码</font></p><p><font size="2"> <strong> ●建立垃圾邮件黑白名单</strong></font></p><p><font size="2">  与刚才讲的技术不同,这个是根据邮件服务而不是根据信息进行评估筛选,尤其是根据发件人以往行为记录进行分类管理:</font></p><p><font size="2">  黑名单是由世界各地数据库搜集来的,过滤器会根据这些黑名单检查每个进入的邮件,如果符合,那么就会拒绝接收邮件。</font></p><p><font size="2">  白名单同样也是来源于各地IP汇总。邮件过滤器一般既拥有黑名单又拥有白名单,以提高过滤效率。</font></p><p><font size="2">  在某些情况下,过滤器厂商会使用“信誉服务”或者“声誉名单”来区别他们的名单。</font></p><p><font size="2">   </font></p><center><font size="2"><img height="331" alt="" src="http://image4.it168.com/2008/8/20/c81e7955-53ef-482e-ab97-8ee37b18c816.jpg" width="468" /></font></center><p><font size="2"></font></p><p align="center"><font size="2">图6:先进的黑、白名单机制</font></p><p><font size="2">  <strong>●Graylisting系统</strong></font></p><p><font size="2">  收件人邮件系统暂时性拦截未名邮件,然后对该邮件发送者发送一封要求自动回复的邮件。一般而言,通过这种方式可以一定程度上阻止垃圾邮件的侵入,毕竟他们可没有耐心再发送一封回复邮件。</font></p><p><font size="2"> <strong> ●Tarpitting</strong></font></p><p><font size="2">  tarpitting是降低发送垃圾邮件的发件人大量发送电子邮件信息的方法。该方法的目的是维持合法用户在发送邮件时服务的高质量,但是由于这个方法的低反映率,使它不适用于发送垃圾邮件的人。</font></p><p><font size="2">  <strong>●循环模式检测(RPD)</strong></font></p><p><font size="2">  着重分析垃圾邮件发送的样式,RPD技术主要用在垃圾邮件侦测中心内,主动侦测与收集垃圾因特网
您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2025-1-23 07:01 , Processed in 0.052001 second(s), 11 queries , Redis On.  

  Powered by Discuz!

  © 2001-2025 HH010.COM

快速回复 返回顶部 返回列表