“每天网易邮件服务器所接收到的垃圾邮件一般占到邮件总量的95%以上,”一位网易邮件部的技术人员对《第一财经周刊》说。这些邮件五花八门,包括促销或赚钱信息、培训、电子杂志、开发票、连环信等等,恶性的垃圾邮件甚至包含病毒等破坏性成分。网易为此采取了行为过滤和内容过滤两类方法来处理邮件,能过滤掉98%以上的垃圾邮件,数量高达上亿封。

“但垃圾邮件制造者经常在内容上加入干扰码,或将其信息隐藏于大篇幅的正常邮件中,”罗晓华说,“这就给垃圾邮件的判定增加了难度。”网易未来对制止垃圾邮件的技术研发重点将集中在人工智能和内容判定上,针对垃圾邮件制造者在推广时留下的信息对其进行分析和封锁。

垃圾邮件不光会对用户和邮件服务制造商造成困扰,根据企业网络风险管理公司 McAfee Resource Center最新的研究结果显示,批量发送的垃圾邮件是超大的碳排放制造机。报告指出,每年全世界的垃圾邮件数量已高达62万亿封,浪费在发送、处理、过滤垃圾信的电力则近330亿度—这是240万户家庭一年的用电量,换算成碳排放的话,平均一封垃圾邮件会造成 0.2 克的二氧化碳排放量,而每年生产和处理这些垃圾邮件相当于往大气中排放1700万吨二氧化碳。

因此,连比尔·盖茨都跳出来对垃圾邮件宣战了。2011年年初,通过和联邦执法机构合作,微软反数字犯罪部门粉碎了世界上最大的垃圾邮件网络— Rustock。根据旧金山Ferris Research公司的调查显示,网络用户平均每天需要用2.8分钟删除垃圾邮件。不考虑人工的浪费,从纯资源角度(设备折旧、电源损失、传输损耗)计算,每年将有大约100万吨石油因为垃圾邮件白白浪费。微软捣毁了Rustock,其结果是相当于将13亿千瓦时的电力送还给全世界,这部分电力曾被该网络用来发送垃圾邮件骚扰用户—其中大部分邮件仅仅是虚假抽奖信息或是询问客户是否想要整容。

据Switched.com网的调查数据显示,在高峰时期,Rustock的网络每天操控200万台电脑发送300亿封垃圾邮件。通过摧毁它,微软将全球垃圾邮件的产量削减了60%左右。即使是不喜欢微软的人也承认,比尔·盖茨这次干得太棒了。

但在具体到过滤垃圾邮件时,微软Hotmail的成绩还稍逊于谷歌Gmail。据调查数据显示,目前Gmail的用户量较去年增长了27%,是电子邮件领域里的冠军,这在很大程度上跟它的防垃圾邮件技术有关。谷歌 Gmail很早就推出了“冠军邮件过滤器”(Champion Spam-Filtering)。Gmail的用户的账户被和一个专属的域名绑定。当邮箱收到垃圾邮件时,Gmail 的用户域名服务器会自动开启判别程序,把垃圾邮件挡在门外。被阻挡下来的垃圾邮件全部被储存在Gmail垃圾文件夹当中,用户可以随时检测是不是有误判的邮件。

与很多网站的邮件系统的反垃圾策略类似,Gmail一开始也是通过白名单和黑名单对邮件发送者进行过滤,同时用基于内容的分析方法辅助判断。谷歌的特色在于它的黑白名单建立过程很不一样。由于垃圾邮件可被定义为用户不期望收到的邮件,这一行为特征是谷歌反垃圾邮件的依据。因此第一步是正确识别邮件发送者,Gmail 采用域名(不同于以往的IP地址)为识别单位,识别邮件来源的域,分析各个域名服务器的邮件行为来对它们建立信用制度,来自信用度高的域名服务器的邮件被认为是正常邮件,放进收件箱;来自信用度低的服务器的邮件则被认为是垃圾邮件,扔进垃圾箱而不是拒绝接收。对于不能判定域的邮件,或者该域的信用度处于中间模糊状态的邮件,则用基于内容的方式做分析,以此作为下一步判定的基础。

这种以域为单位的信用评判方式,基于一个假定:即来自于同一个域的用户具有相似的行为。这就要求邮件服务提供商对垃圾邮件进行严格的管制,否则它的一小部分用户的垃圾邮件行为会影响到正常用户的使用。比如,国内163、新浪和搜狐的免费邮箱经常被人用来发送垃圾邮件,结果导致很多国外邮件服务商直接拒绝来自它们的信件。Gmail对用户的邮件发送频率也进行了限制,规定每天只能发送300封,限制了被用来发送垃圾邮件的程度—但目前,谷歌根据域名服务器来判定的方法还不能很好地区分转发邮件中的垃圾邮件。Gmail目前在辅助以用谷歌的算法,结合上千种关键词来对被转发的垃圾邮件进行搜索和分类。

赛门铁克首席软件架构师Paul Fletcher认为,电子邮件过滤已经逐渐成熟,在过去几年并未发生太大改变。但把防垃圾邮件的技术移至云计算将会是未来的趋势,企业只需要简单地部署基于云的电子邮件系统,而这种系统很容易安装和操作。

根据众多安全公司的研究,解决垃圾邮件最佳的方式是依靠目前最为时髦的云计算技术建立一个强大的分析运算平台,实现对发件人的评估。依靠云计算的分析能力,网络监管人员可以通过发件人的邮件发送地址,邮件发送频率,邮件发送后用户的反应等各个方面来分析发件人的被信任指数,当发件人的分数低到一定值的时候,就可以判定发件人为垃圾邮件发送者,然后采取相应的措施对发件人进行封锁。另一种方法则是所谓“蜜罐”技术,就像猪笼草散发出香甜气息诱捕获喜欢吃蜜的昆虫一样,网络服务商制造大量的虚假电子邮件账号,这些账号是没有真实的对应用户的,然后他们将这些账号按云计算的原理分发到全世界网络的各个角落,诱使垃圾邮件发送者上钩,再将其封锁。

微软在去年5月推出了新一代Windows Live Hotmail,新的Hotmail最为引人关注的就是垃圾邮件处理技术。它携带的“SmartScreen”筛选器是微软对有关云计算技术在其中应用的统称,它们能对收到的邮件进行智能分析。据微软说,这一技术可以帮助用户过滤98%的垃圾邮件,每天屏蔽55亿封垃圾邮件。