Akismet的工作原理推测

Akismet真让人又爱又恨,以前被博客SPAM狂轰滥炸的时候删评论删到手软,后来生气了,装了akismet,从此世界清静了。

可万万想不到的是,自己的工作也开始需要做SPAM去制造互联网垃圾了。

于是akismet成为全民装备的wordpress资源让人看得心痒痒,一直喜欢的插件反过来成为了最大的敌人和噩梦。

如何通过akismet和博主审核成为了博客评论成功的关键,经过一些互联网资料的收集和自己的实践思考,发现akismet的工作原理应该是按照这样的模式。

  1. 所有评论首先都会传送一份到akismet服务器进行判断。
  2. akismet收集到了名字,网址,邮箱,和内容,ip,5个数据,其中名字不可能用作判断依据。
  3. akismet有一个信任名单,中立名单,黑名单。
  4. 每当博主对评论手动通过一次,该评论的网址,邮箱,ip就获得一次加权。当积累到一定量之后进入信任白名单,所发评论能自动通过。
  5. 当博主对评论进行一次垃圾标记,该评论的网址,邮箱,和内容,ip就获得一次负加权,当积累到一定量之后进入黑名单。
所以SEO们做博客评论的时候,可以注意以下措施
  1. 必须对这4个参数进行变化以躲避akismet,邮箱,需要批量生成不同的邮箱,或手动胡乱编写。
  2. 优化的目标网址,需要尽可能制作更多的外部网址,扩大外部链接域名量,规避akismen,通过洗权重的方式多层传递权重到目标网站。
  3. 内容,尽可能spin和手动编写内容,减少复制粘贴的次数。
  4.  ip,使用大量新鲜代理进行ip切换,减少ip被屏蔽发布失败的可能。
当然最终通过了akismet, 也要通过博主的人肉审核,比如我的博客里经常出现这些群发的垃圾评论,如:
  1. 博主,我喜欢你的博客
  2. 好,顶一下
  3. 谢谢学习了
  4. 呵呵,强行插入。呵呵。
这种没有任何营养的your blog is nice这种评论只可能不会通过,浪费了你的人力物力和劳动力还有机器磨损费,以及你的寿命。机器群发评论暂且不谈,但如果是人肉评论的话,为什么不看看文章,写点有意思的内容呢。这样的话,一个链接博主也不是会很吝啬的,而你也在枯燥的外链建设中获得了乐趣,双赢或双输,你选哪个?
一:Akismet黑名单
Akismet 工作原理推测
云记录对比判断方式: Akismet 要求wordpress所在空间能正常连接到它的4组服务器当中的一个,所以,应该是把各种评论发表人的名称、邮件、网址和评论内容进行归类,当有新的留言发表时,通过对比数据库中的记录,然后自动判断是垃圾留言还是正常评论。
用户人工判断: Akismet 还没有强大到能和人类一样思考的地步。所以,数据库中对垃圾评论和正常评论的判断依据还是用户的反馈。当时古博刚建立的时候,在很多站点上留言,几乎统统进入待审状态;而一两个月后,同样的数据都是通过Akismet直接第一时间显示出来。所以可推测, Akismet在接收到新用户数据的时候,先统统放入待审状态,等到用户进行判断,积累足够多的数据之后,就把这些数据归类为“垃圾”或“正常”,可以直接判定了。
二、Akismet筛选词典
我自己测试后,觉得应该Akismet的服务器上还应该存在一个筛选词典,词典中保存一个英文单词词库,当有毫无实际意义的字母堆砌被发布成评论时,Akismet系统自动将其屏蔽掉,无论发布人的信息是否存在于黑名单中。
一个简单的测试可以验证上面的猜测:找一个家养的宠物狗在键盘上任意抓挠并造成在博客上的留言,当该留言被点击发布后,会立即被已安装的Akismet插件屏蔽掉,而这只狗肯定不在Akismet的黑名单中。
相关的解惑:
其实,一直很困惑,为什么会有人发布大量根本没有任何意义的留言和链接,大多留言中的英文单词和网址都是根本不存在的,有什么意义呢? 后来发现,其实在众多毫无意义的垃圾留言中,总能找到一些有意义的留言和网址,正是发布垃圾留言者的真正用意。稍微想一下,也不难理解,在同一个博客上一次发布大量的相同留言,再弱智的发垃圾评论插件都会轻易的将其识别出来,这些无意义的垃圾评论其实做掩护用的。转自:http://riku.lantern-festival.com/400.html
http://hjp.jimdo.com/2011/03/31/akismet/

0 条评论
发表一条评论

注意: 评论者允许使用'@user空格'的方式将自己的评论通知另外评论者。例如, ABC是本文的评论者之一,则使用'@ABC '(不包括单引号)将会自动将您的评论发送给ABC。使用'@all ',将会将评论发送给之前所有其它评论者。请务必注意user必须和评论者名相匹配(大小写一致)。