当前位置:首页搜索引擎反作弊的三个模型 举报文章

搜索引擎反作弊的三个模型

作者:admin    来源:用户投稿    时间:2015.6.10   

  诸如链接农场、内容农场、关键词堆砌等都是十分常见的作弊方式,为了维持良好的搜索展现结果,搜索引擎自然就会有反作弊进行应对。

  那么,搜索引擎会通过怎样的方式进行反作弊处理呢?

  总的来说,会有以下三种思路:

  1、信任传播模型

  前段时间同事A跟我说了一件事儿,他的姐姐B在国外留学,然后一天B在qq上跟A说洗衣服把手机,银行卡什么的全部洗了,让A给B的老妈打电话寄点钱来,A立刻执行,B的老妈也深信不疑,在即将打出的那一刻,B的一个电话,挽救了即将发生的损失。

  细思恐极。

  其实,这也是一个信任传播模型,直接在QQ上跟B的妈妈说,B的妈妈必然不会完全相信,但是经由A的口一传,就立刻不一般。因为,A在B的妈妈的信任名单中。

  OK,由此而来,就是一种反作弊的思路。

  在海量的网页数据中,通过技术或人工的手段,获取值得完全值得信任的网页设置为白名单。白名单中网页的信任值由链接顺着向外扩散而递减或者衰减。然后,设定一个值,高于此值,是OK的网页,低于此值,不好意思,你作弊了。

  2、不信任传播模型

  这个,其实跟第一种思路是及其类似的,找到一群作弊的网页,然后通过链接关系分析不信任分值。

  唯一一点需要注意的是,信任分值,是通过链接正向传递的,不信任分值是通过链接反向传递的。举个例子:

  A为垃圾页面,则指向A的链接B是垃圾页面的概率比A指向的链接C的概率要大的多。

  3、异常发现模型

  所谓异常,可以是作弊页面的特征,也可以是正常页面的特征。

  集合了这些特征,再由此来判定一个页面是否作弊或者是否正常,也是蛮OK的一件事情。

  来个简单的识别链接农场的小例子:

  链接农场中的链接关系,是由设计者精心布置的,由此一来,必然会有些违背自然的特征,诸如:

  1)、出链与入链的统计分布规律:正常的页面出链与入链满足Power-law分布,作弊的链接违反该分布;

  2)、作弊的链接的Url网址往往过长,包含较多的点画线及数字等;

  3)、诸如入链及出链的增长率等,正常网页和作弊网页在这些变化模式上是不同的。

  转载请注明链接地址 http://www.seosos.cn/search-engine/anti-cheat.html。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:搜索  搜索引擎  索引  引擎  作弊  三个  模型  
  • 相关搜索
图片推荐
    电商网站盈利只需要做好三件事即可

    电商网站盈利只需要做好三件事即可

    电商网站的运营和盈利说复杂也复杂,说简单也很简单,可能对于长时间做电商网站运维的站长来说是非常简单的,当然咱们今天主要说的是对于想做或刚开始做没多久的电商站长。为什么说复杂也复杂说简单也简单呢?主要是
    建站宝盒网站建设教程之网站添加bshare分享功能

    建站宝盒网站建设教程之网站添加bshare分享功能

    网站分享代码作为SEO的重要工具之一,无论是大型网站还是小型网站基本上都会配备。大量数据证明,网站分享代码工具可以快速帮助网站获取网站流量、增加搜索引擎抓取次数,而且还能提升网站用户访问体验。作为新手
    找钱找合伙人难吗?300家创业公司给出五步创业法

    找钱找合伙人难吗?300家创业公司给出五步创业法

    Cherry2002年加入阿里巴巴,积累了十几年的人力资源管理经验,曾为300多家互联网创业企业提供过组织发展、企业文化和人才发展方面的服务,现在在做一个新的平台,专为创业者提服务。在下文中,Cher
    1号店董事长于刚荣获“中国电商创新领袖奖”

    1号店董事长于刚荣获“中国电商创新领袖奖”

    2015年4月12日,在第二届中国(义乌)世界电子商务大会上,组委会向1号店董事长于刚颁发了中国电商创新领袖奖。 据了解,本届大会由浙江省人民政府主办,中国服务贸易协会电子商务委员会、中国电子商务产业
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面