当前位置:首页关于百度对网站内容的识别 举报文章

关于百度对网站内容的识别

作者:admin    来源:用户投稿    时间:2015.6.10   

  上个月开始,我制作了两个旅游信息类网站,目前网站收录良好,快照实时更新,但一直尚未有排名。我个人分析了一下,可能在网站的内容上还存在一些问题,那么今天在这里以二一网(www.21w.cc)为例来跟大家讨论一下关于百度对网站内容的识别这一个问题。

  一、百度对网站内容原创度的识别

  今年5月份开始,百度推出了百度原创火星计划,很明显的一个标志就是在页面的索引前加上了一个时间。百度方面的说明是,在原创内容上面获得优待方式上只要满足了用户需求前提下,给予优先展示,另外,展现上,给原创内容还进行标记。但是,根据我个人实际操作各部分站长的反馈来看,大家都感觉百度的原创识别技术不高,包括笔者在内。

  拿二一网来说,有时候自己写的原创文章,收录了,但是并没有原创内容的标记;有的时候非原创的文章转载过来,却有原创内容的标记。当然,出现这种情况可能是百度本身在原创内容的识别上数据库不够强大,后台内容比对过渡还不够完善。从专业学术的角度来看,如果一篇文章里有连续的30个字与其他地方的文章相同,同时引文不添加引用标记,则可以认定为抄袭。

  与百度原创火星计划相相似的谷歌原创计划运行这么长时间以来,也一直没有取得较好的效果。个人认为,现在更多的内容识别可能更依赖于百度权重而已,与文章内容并无太大关联。

  二、百度对网站内容排版格式的识别

  不知道大家有没有这样的体会,建好一个网站后,能过网站采集功能,从其他相关网站采集回来,对文章格式进行处理后,再发布到网站上去,百度也能给予原创内容的标记。

  原本以来,百度蜘蛛抓取时,只会抓取文章正文内容,丢弃代码格式。但是,反过来一想,百度需要识别一些使用格式来做黑帽SEO的手法,从这一点需要上来说,百度不会丢弃网页代码,在抓取时会将代码与正文一同抓取。

  那么,有了上面的分析,我们通过在现在文章上添加一些新的格式、排版就能实现文章的伪原创了吗?对于这个问题,我现在还不能完全给出结论,但可以肯定的一点的是,文章排版排除用户体验的因素后,对百度的抓取还是有一定影响的。

  三、百度对网站内容页面中时间的识别

  百度快照超前和快照滞后这两种情况不知道大家有没有见过,但是我在实际操作过程发现这种情况依然存在的。先来解释一下这两种现象吧:

  百度快照超前,就是百度快照时间超过了当前时间,举个例子,今天是2013年9月12日,但是你的网站中有一个网页快照是2014年9月12日。百度快照滞后则正好相关,比如你发布了一篇文章,发布时期是2013年9月12日,按百度目前的处理情况来看,百度快照应该是2013年9月12日,但是现在你的快照时间是2012年9月12日,而快照时间点上,你的网站还没有上线呢!这又是一种什么情况呢?

  通过分析整理,发现是百度对网页中时间的抓取处理上存在问题。比如,2013年9月12日发布了一篇文章,但是这篇文章的发布时期上却写的是2012年9月12日,那么就有可能出现快照滞后的现象。快照超前则相反。当然,出现这种情况也都只是可能,并不一定都会这样,这也暴露了百度在索引中存在的一些问题。有兴趣的同学可以去试验一下,在快照时间与关键词排名方面可以研究一下。

  文章首发凡夫网赚网 08398.com ,转载请注明出处:二一网http://www.21w.cc 。谢谢。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:关于  百度  网站  站内  内容  识别  
  • 相关搜索
图片推荐
    解析百度蜘蛛如何抓取网站和提高抓取频率

    解析百度蜘蛛如何抓取网站和提高抓取频率

    做seo的小伙伴对百度搜索引擎和蜘蛛是情有独钟啊,因为目前百度是国内PC端和移动端搜索引擎的老大,seo的小伙伴当然是希望百度蜘蛛能够更多的抓取网站,只有抓取的页面多了,才有可能获得更好的收录、排名和
    互联网行业抛弃网站标配APP 谷歌上门拯救WEB

    互联网行业抛弃网站标配APP 谷歌上门拯救WEB

    [摘要]谷歌亲自上门,帮助一家放弃了移动网站的印度电商公司,重新建设新版的网站。  腾讯科技讯 谷歌(微博)开发的安卓操作系统,垄断了全球智能手机市场,但是谷歌也给自己带来一场革命APP(手机端应用软
    用支付宝干这个 一旦查实永久拉黑

    用支付宝干这个 一旦查实永久拉黑

    网络赌博这一社会毒瘤又有抬头之势,不法分子隐身于各类社交平台上,借助建群、红包等功能设局赌博,庄家从中抽成,侵犯用户权益,影响广泛且恶劣。今天,支付宝官微发布《支付宝对网络赌博零容忍》公告称,一直以来
    分析2014年百度站长学院对于网站外链的详细解读

    分析2014年百度站长学院对于网站外链的详细解读

    笔者今天看到站长网有一篇稿子是针对新上线的百度站长学院的,笔者欣喜若狂,a5站长网不愧是站长界的风向标,会第一时间将有价值的资讯呈现在广大读者的眼前,笔者顺着底下的链接地址进入到了百度站长学院,在阅读
    美国近年来最值得“抄袭”的17种商业模式!

    美国近年来最值得“抄袭”的17种商业模式!

    i黑马注:只有视野够广阔,你的创业成功率才会更高,无论是QQ、人人或是微博,你不得不承认中国的很多商业成功案例都是源自于美国创新。就让我们一起来看看创新国度美国近年来出现的,最值得关注的十七种商业模式
    年轻、富有、机智!29岁Reddit创始人传奇人生

    年轻、富有、机智!29岁Reddit创始人传奇人生

    [导读]这位年仅29岁的千万富翁曾经创办过多家企业,另外还投资了60多家科技创业公司。    Reddit联合创始人阿莱克西斯奥哈尼恩(腾讯科技配图)  北京时间3月6日消息,据国外媒体报道,社交新闻
    百度转码是利于体验还是毁掉SEO

    百度转码是利于体验还是毁掉SEO

    今天用手机搜索了我的网站进去以后发现网站由百度转码成手机站,纳闷了我的手机站做的好好的为何转成了百度的手机站?回想一下百度官方的移动网站建设常见问题集锦,我误以为是百度机器无法识别响应式站点,我在搜索
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面