replytocom 导致搜索引擎重复收录

最近发现博客的一个页面被百度重复收录起来,度娘了一下发现WP建的博客都有这种情况,所以提醒大家注意下,严重的话可能导致博客被百度K掉。

重复收录对网站seo优化的弊端想必大家都是知道的。重复收录,就是搜索引擎重复收录相同内容的页面。大量的重复内容当然是没有意义的,不管是对搜索引擎还是用户,相当于互联网垃圾。
一般来说重复收录的情况分为同站重复收录和非同站重复收录两种。后者是其他站抄袭自己的站,或者镜像网站,对自己本身的网站影响不大。而前者重复收录的是同一个站内的页面,严重的话可能导致被k。
导致网站被重复收录的原因有很多,在这里笔者主要讲一下刚刚碰到的一个情况。使用WP(word press)搭建的博客评论中的“?replytocom”。

大家一定要注意这个问题


解决方法:

解决的方法就是在robots.txt中写下规则禁止蜘蛛收录。在robots.txt中添加以下代码即可:
Disallow:/*?replytocom=

 

22 条评论

  1. Linsky

    百度蜘蛛一般都很2 ❗ ❗ =。=

  2. 眼霜什么牌子好

    文章存档页 http://www.2meili8.com/archives/date/2012/10/20
    文章页 http://www.2meili8.com/archives/134.html
    现在百度把我这两个页面都收录了,这样算不算重复收录?现在我就郁闷怎么改这个ROBOTS。看了你的文章,请教您帮我改一下这个。

    1. 露水晨曦

      @眼霜什么牌子好 @眼霜什么牌子好:WordPress写完一篇文章之后会有不少重复内容,比如发布了一篇文章之后,没有使用》ßmore–>标签,那么极有可能造成首页、文章页、tags页(正好tags相关文章只有这篇文章)、文章存档页(正好那个月只有那篇文章)三个页面高度重复,这对于seo是不理的,这里我简单介绍以下如何用robots.txt解决这个问题。在网站根目录新建robots.txt文件,然后在文件里输入下面的代码:

      User-agent: *

      Disallow: /wp-admin/

      Disallow: /archives/date/

      Disallow: /archives/tag/

    2. 露水晨曦

      @眼霜什么牌子好 @眼霜什么牌子好: 你网站访问速度有些坑爹,先不进去留言了。 😎

  3. www.52wulian.org

    我站没有发现这个问题

  4. 徐菡玲博客

    用robots比较好解决

    1. 露水晨曦

      @徐菡玲博客 @徐菡玲博客: 对,必须要用robots

  5. 鲜葡萄创意站

    知道出现这个代码的原因么???

    1. 露水晨曦

      @鲜葡萄创意站 @鲜葡萄创意站: 因为是百度蜘蛛的分辨能力不强,这些是一些评论函数,百度也直接给抓取了,谷歌的分辨能力很强,这个毛病直接就给忽略掉了

    2. 鲜葡萄创意站

      @露水晨曦 @露水晨曦: 你不说我还真不知道..马上加rebots 了

    3. 露水晨曦

      @鲜葡萄创意站 @鲜葡萄创意站: 呵呵,打错了吧?是robots 嘿嘿 😮

  6. 愚蠢的凡人

    这个我前段时间就注意到了,也修改了robots了,呵呵

    1. 露水晨曦

      @愚蠢的凡人 @愚蠢的凡人: 嗯,不注意不行呀 💡

  7. Junan

    是不是因为你用了 评论解锁这个插件啊,或者就是主题的SEO优化不好。

    1. 露水晨曦

      @Junan @Junan: 评论解锁是主题自带的 💡

    2. Junan

      @露水晨曦 @露水晨曦: 噢 不过也好,不然好多SPAM的。

  8. yuexingchen2

    恩,一直没有注意过这个问题。多谢博主提醒啊!

    1. 露水晨曦

      @yuexingchen2 @yuexingchen2: 原来没有出现过这个问题,不知道怎么回事

  9. 花少

    额,我的收录都没有,就更别谈重复收录了。。。

    1. 露水晨曦

      @花少 @花少: 这样重复收录超惨的,幸好我早日发现,再晚一点就得被K了。 😥

    2. 花少

      @露水晨曦 @露水晨曦: 我现在已经不关注度娘了,爱收不收。。。

    3. 落雨

      @花少 @花少: 我也有重复的。不过页面地址不一样 — ! 不知道神马情况