最近发现博客的一个页面被百度重复收录起来,度娘了一下发现WP建的博客都有这种情况,所以提醒大家注意下,严重的话可能导致博客被百度K掉。
重复收录对网站seo优化的弊端想必大家都是知道的。重复收录,就是搜索引擎重复收录相同内容的页面。大量的重复内容当然是没有意义的,不管是对搜索引擎还是用户,相当于互联网垃圾。
一般来说重复收录的情况分为同站重复收录和非同站重复收录两种。后者是其他站抄袭自己的站,或者镜像网站,对自己本身的网站影响不大。而前者重复收录的是同一个站内的页面,严重的话可能导致被k。
导致网站被重复收录的原因有很多,在这里笔者主要讲一下刚刚碰到的一个情况。使用WP(word press)搭建的博客评论中的“?replytocom”。
大家一定要注意这个问题
解决方法:
解决的方法就是在robots.txt中写下规则禁止蜘蛛收录。在robots.txt中添加以下代码即可:
Disallow:/*?replytocom=
百度蜘蛛一般都很2 ❗ ❗ =。=
文章存档页 http://www.2meili8.com/archives/date/2012/10/20
文章页 http://www.2meili8.com/archives/134.html
现在百度把我这两个页面都收录了,这样算不算重复收录?现在我就郁闷怎么改这个ROBOTS。看了你的文章,请教您帮我改一下这个。
@眼霜什么牌子好 @眼霜什么牌子好:WordPress写完一篇文章之后会有不少重复内容,比如发布了一篇文章之后,没有使用》ßmore–>标签,那么极有可能造成首页、文章页、tags页(正好tags相关文章只有这篇文章)、文章存档页(正好那个月只有那篇文章)三个页面高度重复,这对于seo是不理的,这里我简单介绍以下如何用robots.txt解决这个问题。在网站根目录新建robots.txt文件,然后在文件里输入下面的代码:
User-agent: *
Disallow: /wp-admin/
Disallow: /archives/date/
Disallow: /archives/tag/
@眼霜什么牌子好 @眼霜什么牌子好: 你网站访问速度有些坑爹,先不进去留言了。 😎
我站没有发现这个问题
用robots比较好解决
@徐菡玲博客 @徐菡玲博客: 对,必须要用robots
知道出现这个代码的原因么???
@鲜葡萄创意站 @鲜葡萄创意站: 因为是百度蜘蛛的分辨能力不强,这些是一些评论函数,百度也直接给抓取了,谷歌的分辨能力很强,这个毛病直接就给忽略掉了
@露水晨曦 @露水晨曦: 你不说我还真不知道..马上加rebots 了
@鲜葡萄创意站 @鲜葡萄创意站: 呵呵,打错了吧?是robots 嘿嘿 😮
这个我前段时间就注意到了,也修改了robots了,呵呵
@愚蠢的凡人 @愚蠢的凡人: 嗯,不注意不行呀 💡
是不是因为你用了 评论解锁这个插件啊,或者就是主题的SEO优化不好。
@Junan @Junan: 评论解锁是主题自带的 💡
@露水晨曦 @露水晨曦: 噢 不过也好,不然好多SPAM的。
恩,一直没有注意过这个问题。多谢博主提醒啊!
@yuexingchen2 @yuexingchen2: 原来没有出现过这个问题,不知道怎么回事
额,我的收录都没有,就更别谈重复收录了。。。
@花少 @花少: 这样重复收录超惨的,幸好我早日发现,再晚一点就得被K了。 😥
@露水晨曦 @露水晨曦: 我现在已经不关注度娘了,爱收不收。。。
@花少 @花少: 我也有重复的。不过页面地址不一样 — ! 不知道神马情况