重复内容是一个SEO问题,也许许多SEO或者内容营销者在他们的日常工作中体验过。内容营销者花费大量的时间去创造高水平的内容策略以避免重复或者雷同的处罚。在2013年,Matt Cutts声明有25%的网站是重复内容.
重复是指在站内或站外的网站里不止一次的出现相似的内容。重复或雷同会带来SEO处罚。
事实上,爬虫在不同的版本间索引相同的内容是有难度的。机器人负责挑选相似文章里最好的一个,但由于它并不是总能选择正确的版本,如果这样做会导致相关文章的减少。此外,机器人在不同版本间的正确网页和分享网页间选出正确的链接是有难度的。并且重复内容对已知检索结果的正确版本的排名毫无用处。到最后,你会体验交通拥堵。
问题是,Google给用户体验很大的比分,关注于为用户呈现最好的文章,这也是重复内容被处罚的原因之一。
当所有类型的重复内容都会影响你的SEO时,其中一些甚至会遭受SEO处罚。
这些文章包括:
重复内容的类型
应对重复内容的方式
去除重复内容的工具
导致SEO处罚的重复内容类型
有几种你应该避免的不同类型的重复内容
重复产品形式
电子商务网站经常使用制造商的主题介绍去描述他们销售的产品。问题是这些产品通常销售给不同的电子商务网站。那么,相同的描述出现在不同的网站上,因此产生了重复内容。
拼接和复制内容
一些博主引用其它网站的内容、关键词和评论说明他们的文章。如果你链接会原文章,这本身这没有任何错。然而,Google任然将这视为重复并减小这些内容的价值。
排序和多页列表
大多电子商务网站拥有特定URL的过滤和目录筛选功能。产品页出现在不同的目录,订购情况取决于列表的排名。比如,你 对45款产品通过价格和字母进行排名,将得到两页相同的内容,但是是不同的URL。
URL问题
即使www、http、https、.com/index.html中的URLs指向相同的网页,Google仍把他们当做是不同的,并且将他们评估为重复内容。
会话ID
会话ID问题是指当游客进入网站时被分配给储存有不同的会话ID的相同URL。
可打印版本
当索引同一网页的不同版本时,同一内容的可打印版本会引起内容重复问题。
怎样避免重复内容?
有几种好的方法可以避免内容重复问题。主要的思路是将内容设置成可以整合到一个源头的不同的URL。你可以使用301重定向、rel=canonical等Google Webmaster中心开发的参数处理工具。
301 redirect
301 redirect对于由URL导致的重复问题极为管用,它告知搜索引擎网页的哪一个版本是源版本,并且源版本连接了多个重复版本。除此之外,当不同的排好序的网页连接到同一个版本,它们之间没有任何竞争关系,他们创造了一个整体上更强和更受欢迎的信号。
Rel=canonical
它和301 redirect的工作方式相同,但更容易设置。该标签位于网页的HTML头部分。
所以搜索引擎知道上面的URL是源文件的一个复制版本。
对于其它网站整合的内容你可以使用它避免重复。它将告知搜索引擎你将把该内容链接到源版本。
Noindex,Nofellow
使用noindex,nofollow标签告诉搜索引擎不要索引内容。机器人有能力爬取网页,但并不会索引它。因此,你不会因为重复内容而受到处罚。
首选域
一个相当简单的为搜索引擎设置首选域的操作。他将告知你是否应该在SERP的”www“下展示该网站。
独一无二的产品描述
正如以上所说,电子商务网站上的产品信息能引起内容重复问题。用心书写一个独一无二的网站或者丰富产品描述,因为他将帮助你的网站排名超过那些是重复描述的网站。
什么工具能帮助我检测重复内容?
为了节约时间,你能使用不同的高质量的工具帮你去除重复内容。这儿有三种不同的工具,其中一些是完全免费的。
Siteliner
这款工具检测你网站上的任何重复内容。你只需要添加网站的URL,它将使用您的内容出示一份完整的报告。
OnCrawl
这款现场搜索引擎优化语义工具也能提供重复和雷同检测功能。他向你展示重复和雷同的集群、类型和URL明确的关注点。
这款工具免费提供30天的试用,如果你想体验所有的功能,你只需要在体验结束前选择一个计划并取消订阅,你不许支付任何费用。
Copyscape
Copyscape是一个很好的伙伴,因为它能检测你博客以外的重复内容。因此你可以轻松知道是否有人在没有你的允许下复制你的内容。