重复内容如何影响搜索引擎优化?
一般来说,Google 不希望对重复内容的页面进行排名。
事实上,谷歌声称:
“谷歌努力索引和显示有独特信息的页面”。
因此,如果你的网站上没有明确的独特信息,可能会影响你的搜索引擎排名。
具体讲,包含有重复内容的网站有三个主要问题:
更少的自然流量: 很直接,谷歌不想在索引中为复制其他页面内容的页面进行排名。
(包括复制你自己网站其他页面的内容)
例如,假设你的网站上有三个内容相似的页面。
然而,这种情况非常罕见的。而且只有当一个网站故意从其他网站上抓取或复制内容时才会这么做。
因此,如果你的网站上有一大堆重复的页面,不需要担心“重复内容的惩罚”。
减少索引页面: 这对于一个有很多页面的网站(比如电子商务网站)尤其重要。
有时候谷歌不仅仅是降低重复内容的排名,它还拒绝索引这类内容。
因此,如果你的网站上有页面没有被索引,这可能是因为抓取预算浪费在了重复内容上。
最佳实践
关注不同 url 上的相同内容
这是重复内容出现的最常见原因。
例如,假设你正在运作一个在线零售T恤产品的电子商务网站。
你有一个T恤产品页面。
如果正确设置的话,针对同一款式,不同尺寸、不同颜色的T恤产品应该出现在相同的URL中。
再看另一个例子:
如果你的网站有搜索功能,那些搜索结果页面也可以被索引。同样,这会为你的网站增加大量的页面。所有这些都包含重复内容。
检查索引页面
查找重复内容最简单的方法之一就是查看你网站上被谷歌索引的页面数量。
你可以通过在 Google 中搜索 site: example. com 来实现。
或者在 Google 搜索控制台中查看你的索引页面。
无论哪种方式,这个数字应该与你手动创建的页面数量一致。
例如,埃克森数字营销有77个页面的索引:
如果这个数字是1000或100,000,我们就会知道很多页面都是自动添加的。这些页面可能包含大量的重复内容。
另外,很多情况下,你用site命令和谷歌搜索控制台查询索引页面时,会发现,索引的页面会少于你实际的页面,常见的原因是:你最新发布的几个页面尚未被谷歌索引,这属于正常情况。
但如果是发现,有某个或某几个页眉发布很长时间(例如发布几个月)后,始终未被索引,这时候你需要检查是否你的页面包含重复内容,或者其他原因导致谷歌不索引页面。
确保网站正确重定向
有时候你不仅仅拥有同一个页面的多个版本… … 还有同一个站点的多个版本。
例如:
当你的网站的“ WWW”版本没有重定向到“non-WWW”版本时,这个问题会出现。
(反之亦然)
如果你把你的网站切换到 HTTPS,而没将HTTP网站重定向到 HTTPS 网站,这种情况也会发生。
简而言之: 所有不同版本的网站应该统一到同一个版本的网。
具体操作,每个网站应该有四个版本的URL,我们要做的是把四个版本的URL统一跳转到一个URL。
一旦谷歌机器人访问你网站,它将处理重定向并仅索引原始内容。
(这有助于原始页面排名)
留意类似的内容
其实重复内容并不仅仅是从其他地方完整复制的内容。
事实上,Google 将重复内容定义为:
还有一个网页是为关键词“Learn French Cambridge”排名。
虽然内容在技术上会有所不同。例如,一个页面列出了波士顿位置的位置。另一页是剑桥的地址。
但是在大多数情况下,这种内容是非常相似的。
这在谷歌眼中是重复内容。
为网站上的每个页面写100% 独特的内容很痛苦?是的。但是如果你真的想对网站的每一个页面进行排名,这是必须的。
使用 Canonical 标签
rel=canonical标签告诉搜索引擎:
“我们有一大堆重复内容的网页。但是这个页面是原始的。你可以忽略其余页面”。
谷歌曾经说过,使用Canonical签比屏蔽重复内容网页要好。
(例如,使用robots.txt 阻止谷歌机器人,或者在网页 HTML 中使用 noindex 标签)
因此,如果发现你的网站上有重复的内容,你要:
- 删除它们
- 重新定向他们
- 使用canonical标签
使用工具
一些搜索引擎优化工具可以帮助发现重复的内容。
例如,Siteliner 会扫描你的网站,寻找包含大量重复内容的页面。
这些页面是重复内容的巨大来源。
因为它们对用户体验很有用,埃克森数字营销建议在这些页面中添加“ noindex”标记。这样,他们就可以不需要搜索引擎索引他们。
你也可以在 WordPress 中进行设置,让页面不自动生成标签。
了解更多
谷歌如何处理重复内容? : 谷歌的马特 · 卡茨关于谷歌如何关注重复内容的视频。
重复内容惩罚的认识误区: 这篇文章讲述了为什么大多数人不需要担心“重复内容惩罚”。