扫描二维码关注博盈官方微信公众号
立享网站建设优惠
做SEO离不开内容,没有内容就没有收录,没有收录也就没有排名,应该说,解决内容的问题是很多站长和SEO所头疼的,一定程度上来说比做外链还困难,尤其是遇到专业不对口,行业不熟悉的文案书写的时候,内容简直让SEO想要发疯,因为内容我不禁感慨,做SEO的真伤不起……
好,新手站长和菜鸟SEO想到内容这么难搞?我为什么不觉得,网上那么多精彩的文章,转载过来不就得了?这是最直接最想当然的方法,然而这样的做法最终导致的结果是你的网站充满大量的复制内容,毫无新意,对搜索引擎来说,一个新站一开始就充满大量这样的内容,基本上就宣布你的网站SEO工作失败。关于复制内容对SEO到底有什么样的影响,如何产生,如何避免,这是本篇文章所要谈到的话题,希望能给新手带去一些警示。
什么叫复制内容?复制内容如何产生的?
复制内容也被叫做重复内容,理论上的定义是指两个以上的URL内容一样或者相似度极高,这样的URL可能是一个网站,更多的是发生在不同的网站里面。关于产生复制内容的原因,有必要做个简单介绍,这样SEO在工作的时候才能知道如何避免,如下:
1、技术原因。网站网址URL不规范,未作标准化的问题会让一个网站内部产生大量复制内容,几乎每篇内容都会存在两篇以上的重复。
2、企业站产品站。给成都红土地画室做SEO顾问时这样的感觉最明显,不同地区看到的URL不一样,当是服务内容除了价格几乎完全一样。对产品站来说,代理商或者零售商往往都直接从生产商将产品信息原封不动的转载过来,我们讨论的不是版权问题,也没什么不正确的。问题是大部分代理、零售都会直接复制,除了联系方式其他内容很少改动,在这些网站上充斥着大量重复内容,这些内容重复度极高!对SEO造成很大的影响。
3、网站结构。是的,在大量的产品网站中根据产品的价格、上传时间、区间、评论等等因素进行排序的页面,相同产品都有不同的URL,造成至少三四个页面的重复。在博客中表现得很明显的是时间及分类存档,这些网站结构造成了各种页面版本,形成大量站内重复内容。
4、新闻类网站。我朋友以前做一个新闻网站,直接用RSS生成他需要的内容,这让他觉得自豪,因为不用多大功夫就能获得完整时效的新闻。然而这些新闻内容已经在原文和其他网站上早出现上百次了,最后网站基本上没收录,宣布夭折。
5、网页内容少。在网站上都会有很大一部分的通用内容,比如广告、版权声明、说明文字、上下导航条等等。网页的正文太少,会使得搜索引擎看起来这些网页都是重复度很高的页面。
6、转载和抄袭。这应该是SEO行业内造成当前海量复制内容的最主要原因。各种转载,各种剽窃,还有镜像网站,采集等等。对于这一点没说明好说的,只是希望行业内的人士都应该具有版权意识。
7、http状态码问题。我举例说明,一个用phpwind论坛程序做的论坛,一个具体帖子URL是http://www.boryin.com,如果不做技术处理,tid后面的数字换成任意的上千上万比如100000,服务器依然返回200状态码,与原来的tid=137内容一样,这点会造成恐怖的站内重复内容。菜鸟一定要注意。
既然产生复制内容的因素这么多,那么我们平时应该如何检查手中的内容是否有复制版本呢?很简单,拿正文中较前面的一段话,加上双引号直接百度索索,从搜索引擎结果中就可以直观的发现文章的重复度。举例我曾经在A5写过一篇“初中毕业生SEO创业经历 鼓舞那些仍在彷徨的菜鸟”,标题的组合在A5发布之前是没有命中结果的,现在在谷歌搜索有将近1000个页面,不过令人遗憾的是,绝大部分的转载者没有遵守版权,有的甚至将作者名称都已经换掉了……
复制内容有什么样的害处?
这是我极力想告诉新手站长和菜鸟SEO人员的,因为我担心你们一开始为图方便快捷而大量转载,仔细看完下面的讲解,你一定不愿意让自己的网站刚建立起来就去复制转载了。
首先要澄清一个误解,可能不少新人也会这样理解:网站上充斥着复制内容就会受到搜索引擎的惩罚。正确的理解是:搜索引擎绝不不可能因为我们网站有部分复制内容就处理我们,它应该做的事情是从多个这样的内容版本中识别出最原始出处,然后给定排名,而复制版本往往排名靠后,或者随着时间将被剔除,以致没有排名。但要记住,巨无霸级别的网站不在此列。
目前搜索引擎在判断原创的时候失误率也算比较高的,很多站长对此感到无奈,辛辛苦苦做的原创被别人剽窃发到其他网站,转瞬之间被收录,而自己网站上的原创页面看起来就像是受到惩罚了,因为搜索引擎判断原创失败,没有给予我们应有的分数。
复制内容的另一个害处,站内出现重复还算严重,存在的问题是站长做优化和链接时容易被分散精力,并且搜索引擎认为最适合的URL可能与你想想的不一样,这是一种成本浪费。同一个网站内充斥着的重复内容也会分散权重,造成不必要的内部竞争,在外看来,失去了最佳的排名机会,同时挤掉其他页面被收录的机会。
如果网站上充满70%以上的其他网站重复内容,会引起搜索引擎的注意,他们会怀疑网站的质量,从而导致惩罚,最开始从快照与收录开始体现,接着会降低关键词排名、删除已经收录页面到最后拔毛都是很可能的。我在A5写过一篇:“浅谈网站采集与伪原创这条不归路”,点击率非常高,因此我可以断言,站长内心是知道重复内容的害处的,只是依然“无可奈何”。
接下来我们要考虑的是如何消除重复内容。
针对我上面例举的产生复制内容的原因,站长和新手SEO可以逐条修改避免,例如网址规范化的问题都可以通过技术手段解决。而不是网址规范化引起的重复内容问题,可以对已经收录的重复页面左301,或者通过书写robots.txt文件通配符只保证一种版本被收录。还可以在具体页面天剑noindex(不希望被索引)这个meta robots标签。对于不希望收录的重复页面链接还要添加上nofollow。
解决产品站的复制内容有一个比较好用的方法。这个方法是我在zac前辈的seo实战密码之中学习到的,那就是使用canonical标签。比如一个卖衣服的网站,同一种格调的衣服可能有不同的尺寸,尺寸之间的区别就是颜色,这样同一个尺寸的衣服会因为颜色而产生多个网址,内容却几乎完全一样。这个时候如果使canonical,用户在浏览器得到的页面不会转向,看到的页面虽然还是会不同,但搜索引擎会将权重集中到一个尺寸上,这样整体避免重复内容。不过令人遗憾的是,百度似乎不支持这个标签。
网站要解决复制内容其实是非常麻烦的,因为你可以控制自己的网站,但你无法控制互联网上的其他网站,对于SEO来说,我们只能做到下面两点:
1、在自己的原创内容之中加入版权声明,要求转载保留指向原始页面的链接,原创版本的外部链接应该会比转载的多,对目前的搜索引擎技术来说,这是最重要的判断信息了!
2、坚持原创,网站坚持原创,好处巨大,只要能够坚持一定的时间,网站的权重必定增加,加上网站良好的独特内容给搜索引擎留下的深刻印象,网站之中的内容被判断为原创的机会大大增加。
如果经过以上办法,SEO和站长依然无法解决复制的问题,甚至发现有网站大量抄袭你的内容,造成原创内容全部失效,你也可以主动的去和对方接洽,通过各种手段,比如交际=投诉到空间商、甚至向搜索引擎投诉,在比较不重视版权的中文互联网环境之中,这的确是非常棘手的问题。无论如何,真心希望我们的行业越来越走向规范化。关于复制内容,你是否了解足够了呢?