Categories


Tags


复制内容网页是怎样形成的?

复制网页(或者叫重复内容网页)指的是两个或多个网页内容相同,或非常相似。

一般来说,搜索引擎不喜欢复制内容网页,他们会尽量判断哪一个是原始版本,然后把其他的复制网页忽略不计。

有两点值得注意:

1)复制网页的判断并没有一个比例。比如说一个网页上有60%或80%的内容和其他网页相同,就被列为复制网页,如果真有一个比例那就简单多了。

2)复制网页并不会带来惩罚。搜索引擎会丢掉其他的复制网页,但不会惩罚搜索引擎认为的原始出处。

不过这就有可能对真正原始出处产生惩罚。比如搜索引擎判断错误,把原始出处当成复制的,而把复制的当成原始出处。

复制内容网页的出现一般有这些可能性:

1)网址规范化问题所产生的。

2)代理商和零售商的网站经常从产品生产商的网站上抄下产品信息。这倒没什么不对,一般产品生产商也都同意,但是绝大部分代理商,零售商,批发商都会直接copy,而不做改动。所以这些电子商务网站上充斥着大量复制内容网页。

3)打印版本。很多网站提供更适于打印的版本,如果没有用robots.txt文件,那么这些打印版本网页就可能会变成复制网页。

4)网页内容由RSS生成。有很多网站,尤其是新闻类网站,都是用其他网站的RSS feed来生成网站内容的,这些内容在原始出处和很多其他网站上都已经出现了。

5)电子商务网站使用Session ID。搜索引擎蜘蛛在不同时间访问网页的时候,被给了不同的Session ID,但实际上网页内容是一样的。不过由于Session ID的参数不同,就被当成了不同的网页。

6)网页实质内容太少。每个网页上都不可避免的有通用的部分,比如导航条,版权声明等等。如果网页的正文部分太少,数量还抵不上这些通用部分,就有可能被认为是复制内容网页。

7)文章抄袭转载等。有的时候是其他人抄袭了你的网站内容,有的时候是善意的转载,有的时候是作者自愿的向不同的网站发送文章,这些都有可能造成复制内容网页。

8)镜象网站。镜象网站曾经很流行,当一个网站太忙太慢的时候,用户可以通过替代镜象来看内容或下载,这也有造成复制内容网页的风险。

9)产品或服务类型之间区别比较小。比如有的网站把自己的产品或服务按地区进行分类,但实际上提供给每个地区的产品或服务都是一样的。在这些按地区分类的网页上,只是把地名改了改,其他内容全都一样。

来源:SEO每天一贴 Zac 昝辉


Public @ 2020-10-24 15:18:30

网站有搜索索引,但迟迟没有收录的原因

搜索引擎有抓取索引网站,可是网站内容并不收录,到底是怎么回事呢?网站要想有很好的流量,除了网站自身有忠实用户去不断点击,也需要做好基本的网络营销推广,而搜索引擎排名就是很常规的获取流量方式。网站要想有好的排名,首先还是解决收录的问题。要想解决收录的问题,首先还是解决搜索引擎蜘蛛抓取。目前很多互联网平台都不让发外链了,所以大多数朋友采用的还是友情链接和部分外链。当然搜索引擎都有链接提交渠道,所以基本

Public @ 2017-07-23 15:55:40

站长必看的62条黄金法则

1,网络的成功,是可以复制的。2,自己做不了的事情,找别人来完成。3,交际是网络创业成功的捷径。4,做网络的真正的高手,都是年龄大于35岁的。5,技术是最次要的一个环节。6,一个人从开始做网络到正规站阶段,至少需要5年的时间。7,一个垃圾团队的能力远超出一个天才的全部。8,在投资上节约的人,就是最会浪费的人。9,用最简单的程序来完成最复杂的要求,就是最完美的网站。10,广告的最高境界,就是不像广告

Public @ 2016-05-10 15:33:00

Google对于重复內容的建议

Google 线上问答 – 重复内容(2016年6月16日)从此次的问答影片当中可以看到,Google的Andrey Lipattsev非常肯定地说Google对于重复内容并不会给予惩罚。我们认为,他想表达的应该是想让大家了解到,如果Google认为你的网页内容并不是独一无二的,同时你的排名也不在你的竞争对手之上,此时并不表示Google就是根据你页面的重复性而惩罚你,因而降低你的排名。另外,在影

Public @ 2014-04-07 15:18:31

产生复制内容的原因

下面这几个问题可能造成复制内容。1.代理商和零售商从产品生产商那里转载产品信息。2.网页内容由RSS生成。3.转载及抄袭。4.镜像网站。5.URL任意加字符还是返回200状态码。6.打印版本。7.产品或服务类型之间的区别比较小。8.使用Session ID。9.网站结构造成的各种页面版本。10.网页实质内容太少。来源:搜外网

Public @ 2022-01-21 15:18:31

更多您感兴趣的搜索