Categories


Tags


搜索引擎的Robots协议

robots.txt是一种存放于网站根目录下的文本文件,用于告诉搜索引擎的爬虫(spider),此网站中的哪些内容是不应被搜索引擎的索引,哪些是可以被索引。通常认为,robots.txt文件用来搜索引擎对目标网页的抓取。

robots.txt协议并不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个文件,但也有一些特殊情况。

对于Google来说,使用robots也未必能阻止Google将网址编入索引,如果有其他网站链接到该网页的话,Google依然有可能会对其进行索引。按照Google的说法,要想彻底阻止网页的内容在Google网页索引中(即使有其他网站链接到该网页)出现,需要使用noindex元标记或x-robots-tag。例如将下面的一行加入到网页的header部分。

<meta name="googlebot" content="noindex">

如果Google看到某一页上有noindex的元标记,就会将此页从Google的搜索结果中完全丢弃,而不管是否还有其他页链接到此页。

搜索引擎的Robots规则

对于百度来说,情况和Google类似,如果有其他网站链接目标网页,也有可能会被百度收录,从百度的说明页面上看,百度并不支持像Google那样通过noindex完全将网页从索引上删除,只支持使用noarchive元标记来禁止百度显示网页快照。具体的语句如下。

<meta name="Baiduspider" content="noarchive">

上面这个标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。

例如,淘宝网目前就通过robots.txt来屏蔽百度爬虫,但百度依旧收录了淘宝网的内容,百度搜索“淘宝网”,第一个结果也是淘宝网首页地址,只是该页面没有网页快照,因此看来,网站只能禁止百度的快照,而无法禁止百度为网页建索引。

来源:月光博客


Public @ 2018-04-08 16:09:21

面包屑导航(位置导航)的重要性,在SEO中起到什么作用?

一、什么是面包屑导航从用户的角度是基于位置信息的指引,它清晰的指出从当前页面到首页的相关路径,引导用户返回首页或目录页。面包屑导航最能体现出一个网站的逻辑结构。二、面包屑导航的作用面包屑导航最主要的作用还是引导用户返回网站首页或目录页,避免用户“迷路”,简单的讲就是告诉用户行走路线。其次面包屑导航可以提升网站的整体权重,譬如:小型站点的面包屑导航可以是这么表现:网络营销首页>网络营销方法&g

Public @ 2010-08-19 16:11:41

首页链接的优化

在网络营销实战密码读者交流网站上,一个朋友问了一个关于首页链接的问题:关于网站的逻辑结构,应该是和树型物理结构相吻合,也就是也就是由首页到末端的发散,但是和物理结构不一样的是,每个频道和内容页都应该链接回主页,以加重主页的权重。使得整个网站的权重呈金字塔分布。而在导航中不同频道的链接文字描述应该准确描述该栏目的内容,这是很容易理解的。但是我感觉在大多数的网站中,链回主页的文字基本都是 “主页”,“

Public @ 2016-09-21 16:11:24

Robots.txt 文件应放在哪里?

obots.txt 文件必须放在网站的根目录。放在子目录的 Robots.txt 文件搜索引擎不能爬取到,所以不会起任何作用。如:https://www.seowhy.com/robots.txt    是有效的。https://www.seowhy.com/a/robots.txt  是无效的。以下3种情况需要注意:1、如果手机网站采用的是m.的二级域名,要给手机网

Public @ 2018-08-20 16:09:23

robot.txt在SEO中的作用

Robots.txt 是一个网站管理员可通过在站点根目录中放置一个名为robots.txt的文件来让搜索引擎(及其爬虫)知道该如何来收录并处理某些目录或页面,并使索引过程更加有效更加规范。 Robots.txt 的作用是向搜索引擎解释网站中哪些目录和文件希望被搜索引擎收录、哪些不希望收录,以避免搜索引擎抓取到网站误差的内容。如果 robots.txt 被恰当地设置,可以有效提高收录质量和网站

Public @ 2023-03-03 03:00:14

更多您感兴趣的搜索

0.463520s