Categories


Tags


Nofollow的具体使用方法

nofollow标签通常有两种使用方法:

1、将"nofollow"写在网页上的meta标签上,用来告诉搜索引擎不要抓取网页上的所有外部和包括内部链接。

<meta name="robots"content="nofollow" />

2、将"nofollow"放在超链接中,告诉搜索引擎不要抓取特定的链接。

<a rel="external nofollow" href="url"><span>内容</span></a>

3、nofollow标签是超链接<a>的一个属性值,我们只需要在源代码里面加上rel="nofollow" 或者更为正规的rel="external nofollow"即可 即:<a href="#" target="_blank" rel="nofollow">###</a> 。

nofollow还有另外的一些写法:

Meta robots标签必须放在和之间,格式:

content中的值决定允许抓取的类型,必须同时包含两个值:

是否允许索引(index)和是否跟踪链接(follow,也可以理解为是否允许沿着网页中的超级链接继续抓取)。

content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。

INDEX命令:告诉搜索引擎抓取这个页面

FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。

NOINDEX命令:告诉搜索引擎不允许抓取这个页面

NOFOLLOW命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。

根据以上的命令,我们就有了一下的四种组合

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接

<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接

<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。

这里需要注意的是,不要把两个对立的反义词写到一起,例如

<META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">

此外对于多命令,这里有一个简便的写法,

如果是 <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

的形式的话,可以写成:<META NAME="ROBOTS" CONTENT="ALL">

如果是 <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

的形式的话,可以写成:<META NAME="ROBOTS" CONTENT="NONE">

如果是对于单独的某个搜索引擎不允许建立快照,例如谷歌,我们就可以写成:

<META NAME="Googlebot" CONTENT="INDEX,FOLLOW,noarchive">

如果在元标记中不屑关于蜘蛛的命令,那么默认的命令即为如下

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW, archive">

因此,如果我们对于这一部分把握不准的话,可以直接写上上面的这一行命令,或者是直接留空。

2.禁止搜索引擎建立快照。

<meta name="robots" content="noarchive">

以上的一段代码限制了所有的搜索引擎建立你的网页快照。如果我们需要仅仅限制一个搜索引擎建立快照的话,就可以像如下这样去写

<meta name="Googlebot" content="noarchive">

这样的标记是禁止搜索引擎为你的网站建立快照。


Public @ 2019-11-03 16:08:53

如何解决网址规范化问题

解决网址规范化问题有以下几点方法:1.确保使用的CMS系统只产生规范化网址,无论是否有静态化。2.在Google管理员工具中设置首选域。3.所有内部链接保持统一,都指向规范化网址。4.使用canonical标签。5.使用301转向,把不规范化URL全部转向到规范化URL。6.提交给搜索引擎的XML网站地图中全部使用规范化网址。来源:搜外网

Public @ 2010-02-20 16:11:22

搜索引擎的Robots协议

robots.txt是一种存放于网站根目录下的文本文件,用于告诉搜索引擎的爬虫(spider),此网站中的哪些内容是不应被搜索引擎的索引,哪些是可以被索引。通常认为,robots.txt文件用来搜索引擎对目标网页的抓取。robots.txt协议并不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个文件,但也有一些特殊情况。对于Google来说,使用robots也未必能阻止Google将网址编入索

Public @ 2018-04-08 16:09:21

Nofollow

nofollow 是HTML页面中a标签的属性值。这个标签的意义是告诉搜索引擎"不要追踪此网页上的链接或不要追踪此特定链接"。nofollow是HTML页面中a标签的属性值。它的出现为网站管理员提供了一种方式,即告诉搜索引擎"不要追踪此网页上的链接"或"不要追踪此特定链接"。这个标签的意义是告诉搜索引擎这个链接不是经过作者信任的,所以这个

Public @ 2009-03-10 16:08:53

网站Nofollow标签的应用场景

Nofollow标签的应用场景有以下几种: 1. 防止链接垃圾邮件:网站管理员不希望搜索引擎将链接视为站点权威的一部分,以避免被链接垃圾邮件所滥用。 2. 不推荐的链接:网站管理员认为某个链接不适合站点的主题或内容,但仍然希望保留该链接。 3. 遵守广告政策:网站所承载的广告链接应该包含Nofollow标签。 4. 提高页面权重:对于站外链接,若链接是通过付费广告,或是首页推荐等方式获得的,可以

Public @ 2023-04-23 01:50:14

更多您感兴趣的搜索