Categories


Tags


什么是meta robots 标签?meta robots 标签的写法

网站上有些页面不希望被搜索引擎收录,我们可以使用robots的文件或者meta robots 标签。

什么是meta robots 标签?

meta robots 标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引(收录)本页内容。

meta robots 标签的写法:

<meta name=”robots”content=”noindex,nofollow”>

标签的意义:禁止所有搜索引擎索引本页面,禁止跟踪本页面上的链接。

Noindex:搜索引擎不索引此网页(可以抓取,但不出现在搜索结果中)。

Nofollow: 搜索引擎不继续通过此网页的链接索引搜索其它的网页。

<meta name>=”robots”content=”noindex” >

标签的意义:禁止索引本页面,但允许蜘蛛跟踪页面上的链接,也可以传递权重。

使用了noindex meta robots标签的页面会被抓取,但不会被索引,也就是说页面URL不会出现在搜索结果中,这一点与robots文件不同。

meta robots 标签的作用:

1、不想让网站被收录使用meta robots 标签,禁止搜索引擎索引本页,同时禁止跟踪页面上的链接。

2、禁止索引本页面,但是允许蜘蛛跟踪页面链接,也可以传递权重。

meta robots标签很多搜索引擎是不支持的,只有少数搜索引擎能够识别并按给定的值抓取。因此还是推荐用robots.txt文件来限制抓取,大家了解有关meta robots 标签知识以及写法。

来源:搜外网


Public @ 2012-07-08 16:09:26

URL的优化

URL的优化可以通过以下几方面来实现: 1. 简洁明了:URL应该尽量简短,清晰地描述页面的内容。避免使用过长的URL,可使用关键词来描述页面的主题。 2. 使用关键词:在URL中使用关键词可以帮助搜索引擎更好地理解页面的内容。关键词应该与页面的主题相关,但不要过度堆砌关键词。 3. 使用连字符:在URL中使用连字符(-)来分割单词,而不要使用下划线或者空格。连字符可以提高URL的可读性,同

Public @ 2023-07-29 06:00:22

robots.txt文件的格式

robots.txt文件的格式为: User-agent: [user-agent-name] Disallow: [URL path] 其中,[user-agent-name]指代搜索引擎爬虫的名称,[URL path]指代禁止访问的URL路径。在文件中可以定义多条User-agent和Disallow规则,每一条规则占一行,每一对规则之间要有一个空行。示例: User-agent: *

Public @ 2023-05-28 01:50:08

禁止搜索引擎收录的方法

禁止搜索引擎收录的方法什么是robots.txt文件?搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分

Public @ 2016-10-21 16:09:20

360搜索对Robots协议的支持

360搜索支持Robots协议的主要命令,以下为具体说明:1. user-agent360搜索各产品的爬虫user-agent为:- 网页搜索 360Spider- 图片搜索 360Spider-Image- 视频搜索 360Spider-Video2. Allow站长可通过Allow命令指定建议收录的文件、目录 。3. Disallow站长可通过Disallow命令指定不建议收录的文件、目录。

Public @ 2019-06-30 16:09:34

更多您感兴趣的搜索

0.442970s