Categories


Tags


robots.txt语法教程

用几个最常见的情况,直接举例说明:

1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。

2. 禁止所有SE收录网站的某些目录:

User-agent: *

Disallow: /目录名1/

Disallow: /目录名2/

Disallow: /目录名3/

3. 禁止某个SE收录本站,例如禁止百度:

User-agent: Baiduspider

Disallow: /

4. 禁止所有SE收录本站:

User-agent: *

Disallow: /

5. 加入sitemap.xml路径,例如:

来源:360站长平台


Public @ 2017-12-16 16:09:16

网站URL显示品牌名字怎么弄

要让网站URL显示品牌名字,可以使用以下几种方法: 1. 使用品牌名命名域名,例如: YourBrand.com 2. 在网站标题中使用品牌名字,例如: "Your Brand - Home"。 3. 在URL中使用品牌名字,例如: YourBrand.com/about-us。 4. 在meta标签中使用品牌名字,例如: 。 这些方法可以帮助建立品牌知名度,并让访问者更容易记住和识别品牌。

Public @ 2023-04-15 11:50:12

通过Canonical标签解决重复内容收录

Canonical标签是Google、雅虎、微软等搜索引擎一起推出的一个标签,它的主要作用是用来解决由于网址形式不同内容相同而造成的内容重复问题。这个标签对搜索引擎作用非常大,以前网站上的url不同会被搜索引擎认为是重复内容,利用该标签可以指定权威的某个链接,避免重复内容收录。百度也已支持Canonical标签。为了避免重复内容的收录,搜索引擎会通过算法对网页内容及链接进行识别,对内容完全相同或者

Public @ 2022-03-18 16:11:18

robots.txt文件有什么必要?

robots.txt文件是一个文本文件,用于向搜索引擎和其他机器人网站爬虫指定哪些页面或内容可以被爬取,哪些页面或内容不能被爬取。它的主要作用是为了控制搜索引擎和其他机器人网站爬虫访问和抓取网站内容,保护网站的隐私和安全。如果一个网站不想被某些搜索引擎或爬虫访问、爬取和索引,就可以通过robots.txt文件来禁止它们。另外,robots.txt文件还可以防止一些机器人抓取出现线上攻击或滥用等安全

Public @ 2023-06-12 20:00:21

百度搜索robots协议全新升级公告

尊敬的用户: 为了更好地保护网站主的合法权益、提升百度搜索用户搜索体验,百度搜索于2020年10月27日发布了新版robots协议,主要特性包括: 1. 支持抓取控制与数据保护视角的并存 新增规定了两个特殊的抓取指令: allow-if-previously-blocked 和 noindex-if-previously-indexed,用于方便网站主在控制抓取行为的同时,保护网站内容的安全

Public @ 2023-06-20 23:50:22

更多您感兴趣的搜索

0.456686s