Categories


Tags


robots.txt语法教程

用几个最常见的情况,直接举例说明:

1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。

2. 禁止所有SE收录网站的某些目录:

User-agent: *

Disallow: /目录名1/

Disallow: /目录名2/

Disallow: /目录名3/

3. 禁止某个SE收录本站,例如禁止百度:

User-agent: Baiduspider

Disallow: /

4. 禁止所有SE收录本站:

User-agent: *

Disallow: /

5. 加入sitemap.xml路径,例如:

来源:360站长平台


Public @ 2017-12-16 16:09:16

相对路径的优点和缺点

相对路径的优点是:1.节省代码。2.移动内容比较容易,不用更新其他页面上的链接。3.在测试服务器上进行测试也比较容易。相对路径的缺点是:1.页面移动位置,里面链接可能需要改动。2.被抄袭和采集对网站没有任何益处。很多采集软件其实是可以自动鉴别绝对路径和相对路径的,所以使用绝对路径有助于自己的链接也被抄袭到采集网站上,只在某些情况下有效。3.搜索引擎解析URL时可能出错,不能正确读取页面上的链接UR

Public @ 2022-10-28 16:11:47

百度搜索robots协议全新升级公告

尊敬的用户: 为了更好地保护您的隐私和内容权益,百度搜索已经全新升级了robots协议。该协议将更加严格地限制搜索引擎爬取您的网站内容,以保障您的权益。 更新后的robots协议针对以下内容进行了调整: 1.增加禁止搜索引擎爬取的网页类型,如登录页、支付页、个人信息页等。 2.增加网站所有者对搜索引擎爬取的细节设置,包括最大爬取频率、爬取深度、爬取延时等。 3.优化 robots.txt

Public @ 2023-04-17 05:00:13

玩转robots协议

2013年2月8日北京市第一中级人民法院正式受理了百度诉奇虎360违反“Robots协议”抓取、复制其网站内容的不正当竞争行为一案,索赔金额高达一亿元,这可以看做2012年下半年“3B大战”的继续。在此次索赔案件中,百度称自己的Robots文本中已设定不允许360爬虫进入,而360的爬虫依然对“百度知道”、“百度百科”等百度网站内容进行抓取。其实早在2012年11月初,针对双方摩擦加剧的情况,在中

Public @ 2019-05-13 16:09:21

更多您感兴趣的搜索

0.443374s