Categories


Tags


常见Robots名字

名称 搜索引擎

google蜘蛛: googlebot

百度蜘蛛:baiduspider

yahoo蜘蛛:slurp

alexa蜘蛛:ia_archiver

msn蜘蛛:msnbot

altavista蜘蛛:scooter

lycos蜘蛛: lycos_spider_(t-rex)

alltheweb蜘蛛: fast-webcrawler/

inktomi蜘蛛: slurp

一个在线写robots.txt的工具。

最后需要注意,robots.txt文件名必须是小写,而且放在网站根目录

来源:360站长平台


Public @ 2013-05-19 16:09:03

Sitemap协议类型及包含范围

Sitemap协议是一种用于向搜索引擎提供网站结构信息的标准协议。其包含的内容包括网站中所有页面的URL、页面最后更新时间、页面更新频率等信息。 目前,Sitemap协议一共有以下两种类型: 1. XML Sitemap:用于描述网站的全部网页,包括网页的URL、标识、访问频率、权重等信息。XML Sitemap可以包含多个XML文件,但每个XML文件的大小不能超过50MB。 2. HTML

Public @ 2023-04-18 11:50:23

百度搜索robots协议全新升级公告

尊敬的用户: 为了更好地保护您的隐私和内容权益,百度搜索已经全新升级了robots协议。该协议将更加严格地限制搜索引擎爬取您的网站内容,以保障您的权益。 更新后的robots协议针对以下内容进行了调整: 1.增加禁止搜索引擎爬取的网页类型,如登录页、支付页、个人信息页等。 2.增加网站所有者对搜索引擎爬取的细节设置,包括最大爬取频率、爬取深度、爬取延时等。 3.优化 robots.txt

Public @ 2023-04-17 05:00:13

robots.txt使用教程

用几个最常见的情况,直接举例说明:1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。2. 禁止所有SE收录网站的某些目录:User-agent: *Disallow: /目录名1/Disallow: /目录名2/Disallow: /目录名3/3. 禁止某个SE收录本站,例如禁止百度:User-agent: BaiduspiderDisallow: /4. 禁止所有SE收录

Public @ 2013-01-15 16:09:31

更多您感兴趣的搜索

0.398451s