robots.txt：如何让搜索引擎不要抓取没用的页面_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

robots.txt：如何让搜索引擎不要抓取没用的页面

| 什么是robots文件？

Robots是站点与spider沟通的重要渠道，是网站与搜索引擎爬虫之间的协议，告知哪些可抓取哪些不允许。

| 为什么要做robots文件？

网站上总有一些页面是禁止蜘蛛抓取的。例如：搜索页面、筛选页面、后台登录地址等。

| 如何制作 robots文件？

编写robots.txt文件并上传到网站根目录。

| 制作 robots.txt注意事项

● 所有搜索引擎则用星号表示

● Allow（允许）和Disallow（不允许）优先级

● 至少屏蔽一个，可以屏蔽：搜索结果页面/404页面

● 记得将sitemap放到Robots文件中

● 可以陆续放入更多，而不是一次性决定所有

● 网站后台地址/图片地址/下载文件地址/错误链接（搜外网）

Public @ 2019-03-13 16:09:27

什么是meta robots 标签？meta robots 标签的写法

Meta robots标签是一种HTML头部元数据标签，用于指示搜索引擎如何处理指定页面的内容。它告诉网络爬虫如何爬取索引优化。这些标签是在和之间添加的，旨在为“robots（搜索引擎蜘蛛）”提供有关如何索引和缓存页面内容的指令。以下是meta robots标签的写法： - - - - 其中，“content”属性指定一组用逗号分隔的值，可以是以下之一： - index：告诉爬

Public @ 2023-04-05 21:50:30

360搜索对Robots协议的扩展

360搜索对Robots协议进行了扩展，增加了以下几个指令： 1. User-Agent：用于指定搜索引擎访问网站时使用的用户代理字符串，可以设置多个User-Agent。 2. Crawl-delay：用于指定搜索引擎访问网站时的延迟时间，单位为秒。可以设置针对不同的User-Agent的延迟时间。 3. Sitemap：用于指定网站的sitemap文件的地址，搜索引擎将通过该文件获取站点

Public @ 2023-05-29 17:00:21

百度robots中的user-agent

百度各个产品使用不同的user-agent:无线搜索Baiduspider-mobile图片搜索Baiduspider-image视频搜索Baiduspider-video新闻搜索Baiduspider-news百度搜藏Baiduspider-favo百度联盟Baiduspider-cpro商务搜索Baiduspider-ads网页以及其他搜索Baiduspider来源：360站长平台

Public @ 2022-11-11 16:09:02

robots.txt文件放在哪里?

robots.txt文件应该放在网站根目录下。举例来说，当robots访问一个网站时，首先会检查该网站中是否存在这个文件，如果机器人找到这个文件，它就会根据这个文件的内容，来确定它访问权限的范围。

Public @ 2019-06-21 16:09:32

Categories

Tags