Categories


Tags


360搜索对Robots协议的扩展

  360搜索对Robots协议的扩展

整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容及代码片段有且仅有借鉴意义。

  360搜索对Robots协议进行了扩展,增加了以下几个指令:

1. User-Agent:用于指定搜索引擎访问网站时使用的用户代理字符串,可以设置多个User-Agent。

2. Crawl-delay:用于指定搜索引擎访问网站时的延迟时间,单位为秒。可以设置针对不同的User-Agent的延迟时间。

3. Sitemap:用于指定网站的sitemap文件的地址,搜索引擎将通过该文件获取站点的所有URL。

4. Host:用于指定网站的主机名,可以避免因为DNS变化导致搜索引擎爬虫无法访问网站。

5. Clean-param:用于指定需要从URL中移除的参数,搜索引擎在访问网站时会忽略URL中包含的这些参数。

6. Noindex-nofollow:用于指定不需要被搜索引擎收录或链接的页面。

这些指令的使用可以让网站管理员更加灵活地控制搜索引擎爬虫的访问行为,以达到更好的SEO效果。

Public @ 2023-05-29 17:00:02 整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容有且仅有借鉴意义。

robots.txt文件的格式

User-agent: [robot名稱] Disallow: [禁止存取的目錄或檔案] Allow: [允許存取的目錄或檔案] Sitemap: [網站地圖檔案位置] 注意事項: - User-agent:要設定的是區分搜索引擎的機器人,可設定多個。若不加此欄位,則視為通用設定。 - Disallow:機器人不可存取的目錄或檔案,在此設定時,要注意目錄名稱或檔案名稱是完整的,不

Public @ 2023-06-17 03:50:39

什么是链接结构

网站结构的第二意义指的是链接结构,或称为逻辑结构,也就是网站内部链接形成的链接的网络图。比较合理的链接结构通常是树形结构。当然,对于搜索引擎来说更重要的是链接结构,而不是物理结构。不少人有误解,认为物理结构比较深的页面不容易被搜索引擎收录,比如说:http://www.seowhy.com/cat1/cat1-1-1/pageA.html如果这个页面在网站首页上有一个链接,对搜索引擎来说它就是一个

Public @ 2009-11-25 16:11:35

什么是meta robots 标签?meta robots 标签的写法

网站上有些页面不希望被搜索引擎收录,我们可以使用robots的文件或者meta robots 标签。什么是meta robots 标签?meta robots 标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引(收录)本页内容。meta robots 标签的写法:<meta name=”robots”content=”noindex,nofollow”>标签的意义:禁止

Public @ 2012-07-08 16:09:26

更多您感兴趣的搜索

0.482169s