常见Robots名字_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

常见Robots名字

名称搜索引擎

google蜘蛛: googlebot

百度蜘蛛:baiduspider

yahoo蜘蛛:slurp

alexa蜘蛛:ia_archiver

msn蜘蛛:msnbot

altavista蜘蛛:scooter

lycos蜘蛛: lycos_spider_(t-rex)

alltheweb蜘蛛: fast-webcrawler/

inktomi蜘蛛: slurp

一个在线写robots.txt的工具。

最后需要注意，robots.txt文件名必须是小写，而且放在网站根目录

来源：360站长平台

Public @ 2013-05-19 16:09:03

Sitemap文件标准格式和大小说明

Sitemap文件标准格式： Sitemap文件通常是一个以XML格式编写的文本文件，其中包含URL信息和其他相关数据。Sitemap文件主要包含以下元素： 1. URL元素：用于指定页面的网址，并包含可选的数据，如最近的修改日期、相对于站点的相对权重等。 2. loc元素：为URL元素的子元素，用于指定页面的网址。 3. lastmod元素：为URL元素的子元素，用于指定页面的最近修改日期。

Public @ 2023-04-29 02:50:12

nofollow标签的作用有重大变化

2019年9月10日，Google官方博客表示，nofollow属性将不再仅代表拒绝传递权重，而将拓展为三种属性：rel="sponsored"、rel="ugc"、rel="nofollow"。 1. rel=”sponsored” 该属性用于标示被广告赞助的链接，例如广告合作，展示商标，赞助商链接等。它是告诉搜索引擎，链接是被广告商赞助，而非独立推荐。 2. rel=”ugc” 该属性

Public @ 2023-04-26 02:50:15

匹配方式分两部分：1.path部分，2.参数部分匹配支持?*$?两种通配符?*? 表示任何有效字符的 0 个或多个个案。?$? 表示网址结束。path部分与google匹配方式保持一致，也就是只有/或是*开头的规则才有机会匹配上?/?匹配根目录以及任何下级网址?/fish??/fish?开头的匹配项* ?/fish?* ?/fish.html?* ?/fish/salmon.html?* ?/fi

Public @ 2011-09-27 16:09:01

robots里这样写，就能避免蜘蛛爬这个“index.htm”这个首页？

威海seo专题威海Robots
1070

要避免搜索引擎蜘蛛爬取某个页面，可以在robots.txt文件中添加如下指令： User-agent: * Disallow: /index.htm 这样，所有搜索引擎蜘蛛都不会爬取网站的index.htm首页页面。注意，这并不代表该页面会从搜索结果中彻底移除，因为即使没有被索引，用户仍然可以在搜索结果中找到该页面。

Public @ 2023-06-09 00:50:07

Categories

Tags