如何让 sogou spider 不抓我的网站_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

如何让 sogou spider 不抓我的网站

威海Spider 威海sogou spider
1928

sogou spider 支持 robots 协议，您可以在网站的根目录放置 robots.txt。

robots.txt 的规则请参阅 http://www.robotstxt.org/。需要注意的是，最新更新的 robots.txt 可能需要几个星期才能体现出效果来，另外，被您禁止 sogou spider 收录的网页将不能在搜狗搜索引擎上检索到。

Public @ 2011-12-05 15:38:56

BaiDuSpider百度蜘蛛占用流量,robots.txt设置

威海Spider 威海Baiduspider
2880

在网站根目录下的 robots.txt 文件可以用来告诉搜索引擎蜘蛛（包括百度蜘蛛）哪些页面可以访问，哪些页面不可访问。通过设置 robots.txt 文件，可以控制蜘蛛的爬取范围，减少不必要的流量消耗。以下是一个提供给百度蜘蛛的 robots.txt 示例： ``` User-agent: Baiduspider Disallow: /path/to/disallowed/page.htm

Public @ 2023-07-28 12:00:44

8月份百度Spider升级了对HTTPS数据的抓取力度，HTTPS数据将更快被Spider抓取到。如网站还在做HTTPS的改造，且网站数据未搭建好，建议网站采取以下措施，避免Spider抓取，以免造成网站流量损失1、把HTTPS的协议封掉，可把443端口关掉；2、做HTTPS到http的301；3、建议站点在改HTTPS没改造好之前，不要提供超链接指向，以免被Spider抓到HTTPS。4、针对一

Public @ 2011-03-28 15:38:47

我希望我的网站内容被搜狗索引但不被保存快照，我该怎么做？

威海Spider 威海sogou spider
2951

sogou spider遵守互联网meta robots协议。您可以利用网页meta的设置，使搜狗显示只对该网页建索引，但并不在搜索结果中显示该网页的快照。和robots的更新一样，因为搜索引擎索引数据库的更新需要时间，虽然您已经在网页中通过meta禁止了搜狗在搜索结果中显示该网页的快照，但搜狗搜索引擎数据库中如果已经建立了网页索引信息，可能需要二至四周才会在线上生效。

Public @ 2019-12-28 15:38:55