如何让 sogou spider 不抓我的网站_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

如何让 sogou spider 不抓我的网站

威海Spider 威海sogou spider
2580

sogou spider 支持 robots 协议，您可以在网站的根目录放置 robots.txt。

robots.txt 的规则请参阅 http://www.robotstxt.org/。需要注意的是，最新更新的 robots.txt 可能需要几个星期才能体现出效果来，另外，被您禁止 sogou spider 收录的网页将不能在搜狗搜索引擎上检索到。

Public @ 2011-12-05 15:38:56

1、网站和页面权重。质量高，资格老的网站被认为权重比较高，这种网站上的页面被爬行的深度也会比较高，所以会更多内页被收录。2、与首页点击距离。一般来说网站上权重最高的是首页，大部分外部链接是指向首页的，蜘蛛访问最频繁的也是首页。离首页点击距离近，页面权重越高，被蜘蛛爬行的机会也越大。3、导入链接。无论是外部链接还是同一个网站的内部链接，要被蜘蛛抓取，就必须有导入链接进入页面，否则蜘蛛根本没有机会知道

Public @ 2017-12-02 16:22:35

搜狗资源平台-抓取压力查询功能说明：

威海Spider 威海sogou spider
3466

sogou spider对于同一个IP地址的服务器主机，只建立一个连接，抓取间隔速度控制在几秒一次。一个网页被收录后，最快也要几天以后才会去更新。如果sogou spider持续不断地抓取您的网站，请注意您的网站上的网页是否每次访问都产生新的链接。

Public @ 2015-06-24 15:38:54

为什么我的网站已经加了robots.txt，还能在搜狗搜索出来

威海Spider 威海sogou spider
2450

因为搜索引擎索引数据库的更新需要时间。虽然sogou spider已经停止访问您网站上的网页，但搜狗搜索引擎数据库中已经建立的网页索引信息，可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。如果您的拒绝被收录需求非常急迫，也可以通过删除快照反馈请求处理。

Public @ 2018-01-11 15:38:56