Categories


Tags


抓取异常的原因有哪些

一、网站异常

1、dns异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

2、连接超时

抓取请求连接超时,可能原因服务器过载,网络不稳定

3、抓取超时

抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足

4、连接错误

无法连接或者连接建立后对方服务器拒绝

二、链接异常

1、访问被拒绝

爬虫发起抓取,httpcode返回码是403

2、找不到页面

爬虫发起抓取,httpcode返回码是404

3、服务器错误

爬虫发起抓取,httpcode返回码是5XX

4、其他错误

爬虫发起抓取,httpcode返回码是4XX,不包括403和404

来源:百度搜索资源平台 百度搜索学堂


Public @ 2018-09-22 16:02:23

百度搜索资源平台-站点子链工具内测开启

作者:百度站长平台        发布时间:2015年1月23日亲爱的网站管理员,为了能够更好的将优质权威的站点进行展示,给用户提供更直观的搜索结果,百度站长平台新增“站点子链”工具,并同步开启内测。拥有内测权限的站点可以通过该工具向百度提交网站的重要子站点\重要频道页作为子链数据。该工具目前处在内测阶段,后续还会进行功能升级,欢迎大家提交内测反馈。工具亮点

Public @ 2014-08-29 15:34:15

百度站内搜索新推论坛样式 提交数据有捷径

继小说、影视、游戏以及通用四大样式之后,近日百度站内搜索论坛样式盛大开启。百度站内搜索的论坛样式通过提交结构化数据,搜索结果页即可显示帖子的出处、作者、时间、评论和回复数量等标签,区别于先前的通用样式,筛选维度新增按板块筛选功能,更方便用户精准找到所需内容。此次论坛样式的强大功能在于提交数据的更为简单方便,如果网站已使用百度站长平台Discuz!结构化数据插件,那么,仅需轻松两步即可完成结构化数据

Public @ 2012-01-31 16:07:25

结构化数据工具上线公告

尊敬的用户: 感谢您一直以来对我们的支持和关注。我们很高兴地宣布,我们的结构化数据工具已正式上线! 结构化数据工具是一个数据处理平台,帮助用户快速准确地处理大量结构化数据,并在数据处理的过程中提供可视化的反馈,简化和加速您的工作流程。本工具能够处理各种数据源,包括数据库表、CSV文件、JSON文件和Excel文件等,并提供了多种数据处理和转换功能,例如数据清洗、数据格式转换、数据合并等。 结

Public @ 2023-03-28 12:50:26

百度索引量工具数据恢复公告

尊敬的用户: 我们深感抱歉的通知您,百度索引量工具数据恢复工作由于技术问题未能如期完成。原计划于11月30日,针对10月份的索引量展开数据查询与恢复,但在执行过程中发现了系统bug,需要更多时间来修复。 我们已经调派了专业技术团队全力以赴,争取尽快解决问题。同时,我们也会加强对系统的监测和测试工作,确保这样的问题不再出现。 我们知道这次事故给您带来了很多不便和困扰,但请您相信,我们会不遗余力

Public @ 2023-05-31 19:50:22

更多您感兴趣的搜索

0.476501s