Categories


Tags


如何正确识别Baiduspider移动ua

百度站长平台发布公告宣布新版Baiduspider移动ua上线,同时公布了PC版Baiduspider UA,那么该如何正确识别移动UA呢?我们百度站长平台技术专家孙权老师给出了答案:

新版移动UA:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

PC UA:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

之前通过“+http://www.baidu.com/search/spider.html”进行识别的网站请注意!您需要修改识别方式,新的正确的识别Baiduspider移动ua的方法如下:

1. 通过关键词“Android”或者“Mobile”来进行识别,判断为移动访问或者抓取。

2. 通过关键词“Baiduspider/2.0”,判断为百度爬虫。

另外需要强调的是,对于robots封禁,如果封禁的agent是Baiduspider,会对PC和移动同时生效。即,无论是PC还是移动Baiduspider,都不会对封禁对象进行抓取。之所以要强调这一点,是发现有些代码适配站点(同一个url,PC ua打开的时候是PC页,移动ua打开的时候是移动页),想通过设置robots的agent封禁达到只让移动Baiduspider抓取的目的,但由于PC和移动Baiduspider的agent都是Baiduspider,这种方法是非常不可取的。

更多相关问题讨论,欢迎移步【学堂同学汇】《如何正确识别Baiduspider移动ua》讨论帖

来源:百度搜索资源平台 百度搜索学堂


Public @ 2010-04-10 15:38:45

蜘蛛程序(spider)

蜘蛛程序(spider)是一种自动化的网络爬虫,也称为网络蜘蛛、网络机器人、网络爬虫等。蜘蛛程序通过搜索引擎的搜索引擎结果页面自动地爬取网络上的信息,并将爬取的数据保存在数据库中。 蜘蛛程序通常会根据特定的算法和规则,自动地遍历网页,将网页上的内容、链接、图片等数据提取出来,然后整理、分类、存储和建立索引,使得用户能够更方便地获取网络信息。蜘蛛程序也可以通过采用机器学习和自然语言处理等技术,不断

Public @ 2023-06-20 06:50:23

360搜索蜘蛛IP段及蜘蛛ip被拦截的问题解决方法

360搜索蜘蛛的IP段有很多,不同的版本可能会有不同的IP段。一般来说,以下几个IP段是比较常见的: - 180.76.0.0/16 - 220.181.0.0/16 - 119.63.192.0/21 - 101.226.0.0/15 如果您想限制360搜索蜘蛛的访问,可以通过防火墙或CMS插件进行IP屏蔽。具体方法如下: 1. 防火墙:在防火墙设置中添加规则,拒绝360搜索蜘蛛的IP段访

Public @ 2023-03-30 06:50:24

“百度蜘蛛”全面解析

铛铛铛铛!好久不见,平小雕带着最新一期搜索问答剧场又双叒回来啦!第五集【搜索问答剧场】,为大家带来“百度蜘蛛”的全面解析,帮助大家清楚的了解“百度蜘蛛”在各种场景发挥的作用,为网站整体运营打下基础。【抓取篇】1、什么是Baiduspider?A:Baiduspider也叫百度蜘蛛,是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到网站相关内容

Public @ 2013-05-26 15:38:35

开发者如何解除封禁百度蜘蛛

近期收到一些开发者反馈,为什么网站或智能小程序资源的内容非常优质,但是没有查询到百度蜘蛛抓取记录,或在百度搜索中没有得到收录和展现?在技术分析后发现,有些网站或智能小程序存在封禁百度蜘蛛的情况,导致百度蜘蛛无法正常抓取,所以无法在百度搜索中正常收录和展现,或在搜索结果中的摘要展现为“存在robots封禁”字样。为了让广大开发者的网站或小程序,在百度搜索中得到正常的收录和展现,建议开发者及时根据以下

Public @ 2011-02-07 15:38:37

更多您感兴趣的搜索

0.412263s