Categories


Tags


【院长帮帮忙】页面无用时间信息导致网页不被爬虫抓取(第一期)

在【院长帮帮忙】栏目露过面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2015-07-21 15:22:04

360搜索蜘蛛IP段及蜘蛛ip被拦截的问题解决方法

360搜索蜘蛛的IP段有很多,不同的版本可能会有不同的IP段。一般来说,以下几个IP段是比较常见的: - 180.76.0.0/16 - 220.181.0.0/16 - 119.63.192.0/21 - 101.226.0.0/15 如果您想限制360搜索蜘蛛的访问,可以通过防火墙或CMS插件进行IP屏蔽。具体方法如下: 1. 防火墙:在防火墙设置中添加规则,拒绝360搜索蜘蛛的IP段访

Public @ 2023-03-30 06:50:24

【院长帮帮忙】移动适配不稳定、不生效,可能是这些原因造成的!(第五期)

1. 布局使用了绝对定位 如果布局使用了绝对定位,那么在不同的设备上,元素的位置和大小会发生变化,从而导致移动适配不稳定或者根本无法生效。建议使用相对定位或者flex布局。 2. 使用了固定宽度和高度 在移动适配时,应该使用相对单位(如rem或者百分比),而不是固定宽度和高度。如果使用了固定宽度和高度,那么在不同的设备上,元素的大小会发生变化,从而导致移动适配不稳定。 3. 没有考虑不同的

Public @ 2023-06-24 11:50:16

【院长帮帮忙】移动适配不稳定、不生效,可能是这些原因造成的!(第五期)

1. 平台兼容性问题:不同移动设备或操作系统的适配方式可能不同,需要适配的平台越多,问题也就越多。解决方案是在开发前进行充分的市场调研和测试,确保在主流平台上的适配稳定生效。 2. 分辨率适配问题:不同移动设备的屏幕分辨率不同,可能导致界面显示异常或排版错乱。解决方案是通过媒体查询、百分比布局等技术手段,使页面能够根据不同分辨率自动适配。 3. 浏览器兼容性问题:不同浏览器对于HTML、CSS

Public @ 2023-07-27 10:00:35

更多您感兴趣的搜索