Categories


Tags


一站式解决网站死链问题

在网站日常运营,死链是难免会产生的,不仅影响了用户体验,也影响了搜索效果;针对这一现象,我们邀请了站长社区版主—三木为大家分享死链处理心得。

本文主要讲述死链对网站的影响;死链是如何产生的;如何发现死链;如何正确处理死链。

一、大量死链对搜索引擎来讲,有什么影响?

1、死链率过高,会影响搜索引擎对网站的评分。

2、搜索引擎对每个网站每天抓取的频次是限额的,若网站存在大量死链,会浪费掉抓取配额并影响其他正常页面的抓取。

3、过多死链对网站用户来讲也是体验不好的表现。

二、死链接是如何产生的?

1、网站内部添加了错误的内部链接

编辑失误或者程序员大意让页面产生了不存在的页面。

2、网站短暂无法访问

因为服务器、空间或程序问题导致网站短暂无法访问,产生大量返回码为5开头的服务器错误页面。

3、外部链接错误

用户或者站长在站外发布了错误URL;别的网站复制或采集了你们含有错误链接的页面。

4、爬虫提取了不完整的URL

个别爬虫在提取页面URL的时候,因为URL中有不规则字符或者URL与后边的文字链接起来,导致URL失效。

5、网站改版

如果你的网站已经改版或者将要改版,一定要注意死链问题,很多网站改版后,之前的老页面直接删除,导致了大量的死链接。

6、管理员删除页面

网站管理员删除被黑、广告、过时、被灌水页面导致很多死链接。

三、如何发现网站中存在的死链接?

1、百度站长工具中的抓取异常工具可以查看最近一个月产生的各种死链,并支持导出功能。

2、使用相关爬虫软件,比如Xenu,此类工具可以爬取全站所有链接并分析页面状态,分析完成后,支持导出功能,提取死链接即可。

3、在网站运营中,特别是论坛,经常需要删除某些页面,在删除页面时一定要记录对应的Url以便后期提交死链。

通过上述两种办法提取的死链列表,一定要经过删重和验证,比如用wps表格进行删除重复链接,然后再使用Http状态批量查询工具验证下是否确实是死链接。

四、如何避免和处理死链接?

1、网站改版最容易产生死链的

改版之前的页面如果有价值尽量不要删除和修改Url,若需要更换域名或Url分配规则,那一定要将之前的url进行301跳转到对应的Url;若老的数据必须删除,那删除的所有页面Url要进行整理和提交死链。

2、对发现的死链接如何处理

将收集好的所有死链接粘贴到网站根目录的一个文档中,再把文档地址提交到百度资源平台-搜索服务-资源提交-死链提交--添加新数据--填写死链文件地址;若大量死链具有一定的规则,如某个目录下全部为死链接,可提交规则死链。

相关注意事项:

1、在百度站长工具中提交死链前,一定要确保提交的死链数据不存在活链接。一旦存在活链,会显示提交失败导致无法删除。

2、由于很多网站程序问题,很多打不开的页面返回码并非404,这是一个大问题,比如明明是打不开的页面返回码是301、200、500,如果是200的话,会导致网站中出现不同URL获取相同内容。比如我的一个站,社区的帖子删除后,返回码却是500,后期发现了,立马进行了处理。大家尽量找出所有错误URL格式,并设置HTTP状态码为404。

3、把所有的错误页面找到后,一定要寻找此类页面URL相同特征,并且和正常页面的特征有区分,写对应规则到robots文件中,禁止蜘蛛抓取,就算你已经在站长工具中提交了死链,也建议robots封禁抓取。

4、robots只能解决蜘蛛不再抓取此类页面,但解决不了已经收录页面的快照删除问题,若你的网站被黑,删除了被黑页面,除了robots封禁被黑页面外,还应该将这些页面提交死链。提交死链是删除被黑页面快照的最快办法。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-05-03 15:36:54

站点流量异常追查文档-先普及一个概念:什么是流量异常

流量异常是指网站流量突然明显减少或增多,这种异常被认为可能会损害网站可用性,或者由于某种原因导致网站上的流量发生明显变化。 有时会发生流量异常,这常常是由于网站中出现了某些未经检查的内容,或者采用了某些不合理的宣传策略,导致网站的广告位上出现大量的垃圾流量。此外,一些恶意的竞争对手可能会通过编写一些脚本来模拟正常流量分析,从而造成一些流量异常情况。 在检查网站流量异常时,首先需要找出异常量

Public @ 2023-02-24 06:12:26

【分享】如何发现网站被黑,怎么解决被黑问题

【名词解释】网站被黑即网站被黑客攻击,是指黑客利用网站的安全漏洞或管理员安全疏忽等,未经管理员授权,对网站进行了篡改或者向网站注入恶意代码等。【表现形式】分别从站点本身和搜索引擎两个角度来讲:从站点本身来说:1、站点的流量会突然暴增或者断崖式下跌,一般前者较多;2、从服务器来看,可以看到明显的文件或代码被篡改的痕迹,如突然多出一个文件夹或者目录,或者页面文件;3、如果网站被黑,安装了监控软件的站点

Public @ 2022-01-14 15:37:29

百度搜索建议的死链设置方案

第一步,将返回码设置为404或者410:如果站点/小程序已永久删除相应内容,并且不打算对内容进行替换,建议开发者将返回码设置成404或410,百度爬虫尝试抓取网页时,如果返回码为404或410,会将URL判定为死链,进而从搜索中删除第二步,设置完返回码后,修改页面标题,明确表示该页面为死链,页面内容可以进行个性化设置。对百度搜索不友好的死链类型及不推荐的死链方案:1、个性化死链部分开发者追求个性化

Public @ 2013-12-22 15:36:55

如何使用死链工具

第一步,处理网站已存在的死链,制作死链文件筛查网站内部存在的死链,并将这些死链页面设置成为404页面,即百度访问它们时返回404代码。将需提交的死链列表制作成一个死链文件,制作方法请参阅帮助文档:http://www.baidu.com/search/sitemap_help.html(与sitemap格式及制作方法一致)第二步,将死链文件放置在网站根目录下比如您的网站为example.com,您

Public @ 2009-05-24 15:36:49

更多您感兴趣的搜索

0.566038s