Categories


Tags


百度搜索引擎网页质量白皮书-互联网网页资源现状

互联网网页资源现状

CNNIC2014年年初发布的《中国互联网络发展状况统计报告》中称:截至2013年12月,中国网页数据为1500亿,相比2012年同期增长了22.2%。2013年中国单个网站的平均网页数和单个网页的平均字节数均维持增长,显示出中国互联网上的内容更为丰富:平均网站的网页数达到4.69万个,较去年同期增长2.3%。

为了保证搜索质量、提高用户使用满意度,百度搜索引擎每周都会进行网页质量抽样评估。然而从近一年的评估数据中我们发现,优质网页的绝对数量非常少,且几乎没有增长;普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。截至2014年5月,统计数据显示,在百度网页搜索发现的海量网页中,优质网页仅占7.4%,质差网页高达21%,其余普通网页为71.6%。

百度网页搜索通过一系列筛选、识别、分析、赋权等工作,努力将更多优质网页呈现在用户面前,每天约打击上万质量差网站,涉及网页达百万量级,尽可能减少质量差网页给用户带来的干扰。从下图2014年5月的网页展现分析数据显示,目前展现在用户面前的网页质量分布中,优质网页占比为40%,质量差网页降为11%——虽然这个变化已经非常明显,但百度网页搜索还是希望能和广大站长一起努力,将质量差占比降到更低。

互联网全部网页

在百度搜索得到展现的网页

优质网页

7.4%

41%

普通网页

71.6%

49%

质量差网页

21%

11%

上述质量差网页包括低质网页和垃圾网页两部分,低质网页问题分布如下图所示:

从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质网页的重要组成部分。

质量差网页中除了低质网页外,无任何质量可言的垃圾页面的问题分布如下图所示:

从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质网页的重要组成部分。

质量差网页中除了低质网页外,无任何质量可言的垃圾页面的问题分布如下图所示:

死链对用户、网站和搜索引擎来说都已没有存在的意义,垃圾网页中占比最大。其次是对用户和搜索引擎伤害巨大的作弊网页,资源无效、有问无答和不相关搜索结果页这些极大浪费用户时间的网页也是搜索引擎不希望呈现给用户的。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2009-08-14 16:20:38

百度搜索问答内容质量标准-问答内容质量标准:页面体验要求

1. 内容要求清晰准确,避免模糊、含糊、重复或拼写错误; 2. 回答必须与问题相关,不得离题、跑题或引起歧义; 3. 回答要言简意赅,尽可能避免冗长、累赘或困难; 4. 不得包含不适当或不恰当的语言、图片或链接; 5. 回答必须可读性强,排版清晰、分段合理; 6. 回答中必须有充足的信息量和详细的解释或证明; 7. 不得含有虚假、欺骗性或误导性的内容; 8. 不得用刻意操作或投票等方式人为提高回答

Public @ 2023-06-10 07:00:11

百度搜索基础信息设置规范

最新更新章节:2022-06-17百度搜索会基于网站和小程序的设置,提取对搜索用户有价值的信息展现在搜索结果页。为了帮助广大开发者在搜索结果中得到更好地展现效果,为搜索用户提供更为有效的页面信息,特发布《百度搜索基础信息设置规范》。来源:百度搜索资源平台

Public @ 2009-03-11 15:22:25

百度搜索引擎网页质量白皮书

最新更新章节:2019-09-18网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否权威专业等因素,共同决定着网页质量的高低。来源:百度搜索资源平台 百度搜索学堂

Public @ 2021-12-15 16:20:40

百度搜索引擎网页质量白皮书-衡量网页质量的维度

百度搜索引擎网页质量白皮书中衡量网页质量的维度主要包括以下几个方面: 1. 内容质量:网页的内容是否准确、完整、详细、有价值,并且能够满足用户的需求。这包括内容的专业性、权威性、独特性等。 2. 用户体验:网页的设计是否简洁清晰、布局合理、易于导航和使用,是否具有良好的用户交互性,以及是否能够提供良好的用户体验。 3. 页面加载速度:网页加载速度是否较快,是否能够在短时间内加载完成,避免用户

Public @ 2023-07-30 09:00:22

更多您感兴趣的搜索

0.415707s