Categories


Tags


百度搜索算法规范详解-4.搜索公正及用户安全

4.1 惊雷算法2.0 ——针对恶意刷点击问题

为了保证搜索用户体验,促进搜索生态良性发展,2017年11月,百度搜索发布惊雷算法,严厉打击刷网站点击的作弊行为。2018年5月,惊雷算法升级至2.0版本。

当前,惊雷算法2.0主要针对“恶意制造作弊超链”和“恶意刷点击”的作弊行为。针对作弊的网站,将会受到限制搜索展现、清洗作弊链接、清洗点击的处理,并会将站点作弊行为计入站点历史,严重者将永久封禁。

关于惊雷算法2.0的更多信息请参考:

2017.11.20 百度搜索推出惊雷算法 严厉打击刷点击作弊行为

2018.5.23 百度搜索将推出惊雷算法2.0

4.2 烽火算法3.0

一直以来,百度搜索对于危害用户隐私、恶意劫持站点的行为态度坚定,一经发现一律严惩。2017年2月,百度搜索发出针对恶意劫持行为的公告:《打击劫持 百度移动搜索推出烽火计划》,严惩恶意劫持的行为。2018年5月,百度搜索上线烽火算法2.0,严惩“窃取用户数据”和“恶意劫持”的行为。2019年3月,烽火算法升级至3.0版本。

烽火算法打击的网站劫持有以下两种表现形式:

跳转劫持:用户点击目标网页后,页面直接跳转至另一页面;

后退劫持:用户完成对某网页的浏览,点击“后退”按钮时出现以下几种情况

(1)无法后退,点击后退时页面无反应,内容无变化;

(2)后退到“假百度页面”,搜索结果出现霸屏现象;

(3)后退到用户之前没有访问过的垃圾、作弊等低质网页。

为了能够更好的执行烽火算法,规定算法观察期如下:

1.站点首次被烽火算法覆盖,百度会通过站内信等方式发出站点问题说明及整改期限要求,未在规定时间内完成整改,将会限制站点在搜索结果中的展现,减少对用户的伤害。站点整改之后,经过算法观察期才可解除搜索展现的限制。

解除限制展现的申请条件:按照要求完成所有劫持问题的整改。

算法观察期:一个月

2.第二次发现站点存在劫持问题,百度将限制搜索结果展现,并同步通知到站点。

解除限制展现的申请条件:按照要求完成所有劫持问题的整改。

算法观察期:三个月

3.第三次及以上发现站点存在劫持问题,永久限制站点展现。

关于烽火算法2.0的更多信息请参考:

2019.3.14 百度烽火算法升级,持续打击网络劫持问题

2018.5.17 严厉打击恶意劫持 百度移动搜索推出烽火算法2.0

2018.2.5 HTTPS改造全解析

2017.2.23 打击劫持 百度移动搜索推出烽火计划

4.3 被黑相关——针对被黑问题

2018年3月,为了保证搜索生态安全,保障用户权益,百度搜索发布《网站被黑操作指南》,引导站点排查被黑情况。

网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面。

以下是几种网站被黑后可能出现的页面:

● 内容非网站发布,内容中含大量博彩网站指向:

● 网站页面直接跳转到博彩网站:

网站被黑表明网站安全存在严重问题或漏洞。

如何防范网站被黑,请参考以下内容:

首先,自查站点是否被黑

1.通过百度搜索资源平台的“网站体检工具”,可以对网站各项指标进行安全检测,排查网站的安全隐患。

2.被黑网站在数据上有一个特点,即索引量和从搜索引擎带来的流量在短时间内数据异常。所以,站长可以利用百度搜索资源平台的索引量工具,观察站点索引量是否有异常;如果发现数据异常,再通过流量与关键词工具查看获得流量的关键词是否与网站有关、是否涉及博彩和色情;

3.通过Site语法查询站点,结合一些常见的色情、博彩类关键词效果更佳,有可能发现不属于站点的非法页面;

4.由于百度流量巨大,有些被黑行为仅针对百度带来的流量予以跳转,站长很难发现,所以在查看自己站点是否被黑时,一定要从百度搜索结果中点击站点页面,查看是否跳转到了其他站点;

5.站点内容在百度搜索结果中被提示存在风险;

6.后续可以请网站技术人员通过后台数据和程序进一步确认网站是否被黑。

其次,被黑之后如何处理

确认网站被黑后,网站运营人员除了要推动技术人员快速修正外,还需要做一些善后和预防的工作;

1.清理已发现的被黑内容,将被黑页面设置为404死链,并通过百度搜索资源平台的死链提交工具进行提交(我们发现有些站点采用了将被黑页面跳转至首页的做法,非常不可取);

2.网站如有变更页面,建议使用链接提交工具向百度提交变更页面数据;

3.立即停止网站服务,避免用户继续受影响以及影响其他站点;

4.排查出可能的被黑时间,和服务器上的文件修改时间相比对,处理掉黑客上传、修改过的文件;除此之外,技术人员还需要检查服务器中的用户管理设置,确认是否存在异常的变化。注:可以从访问日志中,确定可能的被黑时间。不过黑客可能也修改服务器的访问日志。

5.更改服务器的用户访问密码。

6.做好安全工作,排查网站存在的漏洞,防止再次被黑。

最后,给大家一些网站自我防护的建议:

1.多种安全防护同步进行:适合中小型资讯网站

网站程序勤打补丁:现在很多资讯类网站用的系统使用了内容管理系统(CMS),作为比较常见的内容管理系统(CMS),有一个问题,那就是漏洞比较大众化,因为源码是公开的,所以很容易被研究出漏洞,需要对网站程序及时进行漏洞修复。

2.对服务器进行常规的安全防护

(1)在上班时间之外,对服务器上的网站权限做设置,禁止文件修改,后台文件隐藏或迁移到根目录之外。

(2)参考一些网站的安全设置,非限定的IP不能写入到数据库。

3.不使用开源程序默认的robots文件

下图是一个地级市的资讯类站点的robots文件,从robots文件中可以看出,该网站用的是织梦后台,那黑客就可以通过各种针对织梦攻击的软件进行操作,也可以针对织梦网站的常见漏洞进行扫描和针对性攻击。

4.进行HTTPS改造,强化网站安全

HTTPS主要由有两部分组成:HTTP+ SSL / TLS,也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加密后的数据。HTTS复杂的加密机制有效的加大了网站的安全性,加密机制与认证机制可以减少网站被劫持和假冒的风险,建议站长们可以通过做HTTPS改造来强化网站安全。

关于网站被黑的更多信息请参考:

2018.3.21 网站被黑应该怎么做 — 网站被黑操作指南

2018.2.5 HTTPS改造全解析

目录

1. 页面内容质量

2. 用户需求满足

3. 用户体验友好

4. 搜索公正及用户安全

来源:百度搜索资源平台 百度搜索学堂


Public @ 2010-04-09 15:21:28

“天网算法”出台,百度严打盗取用户隐私

近日,百度网页搜索发现部分站点存在盗取用户隐私的行为,主要表现为网页嵌恶意代码,用于盗取网民的QQ号、手机号。而许多网民却误认为这是百度所为。为此,百度网页搜索和百度安全联合研发天网算法,针对这种恶意行为进行打击。有过盗取用户隐私行为的站点请尽快整改,待策略复查达到标准可解除惩罚。来源:百度搜索资源平台

Public @ 2011-11-07 15:21:55

【官方说法】清风算法2.0欺骗下载算法解读

清风算法2.0是一个应用于移动应用市场的算法,旨在优化应用的下载推荐和排序。 该算法使用了人工智能和机器学习技术,通过分析用户行为、用户画像、应用内容等多种因素,为用户推荐更符合其兴趣和需求的应用。 同时,为了打击刷量作弊行为,清风算法2.0加入了欺骗下载算法,可以检测并过滤掉虚假下载行为,保证应用市场的公正性和客观性。 需要注意的是,清风算法2.0并非绝对完美,仍有可能存在一定程度上的误判

Public @ 2023-04-09 07:00:24

百度搜索算法规范详解-3.用户体验友好

一、概述 用户体验友好是百度搜索算法中的一个重要考虑因素。在搜索结果页面中,用户要能够快速地找到他们所需要的信息,并且能够轻松地进行交互操作。因此,为了提高用户体验,百度搜索算法需要关注以下方面: 1.搜索结果页的排版 2.搜索结果的相关性与有效性 3.返回结果的速度 二、搜索结果页的排版 搜索结果页的排版直接影响用户浏览和使用的难易程度。百度搜索算法会根据搜索关键词的不同,调整搜索结

Public @ 2023-06-11 15:50:29

百度搜索算法规范详解-1-引言

百度搜索算法是百度搜索引擎为了更好的实现用户查询意图,提供最精准的查询结果,而进行的一系列的算法处理。根据用户的查询意图,百度能够匹配出最接近的查询结果,达到搜索更加广泛,结果更加精准的目的。 百度搜索算法主要有索引算法、聚类算法和拼写检查算法等。索引算法是百度搜索引擎的核心算法,它能够在搜索引擎无限索引大量信息后,根据查询意图将索引结果按照词频、普及率和用户点击率排序返回到用户搜索结果中。

Public @ 2023-03-01 19:48:36

更多您感兴趣的搜索

0.410925s