Categories


Tags


为什么我的网站内一些不设链接的私密性网页,甚至是需要访问权限的网页,也会被搜狗收录?

sogou spider对网页的抓取,是通过网页与网页之间的链接实现的。

网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。

搜狗Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被搜狗收录,原因有两点:

A. 该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化。

B. 该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容。

如果您不希望这些私密性内容被搜狗收录,一方面可以通过robots协议加以限制;另一方面,也可以通过删除快照反馈给我们进行解决或者通过站长平台使用死链提交告知我们对其进行删除。


Public @ 2017-04-25 15:55:44

site语法查询说明

Site语法是一种在搜索引擎中指定搜索结果范围的语法。 使用Site语法时,您可以使用“site:”后跟您要搜索的网站域名来限制搜索结果范围。例如,如果您希望在“www.google.com”中搜索“apple”,您可以使用以下语法: site:www.google.com apple 您还可以使用Site语法来搜索特定域名下的特定文件类型,例如:site:www.amazon.com fil

Public @ 2023-06-08 14:50:09

百度搜索如何防止被骗?

1、勿轻信“中奖”消息    利用“中奖”骗取汇款是最常用的网络骗术之一    诈骗过程:发送大量的中奖通知(提供兑奖联络方式)----(如网友与之联系)诈骗者以 个税等各类名义要求汇款(提供银行帐号)----收到汇款(诈骗成功)----拖延时间要求再次汇款 ----诈骗者销声匿迹。2、警惕冒充官方网站的网址  &nb

Public @ 2016-05-02 16:23:12

网站一直不收录怎么办,网站内容一直不收录解决方法

如果您的网站长期未被搜索引擎收录,可以考虑以下解决方法: 1. 提交网站:确保您已经将网站提交给主要的搜索引擎。您可以通过搜索引擎的提交页面或者工具将网站提交给它们。一般来说,搜索引擎会在数周内收录您的网站。 2. 优化网站结构:确保您的网站结构良好,易于搜索引擎检索和索引。使用合适的标题、描述和关键词标签,确保网页URL清晰可读,并使用合适的内部链接。 3. 创建高质量内容:发布高质量、原

Public @ 2023-07-28 01:50:34

为什么同样类型或相近的网站,有的可以被收录,有的则不被收录?

360搜索是以用户体验和用户安全为原则进行网站收录的,我们会对高质量原创且符合用户需求的站点进行收录,一些资源可替代并且质量较差的内容,甚至非原创采集的内容,我们将酌情收录或不收录。建议您根据我们发布的《360搜索网页质量白皮书》,进行排查,并调整与优化。

Public @ 2015-09-03 15:55:46

更多您感兴趣的搜索

0.484997s