Categories


Tags


搜索引擎怎样抓到你?

用户行为方式怎样影响搜索引擎排名结果,是很多SEO一直关心探讨的问题。

前一阵在点石论坛上就看到关于在百度大量点击搜索结果中自己的网站,从而进一步提高排名的讨论。其逻辑是,搜索结果中的某个网站被点击次数越多,说明越有用,用户越喜欢,搜索引擎会更进一步提高这个网站的排名。

不过这种用户行为方式是噪声很大的数据,极容易作弊。搜索引擎要在这些数据中提炼出精华非常困难。

前几天Google员工JohnMu就在Google帮助论坛里明确说,诸如点击某个网站,然后立即点返回按钮,这种操作并不会影响你网站的抓取、索引和排名。这太容易作弊,太容易被竞争对手利用了。

类似这种看似很有价值,却又很难提炼有用信息的数据还很多。比如给竞争对手网站群发垃圾链接。

说到底,要有效利用用户行为数据,关键在于搜索引擎怎样确认用户身份,也就是说准确辨别特定行为到底是谁干的。如果是大量真实的用户点击你的网站,停留的时间很长,那么对排名一定有益。如果搜索引擎能判断出这大量点击就是你一个人,或者是与你有关的一群人干的,可能效果正相反。

给对手群发也是如此,关键在于判别是谁群发。

我以前写过一篇无所遁形,更多属于科幻和瞎想。但谁敢肯定有朝一日,在网上通过基因来判断身份不会实现呢?20年前,如果谁跟我讲会有互联网,会有网站,会有SEO,那时候我也会觉得是科幻。

现在搜索引擎其实已经掌握了大量的数据,能帮助鉴别用户身份。比如Google就可以通过cookies,JS脚本,工具条,gmail帐号,Adsense帐号,Google Analytics帐号,IP地址,用户搜索数据等判定和鉴别用户身份。

一个用户如果登录过gmail帐号,再访问任何带有Adsense,Google Analytics,以及Google所能控制的任何JS脚本的网页,这些访问数据都将被记录在案。而带有Google JS脚本的网站现在多如牛毛,除了明显的Adsense,Google Analytics等,现在Google还收购了最大的网络广告公司DoubleClick,无数有广告的网站都在使用Google的代码。所以你在网上的一举一动,很难逃过Google的眼睛。

如果安装了Google的工具条,那你访问网站的情况就更一目了然了。

就算你能极端洁身自好,不露痕迹,既不登录任何Google帐号,浏览器关掉JS脚本功能,也不用工具条。总之你就是个隐身人,也还是不能保证搜索引擎就抓不到你。

比如说,如果你通过一个联盟买卖链接,这是Google很痛恨的事情。就算你能做到隐身,但你无法保证这个联盟里的其他人都能不露痕迹。如果这个链接买卖联盟里面的一些人暴露了身份,而这些人时不时访问一下你的网站,检查他们所买的链接,你的网站和你自己也就露馅了。

觉得搜索引擎没有这么聪明吗?谁知道呢?小心为妙。

来源:SEO每天一贴 Zac 昝辉


Public @ 2015-05-11 16:21:51

搜索引擎收录网页的四个阶段

作为SEO从业者,不仅要被搜索引擎抓取,还要被收录,最重要的是在收录后有良好的排名,本文将简单分析下搜索引擎收录网页的四个阶段。每个网站、每个网页的排名都是不一样的,看看你的网站处于哪个阶段呢?搜索引擎收录网页的四个阶段 PageRank 搜索引擎 建站教程 第1张网页收录第一阶段:大小通吃搜索引擎的网页抓取都是采取「大小通吃」的策略,也就是把网页中能发现的链接逐一加入到待抓取URL中,机械性的将

Public @ 2012-08-25 16:22:23

百度搜索引擎工作原理-5-结果展现

结构化数据——助力站点获得更多点击网页经历了抓取建库,参与了排序计算,最终展现在搜索引擎用户面前。目前在百度搜索左侧结果展现形式很多,如:凤巢、品牌专区、自然结果等,一条自然结果怎样才能获得更多的点击,是站长要考虑的重要一环。目前自然结果里又分为两类,见下图,第一个,即结构化展现,形式比较多样。目前覆盖80%的搜索需求,即80%的关键词下会出现这种复杂展现样式;第二个即一段摘要式展现,最原始的展现

Public @ 2021-09-11 16:21:45

搜索引擎网页去重算法分析

相关统计数据表明:互联网上近似重复的网页的数量占网页总数量的比例高达29%,完全相同的网页大约占网页总数量的22%.研究表明,在一个大型的信息采集系统中,30%的网页是和另外70%的网页完全重复或近似重复的。即:互联网的网页中相当高的比例的网页内容是近似相同或完全相同的!搜索爬虫抓取会产生网页重复的类型:1.多个URL地址指向同一网页以及镜像站点如:www.sina.com 和www.sina.c

Public @ 2020-07-15 16:21:55

搜索引擎体系结构

搜索引擎基本结构一般包括:搜索器、索引器、检索器、用户接口等四个功能模块。1、搜索器:搜索器也叫网络蜘蛛,是搜索引擎用来爬行和抓取网页的一个自动程序,在系统后台不停歇地在互联网各个节点爬行,在爬行过程中尽可能快的发现和抓取网页。2、索引器。它的主要功能是理解搜索器所采集的网页信息,并从中抽取索引项。3、检索器。其功能是快速查找文档,进行文档与查询的相关度评价,对要输出的结果进行排序。4、用户接口。

Public @ 2018-03-04 16:22:54

更多您感兴趣的搜索

0.471516s