Categories


Tags


一个关于Google排名的有趣问题

转眼间博客已经整整一年没更新了。为了不要让SEO每天一贴变为多年一贴,在刚好一年的时候更新一下。

今年简直是世界大乱,虽然各个事件会以怎样的方式结束还不知道,但可以肯定的是,对世界、对国家、对个人,都有方向性的巨大影响,影响大到想对世界、对人生发些感慨,都不知道从何说起了。所以还是回到seo这个小话题吧。

前几天一位国内某大型电商SEO部门的朋友问我些问题,其中一个很有意思,一两句话又说不清楚,所以写个帖子回答,也许对其它SEOer也有帮助。

他的问题是:

(我的《SEO实战密码》词频和密度部分)指出:在google搜索“新加坡旅游”关键词时,出现“新加坡”返回85200000个结果,搜索“旅游”返回342000000个结果。

问题:我在google搜索“新加坡旅游”返回了131,000,000个结果,搜索“新加坡旅游 -旅游”返回了43,600,000个结果,搜索“新加坡旅游 -新加坡”返回了0个结果,不明白为什么搜索“新加坡旅游”中除去“新加坡”会返回0个结果?

搜索了一下他提到的查询词,果然是这么个情况。

前两个搜索结果数字是我的书里引用的,现在的结果数字已经增加了,现在搜索“新加坡”有218,000,000个结果,搜索“旅游”有802,000,000个结果。比例是大致不变的,而且是在直观理解范围内的:旅游这个词使用范围更大,出现在更多页面中。

第三个数字也符合通常理解的搜索算法预期。搜索“新加坡旅游”,他看到的结果数是131,000,000,我看到的是90,400,000,数字不同可能和地理位置、个性化结果等有关,但差异不大。

通常,查询词由多个词组成时,搜索引擎使用的是“和/且”逻辑,也就是说,返回的是包含所有词的页面。搜索“新加坡旅游”,返回的是既包含“新加坡”,也包含“旅游”的页面,或者说是“新加坡”和“旅游”两个词搜索结果的交集。显然,搜索结果数就要变小,至多是相等于小的那个集合。

下一个搜索结果数就变得有意思了。搜索“新加坡旅游 -旅游”,他看到的是返回了43,600,000个结果,我看到的是44,300,000个结果。如前所述,数字上的小差异不重要,重要的是这个数值本身就有些怪异:

减号“-”是个特殊搜索指令,意义是排除包含这个词的页面。那么查询词“新加坡旅游 -旅游”是什么意思呢?应该是既包含“新加坡”,也包含“旅游”的页面、再减去包含“旅游”的页面,那不就应该是没有结果吗?

再下一个搜索结果验证了这个算法逻辑。搜索“新加坡旅游 -新加坡”,指的是包含“新加坡”,也包含“旅游”的页面、再减去包含“新加坡”的页面,结果应该是零个,也确实是零个:

返回零个结果才是符合算法逻辑的。那位朋友的想法可能是“新加坡旅游 -新加坡”=“旅游”?其实不是,搜索“新加坡旅游 -新加坡”,指的是既包含“新加坡”,也包含“旅游”、同时又不包含“新加坡”的页面,没有符合条件的页面。

那“新加坡旅游 -旅游”怎么又有结果了呢?逻辑不应该是一样的吗?魔鬼可能在细节中。观察一下搜索结果中的页面内容:

仔细看,会发现返回的页面包含的基本上都是“旅遊”,而不是“旅游”。所以一个合理的可能性是,搜索一个词时,搜索引擎会找到对应的繁体字、异体字,大概率还会考虑同义词。“新加坡旅游 -旅游”就变成了包含“新加坡”、包含“旅遊”或“旅游”、同时又不包含“旅游”的页面,结果就是包含“新加坡”以及“旅遊”的页面。

所以“新加坡旅游 -旅游”的结果应该大致等于“新加坡旅遊”的结果。看一下“新加坡旅遊”的结果:

返回45,600,000个结果,和“新加坡旅游 -旅游”的44,300,000个非常接近。仔细看的话,会发现“新加坡旅遊”的结果中还是有一些“新加坡旅游”的页面,可能Google认为“旅游”是比“旅遊”更常用的写法,还是应该推荐一些给用户。

那么“新加坡旅游 -新加坡”怎么就没有结果了呢?因为“新加坡”好像没有繁体字/异体字的写法。

如果这个假设成立,搜索“国名旅游 -国名”,其中国名有繁体字/异体字的话,是不是就应该有结果了呢?试一下“马来西亚旅游 -马来西亚”:

确实,返回的基本上是“馬來西亞”的页面。再验证一下,搜索“国名旅游 -国名”,国名没有繁体字/异体字(和“新加坡”一样),是不是就没有结果了呢?试一下“日本”:

果然没有结果。

有的读者可能已经又多想了一步:减号后面的“旅游”为什么不被扩展加上“旅遊”呢?如果减号后的词也被扩展考虑其异体字/繁体字,“-旅游”就将变成“-旅遊 -旅游”。我的理解是,减号作为特殊指令,是必须严格匹配的,不做扩展。

所以,如果要想让“新加坡旅游 -旅游”结果变为零,需要写成这样:“新加坡旅游 -旅遊 -旅游”,验证一下:

果然没有结果了。不过就算是0个结果,也没挡住 Google给我推广告 :-)

读者感兴趣的话还可以试一下其它查询词的组合,也应该大致是这个规律。

也可以试一下百度搜索结果。百度和Google处理方法有一些细节的不同,百度在找繁体字、异体字、同义词时貌似更宽泛,搜索“新加坡旅游”时会把“新加坡游玩”之类的词包括进来。但大致思路是很类似的,“新加坡旅游 -新加坡”在百度虽然不是没结果,但只有600多个结果,而且以英文页面为主。

研究这么细节的东西对SEO工作有什么用呢?说实话我也还没想到具体有什么用,不过是个不错的观察、思维训练,也测试一下自己对搜索算法、搜索指令的理解准确性。

既然是训练,就再加个思考题:前面的例子在搜索时都没有带双引号,双引号也是特殊搜索指令,意思是严格匹配搜索双引号里的词。如果搜索“新加坡旅游 -旅遊 -旅游”时带着双引号一起搜,会是什么结果呢?先别往下看答案,先思考一下。

答案:目前的结果是有9个返回页面,略过广告,前几个页面是这样:

所以,双引号里的减号不再被视为搜索指令了,而是被当作普通标点符号忽略了。

忽略掉减号后,双引号里的词就变成普通词,会被扩展繁体字/异体字/同义词。

结果就是,带双引号搜索“新加坡旅游 -旅遊 -旅游”时,返回的就是几个真的在页面上连续、完整、按顺序出现“新加坡旅游 旅游 旅游”的页面。

最后,过些天,本页面,以及可能的转载、抄袭版本,大概率会在带双引号搜索“新加坡旅游 -旅遊 -旅游”时出现。

来源:SEO每天一贴 Zac 昝辉


Public @ 2012-09-25 15:54:44

博客排名是否和普通网站不一样

有没有可能只搜索主页Matt Cutts说这个建议很好,他将会提出来,不过应该优先度不高。关于黑体字的补充在第一段视频里面,Matt Cutts曾经提到黑体字,Google给bold的权重比strong要高一点。他做了更正,Google对这两种黑体的权重完全一样,对两种斜体em和i两种标签的处理也完全一样。对复制内容的补充前面有说Google进行非常复杂的复制内容检测,Matt Cutts建议,如

Public @ 2014-12-14 15:17:50

搜索引擎降权与网站排名恢复

前些日子笔者的网站因为在百度知道回答问题被降权了,主要表现为:域名不在首页,一般在第二、三页上;随后几天,百度快照停滞,排名消失。谁都碰上过降权这样的事,特别是我们这帮被度娘折磨得不成人形的人(很多SEOER喜欢熬夜,一天两天没问题,一年两年后那个黑眼圈他妈都难以相信)。笔者加入SEO这个行业不久,也不是专业做SEO的,而是从事知识产权代理服务,比如商标注册、专利申请等等。本以为以自己这种业余的玩

Public @ 2021-03-22 15:38:15

Google技术副总裁谈Google排名算法

Google技术副总裁表示,Google排名算法是基于数百个因素的复杂算法。这些因素包括网页的内容质量、页面结构、链接质量、用户体验等。算法的目标是提供最相关和高质量的搜索结果给用户。 排名算法通过分析网页上的关键词、标题和元标签等内容来确定网页的主题和内容。同时,算法也会考虑网页的权威性和可信度,例如通过分析链接质量和网页的域名。 用户体验也是排名算法的重要考虑因素之一。Google会评估网

Public @ 2023-07-25 04:00:19

Google技术副总裁谈Google排名算法

Google技术副总裁斯安达尔·皮查伊谈到,Google排名算法的核心原则是为用户提供最佳的搜索结果。该算法基于多种信号进行分析和评估,包括网页的质量和相关性、链接的数量和质量、用户反馈和社会信誉等因素。 皮查伊强调,Google的排名算法是一个非常复杂的系统,其中包括超过200种不同的因素和信号。Google不会公开所有这些因素和信号,因为这样可能会导致滥用和不道德的行为。 他还指出,Goo

Public @ 2023-04-25 07:50:08

更多您感兴趣的搜索

0.509970s