Categories


Tags


HITS算法

HITS算法(Hypertext-Induced Topic Selection),也称为Hubs and Authorities algorithm,是一种用来计算图中节点相对重要性的算法。它是Larry Page and Sergey Brin 在1998年首次提出,以提高他们搜索引擎Google的网页检索准确性。HITS算法通过分析不同节点间的连接关系来鉴定节点的重要性分数:一个节点被称为网页中一个著名的Authority(权威性节点),另一个节点被称为Hub(节点中心性)。 算法的步骤如下: 1. 初始化每个节点的Authority score和Hub score为1。 2. 计算每个节点都有谁链接它,这些链接它的节点就是它的**Incoming Linker**;计算它指向哪些节点,这些节点称为它的**Outgoing Linker**。 3. 计算每个节点的新Authority score:节点的新Authority score等于它收到的来自上一次迭代计算的Incoming Linker的Hub score之和。 4. 计算每个节点的新Hub score:节点的新Hub Score等于它收到的来自上一次迭代计算的Outgoing Linker的Authority score之和。 5. 重复执行上述步骤,直至Authority score和Hub score不再改变为止。 最终每个节点的Authority score和Hub score就是它的重要性分值。节点的Authority score可以反映它在整个网站中的权威性,Hub score来反映它在整个网站中的中心性。

Public @ 2023-02-27 07:00:50

Sogou Rank与网页排名关系研究

最近对网站和域名的综合权威度或重要性感受比较多,所以robin一告诉我Sogou Rank推出的消息就很感兴趣。今天来做个简单的研究比较,看看Sogou Rank和真正的网页排名之间的关系。我随机挑一个关键词在Sogou,百度,Google做搜索,看排在前十名的网页Sogou Rank是多少。为排除大型门户或知名服务商网站传递给二级域名及分目录的重要性,将这些结果删除,只看独立的专门的网站。关键词

Public @ 2013-01-05 15:39:02

Matt Cutts谈PR和PR更新

大家都注意到前两天Toolbar(工具条)PR已经更新了。Matt Cutts发了一个帖子,回答一些关于PR和PR更新的问题。问:我很好奇PR值在内部是怎样存储的?是小数,就像人们猜测的,还是整数?答:把它想为小数更准确。当然目前我们内部的PR计算比toolbar显示的0-10要长的多。问:我需要知道这个吗?我知道PR能告诉我什么,我为什么要在乎?也就是说对普通网站来说,PR有什么目的?答:我想这

Public @ 2012-12-27 15:39:04

HITS链接分析算法

HITS(Hyperlink-Induced Topic Search)是一种基于链接的搜索引擎排名算法,与其他排名算法如PageRank一样,它的主要目的是将用户查询与集合的文档匹配,使得最相关的文档被检索出来,排在前面。事实上,网页根据网页内部和外部因素来排序。HITS算法包括两个重要指标:Authority和Hub,体现网页的相关性,指导搜索引擎排序,即把相关性高的网页排在前面。 HI

Public @ 2023-03-02 20:01:00

更多您感兴趣的搜索

0.457953s