HITS链接分析算法
HITS(Hyperlink-Induced Topic Search)是一种基于链接的搜索引擎排名算法,与其他排名算法如PageRank一样,它的主要目的是将用户查询与集合的文档匹配,使得最相关的文档被检索出来,排在前面。事实上,网页根据网页内部和外部因素来排序。HITS算法包括两个重要指标:Authority和Hub,体现网页的相关性,指导搜索引擎排序,即把相关性高的网页排在前面。 HI
HITS(Hyperlink-Induced Topic Search)是一种基于链接的搜索引擎排名算法,与其他排名算法如PageRank一样,它的主要目的是将用户查询与集合的文档匹配,使得最相关的文档被检索出来,排在前面。事实上,网页根据网页内部和外部因素来排序。HITS算法包括两个重要指标:Authority和Hub,体现网页的相关性,指导搜索引擎排序,即把相关性高的网页排在前面。 HI
HITS算法是一种采用迭代计算的网络算法,用于计算网络中节点的权重。该算法主要用于网络信息检索等计算技术。HITS算法与传统的关键词检索不同,关键词检索是以词语为基础,以文档为主要检索对象,结果通过匹配检索关键词的文档及其相关性程序来返回结果。而HITS算法则是以链接为基础,以网页为主要检索对象,通过计算每个页面的被链接的频度和链接其它页面的重要程度来决定查询结果的排序。该算法基于“authr
HITS(Hyperlink - Induced Topic Search)链接分析算法诞生在1997年,该算法是由康奈尔大学中的一位博士提出,并且该算法沿用于全球多个搜索引擎当中。当然,不同的搜索引擎针对于该算法的侧重点和内部公式都有不一的算法结构调整,并且HITS算法也是链接分析中最为重要的基础算法之一。对于目前国内的整体搜索引擎而言,百度作为国内的搜索引擎领头羊,我会带着HITS的公开文档针