Categories


Tags


Google PageRank的计算源代码

最近对google的PageRank(网页等级)比较感兴趣,一直想知道如何不用google toolbar来获取pr值。苦苦搜索之后,找到如下代码:

<?php

/**

This code is released unto the public domain

*/

//header("Content-Type: text/plain; charset=utf-8");

define('GOOGLE_MAGIC', 0xE6359A60);

//unsigned shift right

function zeroFill($a, $b)

{

$z = hexdec(80000000);

if ($z & $a)

{

$a = ($a>>1);

$a &= (~$z);

$a |= 0x40000000;

$a = ($a>>($b-1));

}

else

{

$a = ($a>>$b);

}

return $a;

}

function mix($a,$b,$c) {

$a -= $b; $a -= $c; $a ^= (zeroFill($c,13));

$b -= $c; $b -= $a; $b ^= ($a<<8);

$c -= $a; $c -= $b; $c ^= (zeroFill($b,13));

$a -= $b; $a -= $c; $a ^= (zeroFill($c,12));

$b -= $c; $b -= $a; $b ^= ($a<<16);

$c -= $a; $c -= $b; $c ^= (zeroFill($b,5));

$a -= $b; $a -= $c; $a ^= (zeroFill($c,3));

$b -= $c; $b -= $a; $b ^= ($a<<10);

$c -= $a; $c -= $b; $c ^= (zeroFill($b,15));

return array($a,$b,$c);

}

function GoogleCH($url, $length=null, $init=GOOGLE_MAGIC) {

if(is_null($length)) {

$length = sizeof($url);

}

$a = $b = 0x9E3779B9;

$c = $init;

$k = 0;

$len = $length;

while($len >= 12) {

$a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));

$b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));

$c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));

$mix = mix($a,$b,$c);

$a = $mix[0]; $b = $mix[1]; $c = $mix[2];

$k += 12;

$len -= 12;

}

$c += $length;

switch($len)              /* all the case statements fall through */

{

case 11: $c+=($url[$k+10]<<24);

case 10: $c+=($url[$k+9]<<16);

case 9 : $c+=($url[$k+8]<<8);

/* the first byte of c is reserved for the length */

case 8 : $b+=($url[$k+7]<<24);

case 7 : $b+=($url[$k+6]<<16);

case 6 : $b+=($url[$k+5]<<8);

case 5 : $b+=($url[$k+4]);

case 4 : $a+=($url[$k+3]<<24);

case 3 : $a+=($url[$k+2]<<16);

case 2 : $a+=($url[$k+1]<<8);

case 1 : $a+=($url[$k+0]);

/* case 0: nothing left to add */

}

$mix = mix($a,$b,$c);

/*-------------------------------------------- report the result */

return $mix[2];

}

//converts a string into an array of integers containing the numeric value of the char

function strord($string) {

for($i=0;$i<strlen($string);$i++) {

$result[$i] = ord($string{$i});

}

return $result;

}

// http://www.example.com/ - Checksum: 6540747202

$url = 'info:'.$_GET['url'];

$ch = GoogleCH(strord($url));

$url='info:'.urlencode($_GET['url']);

echo file_get_contents("http://www.google.com/search?client=navclient-auto&ch=6$ch&ie=UTF-8&oe=UTF-8&features=Rank&q=$url");

/* use curl send the user angent

$curl = curl_init("http://www.google.com/search?client=navclient-auto&ch=6$ch&ie=UTF-8&oe=UTF-8&features=Rank&q=$url");

curl_setopt ($curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; GoogleToolbar 2.0.110-big; Windows 2000 5.0)");

curl_exec($curl);

*/

?>

</></>

来源:月光博客


Public @ 2022-12-07 15:39:09

sogou Rank是什么?

网页评级(sogou Rank)是搜狗衡量网页重要性的指标,不仅考察了网页之间链接关系,同时考察了链接质量、链接之间的相关性等特性,是机器根据sogou Rank算法自动计算出来的,值从0至10级不等。网页评级越高,该网页在搜索中越容易被检索到。www.sohu.com和sohu.com网页评级不一样: www.sohu.com 和 sohu.com 是两个不同的URL,虽然他们可能指向同一个页面

Public @ 2017-11-22 15:39:03

李彦宏超链分析专利,超链分析算法的作用

互联网上的信息非常的庞大,要想让用户搜索到精准信息是很难的。搜索引擎技术非常复杂。百度创始人李彦宏在创立百度之前就已经是国际上比较厉害的搜索引擎技术专家了。据说李彦宏在找风险投资时,投资人询问了三个搜索引擎界的技术牛人一个同样的问题:要了解搜索引擎技术应该找谁,其中两个人回答说找李彦宏,由此投资人就断定李彦宏是最了解搜索引擎的人之一。李彦宏超链分析示意图这其实就是现实生活中链接关系的应用:要判断哪

Public @ 2020-01-04 15:39:01

如何快速提升新网站的PR值和外链

最近新建了一个网站,值所以对怎么快速提升网站PR的方法比较关注对于我们新手来说:在网站没PR值、没有自己的资源的情况下要想和其他PR值相对比较高的网站互换链接是不大可能的,所以还有一个渠道就是买链接;算是最简便的渠道吧那如果没有花钱买链呢?下面我们就这个问题探讨一下!以下是对一些站长经验的总结:希望能对想快速提升PR的新站长有所帮助。其实提供新站PR值的方法很多,但个人总结觉得必须遵从以下几大步骤

Public @ 2019-05-22 15:39:07

如何提高网站的Google PR值

原著:David Callan 编译:Karen 参考:Google的原罪--网页序列等级 内容摘要: 无论是对普通网络冲浪者还是网站管理员来说,Google都是目前世界范围内最受欢迎的搜索引擎。它每天处理的搜索请求高达1.5亿次,几乎占全球所有搜索量的1/3。网络冲浪者对Google情有独钟,是由于Google所提供的快速搜索速度及高命中率搜索结果。这些都是基于Google的复杂文本匹配运算法则

Public @ 2011-02-03 15:39:08

更多您感兴趣的搜索

0.520123s