PageRank 的基本概念

PageRank 是基于「从许多优质的网页链接过来的网页,必定还是优质网页」的回归关系,来判定所有网页的重要性。

在以下冗长的说明中,许多部分大量地使用了专业用语,会造成理解上的困难。

这一章虽然准备集中于定性而简单的解说,但是,即使如此也会有怎么也不明白的时候,此时只要能够理解「从许多优质的网页链接过来的网页,必定还是优质网页」这一思考方法也就非常得可贵了。

因为在所有几个要点中,这个是最重要的思考方法。

关于PageRank
PageRank,有效地利用了 Web 所拥有的庞大链接构造的特性。

从网页A导向网页B的链接被看作是对页面A对页面B的支持投票,Google根据这个投票数来判断页面的重要性。

可是 Google 不单单只看投票数(即链接数),对投票的页面也进行分析。

「重要性」高的页面所投的票的评价会更高,因为接受这个投票页面会被理解为「重要的物品」。

根据这样的分析,得到了高评价的重要页面会被给予较高的 Page Rank(网页等级),在检索结果内的名次也会提高。

PageRank 是 Google 中表示网页重要性的综合性指标,而且不会受到各种检索(引擎)的影响。

倒不如说,PageRank 就是基于对"使用复杂的算法而得到的链接构造"的分析,从而得出的各网页本身的特性。

当然,重要性高的页面如果和检索词句没有关联同样也没有任何意义。

为此 Google 使用了精练后的文本匹配技术,使得能够检索出重要而且正确的页面。