Trust Rank算法

TrustRank是基于链接关系的搜索引擎排名算法,TrustRank可以翻译为“信任指数”,其最初是来自于雅虎与斯坦福大学的一项研究,用于检测垃圾网站,后来被广泛用于搜索引擎对于网站信任值的评价,成为搜索引擎排名的重要算法之一。

 TrustRank算法基于一个基本假设:好的网站很少会链接到坏的网站。反之则不成立,也就是说,坏的网站很少链接到好网站这句话并不成立。正相反,很多垃圾网站会链接到高权威、高信任指数的网站,试图提高自己的信任指数。

 TrustRank算法基于一个基本的假设,即好的网站很少会链接到坏的网站,反之则不成立。这句话如果用在人际关系方面也是成立的,名声好的人不太喜欢跟名声坏的一起玩,但名声坏的可能会喜欢跟名声好的一起玩。

基于这个假设,如果能挑选出信任度非常高的网站,然后给这些网站非常高的TrustRank值,这些网站就可以给他们链接到的网站传递信任值,信任值可以根据传递的层级进行递减,这样,通过TrustRank算法,就能给所有网站计算出相关的信任值,距离第一层网站越远,是垃圾网站的可能性就越大。

 由此可见,TrustRank算法的应用首先需要选择一批种子网站,然后对这些网站进行人工评价,设定初始的TrusRank值,然后设置传递规则进行信任值的传递,最终覆盖到互联网上的全部网站。

  虽然TrustRank算法最初是作为检测垃圾的方法,但在现在的搜索引擎排名算法中,TrustRank概念使用更为广泛,常常影响大部分网站的整体排名。TrustRank算法最初针对的是页面级别,现在在搜索引擎算法中,TrustRank值也通常表现在域名级别,整个域名的信任指数越高,整体排名能力就越强。



发表评论

邮箱地址不会被公开。 必填项已用*标注