李彦宏超链分析专利

搜索引擎技术是比较复杂的互联网技术,百度创始人李彦宏在创立百度之前就已经是国际上比较厉害的搜索引擎技术专家了。据说李彦宏在找风险投资时,投资人询问了三个搜索引擎界的技术牛人一个同样的问题:要了解搜索引擎技术应该找谁,其中两个人回答说找李彦宏,由此投资人就断定李彦宏是最了解搜索引擎的人之一。

李彦宏1997年就提交了一份名为“超链文件检索系统和方法”的专利申请,这比Google创始人发明PR要早得多,不得不说这是非常具有前瞻性的研究工作。在这份专利中,李彦宏提出了与传统信息检索系统不同的基于链接的排名方法。

这个系统除了索引页面外,还简历一个链接词库,记录链接锚文字的相关信息,比如锚文字中包含哪些关键词,发出链接的页面索引,包含特定锚文字的链接数量,包含特定关键词的链接指向哪些页面等。

根据这些链接数据,尤其是锚文字,计算出基于链接关系的文件相关性,在用户搜索时,将这些基于链接关系的相关性与基于关键词匹配的相关性进行综合计算,从而得到搜索排名。

在今天看来,这种基于链接的相关性计算是搜索引擎技术的基本常识,每个做SEO的人都知道,但是在那个时候确实一个非常创新的概念。就像现在每个人都懂语言、数学,但是这些东西在发明的时候却是非常困难的。



发表评论

邮箱地址不会被公开。 必填项已用*标注