HITS、TrustRunk、PageRunk、HillTop算法啥意思?对SEO有什么指导意义?

HITS、TrustRunk、PageRunk、HillTop算法啥意思?对SEO有什么指导意义?,第1张

HITS算法

HITS算法是由康奈尔大学( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登研究中心( IBM Almaden Research Center) 的名为“CLEVER”的研究项目中的一部分。

TrustRank算法

TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,并且于2006年申请专利。TrustRank算法发明人还发表了一份专门的PDF文件,说明TrustRank算法的应用。感兴趣的读者可以在下面这个网址下载PDF文件:

TrustRank算法并不是由Google提出的,不过由于Google所占市场份额最大,而且TrustRank在Google排名中也是一个非常重要的因素,所以有些人误以为TrustRank是Google提出的。更让人糊涂的是,Google曾经把TrustRank申请为商标,但是TrustRank商标中的TrustRank指的是Google检测含有恶意代码网站的方法,而不是指排名算法中的信任指数。

基于这个假设,如果能挑选出可以百分百信任的网站,这些网站的TrustRank评为最高,这些trustrank最高的网站所连接的网站信任指数稍微降低,但也会很高。与此类似,第二层别信任的网站链接出去的第三层网站,信任度继续下降。由于种种原因,好的网站也不可避免的会接到一些垃圾网站,不过离第一层网站点击距离越近,所传递的信任指数就越高,第一级网站点击距离越远,信任指数将依次下降。这样trustrank算法,就能给所有网站计算出相应的信任指数,离第一层网站越远,成为垃圾网真的可能性就越大。

PageRank

PageRank,即网页排名,是Google用来标识网页的等级或重要性的一种算法。

最早的搜索引擎采用的是 分类目录 的方法,即通过人工对网页进行分类并整理出高质量的网站。

随着网页数目的急剧增大,这种方法显然无法实施。于是,搜索引擎进入了 文本检索 的时代,即通过计算用户的查询语句与网页内容的相关程度来返回搜索结果。比如通过向量空间模型将输入的检索词和文件转换成向量,通过计算两个向量的夹角偏差程度(一般采用余弦距离)来衡量相关性。这种方法虽然能处理大量网页,但是效果却并不是很好,比如存在一些作弊行为:某些网页重复倒腾某些关键词从而使自己的搜索排名靠前。

于是,谷歌的两位创始人,当时还是美国斯坦福大学研究生的佩奇 (Larry Page) 和布林 (Sergey Brin) 开始了对网页排序问题的研究。他们受学术界对学术论文重要性的评估方法(论文引用次数)的启发,提出了PageRank算法。

PageRank的核心思想其实十分简单,概括如下:

如果一个网页被很多其它网页链接到,说明这个网页很重要,它的PageRank值也会相应较高;

如果一个PageRank值很高的网页链接到另外某个网页,那么那个网页的PageRank值也会相应地提高。

HillTop算法

HillTop,是一项搜索引擎结果排序的专利,是Google的一个工程师Bharat在2001年获得的专利。Google的排序规则经常在变化,但变化最大的一次也就是基于HillTop算法进行了优化。

罗海,男,中国工艺美术大师,高级工艺美术师,享受广东省人民政府特殊津贴,端砚世家。罗海,男,广西来宾人,1993年在中央美术学院学习,后“流落”到北京圆明园画家村,成为广西第一批“北漂”的艺术家。2004年罗海来到宋庄,并担任中国抽象艺术联盟秘书长。罗海,男,分析化学,生物质谱和生化分析,博士,副教授,2000年攻读美国普渡大学,博士;2000-2002,美国能源部太平洋西北国家实验室,博士后 2002-2004 ,美国艾伯特公司生命研究中心,科学家;


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/536750.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-06-25
下一篇2023-06-25

发表评论

登录后才能评论

评论列表(0条)

    保存