Categories


Tags


HITS链接分析算法

HITS(Hyperlink-Induced Topic Search)是一种基于链接的搜索引擎排名算法,与其他排名算法如PageRank一样,它的主要目的是将用户查询与集合的文档匹配,使得最相关的文档被检索出来,排在前面。事实上,网页根据网页内部和外部因素来排序。HITS算法包括两个重要指标:Authority和Hub,体现网页的相关性,指导搜索引擎排序,即把相关性高的网页排在前面。 HITS算法首先将网络或文档抽象为一个有向图,称为链接网络。对于每个网页,给出其作者(Authority)和链接(Hub)。基于链接的HITS算法使用一个简单的迭代流程来更新Authority 和 Hub 指标的值: 1.首先通过将Authority 分配给所有链接节点,计算每个Hub所具有的Authority 权重。 2.接着,将Hub值分配给每个链接节点,计算每个Authority所拥有的Hub权重 3.这个迭代过程一直持续下去,直到稳定,也就是说,在计算Authority/Hub 的值的时候,其值改变的越来越小,这个阈值可以根据系统的需要来设定。 4.最后,将依据Authority/Hub 指标值排序得到的结果作为搜索引擎的排序结果返回给用户。 HITS算法有一定的局限性,其最大的缺点在于,HITS算法容易受垃圾链接(spam links)的影响。多数搜索引擎都在使用HITS算法前都要先审查排名结果,移除被标记为垃圾链接的网页,以确保搜索引擎的查询结果的真实性和可靠性。

Public @ 2023-03-02 20:01:00

Google专利:怎样鉴别和处理垃圾链接

在自己网站上使用SEO作弊手法,诸如隐藏文字,隐藏链接,关键词堆积,隐藏页面,JS转向等,是比较传统的作弊方式,也更加危险。因为证据确凿,被抓住没什么好狡辩的,证据全在自己网站上摆着呢。而靠垃圾链接提高排名,就有点说不清道不明的感觉。在博客或论坛群发,就算被检测到,搜索引擎在处理时也会比较谨慎,因为很难断定群发是谁干的。虽然大部分情况下是站长自己干的,但鉴于现在很多人为了排名能变成黑客,也不排除有

Public @ 2015-05-22 15:54:34

PageRank与TrustRank影响因素分析

PageRank(PR)里的page不是指网页,而是指Google创始人拉里?佩奇(Larry Page),是他在2001年申请的专利中以自己名字命名的,Google的PageRank根据网站的外部链接和内部链接的数量和质量来衡量网站的价值。TrustRank(信任指数)是2006年雅虎申请的一项专利,Trust Rank是用来检测垃圾网站的,但现在的搜索引擎排名算法中,常常影响大部分网站的整体排

Public @ 2015-02-25 15:39:09

HITS链接分析算法

HITS(Hyperlink - Induced Topic Search)链接分析算法诞生在1997年,该算法是由康奈尔大学中的一位博士提出,并且该算法沿用于全球多个搜索引擎当中。当然,不同的搜索引擎针对于该算法的侧重点和内部公式都有不一的算法结构调整,并且HITS算法也是链接分析中最为重要的基础算法之一。对于目前国内的整体搜索引擎而言,百度作为国内的搜索引擎领头羊,我会带着HITS的公开文档针

Public @ 2009-11-28 15:39:11

HITS链接分析算法

HITS(Hyperlink-Induced Topic Search)是一种基于链接的搜索引擎排名算法,与其他排名算法如PageRank一样,它的主要目的是将用户查询与集合的文档匹配,使得最相关的文档被检索出来,排在前面。事实上,网页根据网页内部和外部因素来排序。HITS算法包括两个重要指标:Authority和Hub,体现网页的相关性,指导搜索引擎排序,即把相关性高的网页排在前面。 HI

Public @ 2023-03-02 20:01:00

更多您感兴趣的搜索

0.490816s