Categories


Tags


Google专利:怎样鉴别和处理垃圾链接

在自己网站上使用SEO作弊手法,诸如隐藏文字,隐藏链接,关键词堆积,隐藏页面,JS转向等,是比较传统的作弊方式,也更加危险。因为证据确凿,被抓住没什么好狡辩的,证据全在自己网站上摆着呢。

而靠垃圾链接提高排名,就有点说不清道不明的感觉。在博客或论坛群发,就算被检测到,搜索引擎在处理时也会比较谨慎,因为很难断定群发是谁干的。虽然大部分情况下是站长自己干的,但鉴于现在很多人为了排名能变成黑客,也不排除有些人为了陷害竞争对手,给竞争对手群发一下。

所以怎样鉴别和处理垃圾链接是个头疼的问题。搜索引擎头痛,老老实实做站的站长也头痛。

前两天Google提交的一份专利刚刚被批准,标题是:在互相链接的数据中检测链接垃圾之方法,就是研究怎样检测和处理垃圾链接。专利中讨论了很多鉴别链接工厂的数学公式,我完全看不懂,懂编程的可以研究一下。我承认大学时学的高数、线代、概率论等一点也不记得了。 :-)

这份专利特意提到了两类链接工厂。一种是做一大堆网站,目的就是共同连向一个主网站,使主网站排名提高。这种链接工厂的特征是链接向主网站的这些页面,往往权重(比如Google PR)都很低。而正常的,真正重要的网页通常都会有至少一些比较重要的链接。

另外一种链接工厂是,一堆网站互相之间交叉链接起来。这种链接工厂的特征是,这群网站在链接模式上基本上形成一个孤岛,很少与圈子之外的网站有正常链接关系。

专利中提到被判断是链接工厂或有链接工厂嫌疑的,可能会采取以下措施:

这些页面的链接在计算权重时,完全不被考虑

页面上的链接权重被降低

页面上的链接权重被惩罚

这些页面本身重要性被降低

这些页面本身重要性被降低,同时发出的链接重要性也被降低

这些惩罚措施都是可以预见的,所描述的两种典型链接工厂也不少见。不知道专利中所描述的数学公式,在判断这些链接工厂时的准确率有多高?

来源:SEO每天一贴 Zac 昝辉


Public @ 2015-05-22 15:54:34

Google新PR:以链接距离为基础的页面级别

Google PR是Google诞生以来最具知名度的概念,以至于很多人认为Google PR的意义更多在于公关炒作,而不是排名算法。2016年4月,Google取消了工具条输出PR值的显示,站长们再也看不到最新的PR值了,也有很多SEO认为Google完全取消了PageRank算法。现在的Google排名算法中还有PageRank吗?众说纷纭。Google从2006年就不再使用PageRank了前

Public @ 2011-06-08 15:39:06

Google链接分析专利

商业周刊今天发表一篇文章谈搜索引擎市场的竞争情况。Matt Cutts很快发了个贴子评论了下。搜索引擎各自的商业模式,关注点和优缺点就不多说了。引起我兴趣的是Matt Cutts特意提到一个Google链接分析的专利。这个专利是Google在2001年申请,2003年2月批准的,美国专利号号6526440。Google和其他搜索引擎公司都有大把的专利,但拿出来谈的很少,哪些已经用在排名算法里外人就

Public @ 2017-10-08 16:21:56

Google技术副总裁谈Google排名算法

Google排名算法非常复杂,遵循的原则很多,但也有一些共通的要素: 1. 收录:Google使用Robots.txt文件来控制哪些HTML文档被收录,这将决定哪些搜索结果会出现。 2. 内容:Google将搜索结果与页面内容相关联,它会将页面上出现的关键字和短语作为搜索结果的依据。 3. 权重:Google会将特定的网站和页面赋予更高的权重,也就是说它们会显示在搜索结果靠前的位置,另外

Public @ 2023-02-25 18:24:35

Google Panda熊猫更新笔记

关于Google Panda熊猫算法更新的一些零零碎碎的笔记。到目前为止看到的受影响的网站完全恢复情况很少。子域名是分开处理的。据报道,一个网站把高质量内容换到子域名上去恢复了排名。Panda针对内容农场之类的网站,但有大批误杀。主要和内容质量及用户体验有关,比如广告占页面比例可能是指标之一。Panda更新算法参考了人工质量检查及用户浏览数据,通过机器学习形成模式。与Chrome用户屏蔽网站数据互

Public @ 2020-05-23 15:54:34

更多您感兴趣的搜索

0.403549s