Categories


Tags


搜索引擎怎样判断文章或网页的原始出处?

复制内容网页有的时候会影响网页排名。

比如说原本是你写的文章,本来应该排名很好,但是其他人抄袭或转载你的文章,而且搜索引擎不幸的判断那篇被抄袭或转载的网页是原始出处的话,你应有的排名就会被那个网页夺走。

那么搜索引擎怎样才能从多个网页中挑出哪一个是原始出处呢?可能有以下几个考虑:

1)网页PR值。网页PR值越高,被认为是原始版本的可能性就越大。

2)网页第一次被收录的时间。网页被搜索引擎收录的时候越早,相比后发现的相同内容的网页来说,被当作原始出处的可能性就越大。

3)域名注册时间。越老的域名上面的网页被当成原始出处的可能性也越大。

4)网站的权威度。这就有点说不清了,可能包含前面3个因素,还有很多其他因素。

但到目前为止,无论以哪一个因素为主,或怎样组合这些因素,都不可能完全正确从多个网页中挑出原始出处。

比如说我这个博客就很新,域名也很新,文章被收录的时间有的时候也不一定是最早的,就权威地位和被信任度来说,也肯定比不上很多中文网站。但我的博客新,我的域名新,并不意味着我的内容就不是原始出处,实际上我的所有博客都是原创。

我最近也发现了很多网站都转载,有的时候是抄袭我的博客内容,很多网站的规模,历史,PR值都比我的网站要高的多。

在检测文章原始出处方面,Google做的比较好,基本上能够正确判断,百度做的就比较差。从我的文章在不同的地方出现的情况看,百度似乎认为域名比较老的就是原创。

这个问题不是网站管理员自己可以解决的,只有依靠搜索引擎算法的改进。

来源:SEO每天一贴 Zac 昝辉


Public @ 2017-04-29 16:21:50

搜索引擎排名的人工干预

虽然搜索引擎排名技术和算法一直在提高,但我相信所有搜索引擎都或多或少有人工干预,就算最标榜一切以算法和自动化为目标的Google,也肯定有人工因素。去年就曾经有人报道(http://www.searchbistro.com/index.php?/archives/19-Google-Secret-Lab,-Prelude.html),Google在很多国家的大学招募学生,进行搜索引擎结果的评价工作

Public @ 2022-08-25 16:21:50

搜索引擎蜘蛛抓取份额是什么?

一月份时,Google新的SEO代言人Gary Illyes在Google官方博客上发了一篇帖子:What Crawl Budget Means for Googlebot,讨论了搜索引擎蜘蛛抓取份额相关问题。对大中型网站来说,这是个颇为重要的SEO问题,有时候会成为网站自然流量的瓶颈。今天的帖子总结一下Gary Illyes帖子里的以及后续跟进的很多博客、论坛帖子的主要内容,以及我自己的一些案例

Public @ 2011-06-02 16:21:52

搜索引擎面临哪些问题

搜索引擎面临的问题包括以下几个方面: 1.信息质量问题:搜索引擎的搜索结果中可能存在低质量、冗余、虚假和抄袭的内容,影响用户的搜索体验。 2.搜索算法问题:搜索引擎的算法可能会出现偏见和错误,导致搜索结果与用户的需求不匹配。 3.隐私问题:在搜索过程中,搜索引擎会收集用户的搜索历史、IP地址、浏览记录等敏感信息,可能被黑客攻击或泄露给第三方,造成用户隐私泄露。 4.版权问题:搜索引擎的搜索

Public @ 2023-06-11 09:50:12

搜索引擎对frame和iframe框架是否友好?

首先,Frame和iframe代码框架的意思是在当前页面中插入另一个页面,可以说是调用也可以说是使用代码插入。比方我们在的页面为a.html 对于a.html的页面我们存在不满意,但是为了达到某种目的。而再创建以个页面b.html 然后把b.html用js调用的方式或是其他div以及代码方式插入到a.html 。可以理解为b.html是当前页面中(a.html)的独立子页面,与父页面同时展示。需要

Public @ 2010-11-09 16:22:40

更多您感兴趣的搜索

0.467220s