Categories


Tags


Google的奇怪规则:URL不能以.0结尾

前两天SEOMoz发现和解决了一个很奇怪的Google收录问题。

SEOMoz有一个网页,是关于他们举办的Web 2.0大奖(Web 2.0 Awards)。URL是:

http://www.seomoz.org/web2.0

这个奖在网上还挺受欢迎,链接很多,URL是PR7。而且一直以来在Google搜索”Web 2.0 Award”时都排在第一位。

但前几天SEOMoz发现搜索Web 2.0 Award时,这个页面从Google消失了。排在最前面的是一个更深一层的页面。

SEOMoz也弄不清是这么回事。所以Rand联系了Google里面认识的人,Google的人建议最好把URL改成不以.0结尾。

注意看SEOMoz这个页面URL,后面没有跟着一个斜线/。在大部分情况下,URL结尾没有典型文件扩展名如.html,.php等时,URL会被当作目录,目录名后面没有斜线时,服务器会在后面自动加上一个斜线。比如SEO每天一贴,如果用户直接打开:

https://www.seozac.com/

或者有其他网页链接到上面这个URL,服务器都会自动做一个301转向到:

https://www.seozac.com/

由于某种原因,SEOMoz的这个URL并没有做301转向自动在目录后加上斜线,也就是说URL还是以.0结尾:

http://www.seomoz.org/web2.0

浏览器和蜘蛛就把这个URL当作了文件名,这个文件的扩展名(或者说文件类型)是.0。而.0文件Google拒绝收录,就像.exe文件一样。

SEOMoz做了很多调查,发现页面没被收录问题确实是因为这个以.0结尾的URL。在网上找不到以.0结尾的文件被收录在Google数据库中。像以下这些文件在Google都没收录,但雅虎有收录:

en.wikipedia.org/wiki/Windows_1.0

en.wikipedia.org/wiki/Web_2.0

http://en.wikipedia.org/wiki/Die_Hard_4.0

drupal.org/drupal-5.0

keznews.com/3799_Vista_Transformation_Pack_8.0_Final_-_VTP_8.0

en.wikipedia.org/wiki/BASIC_8.0

drupal.org/drupal-6.0

en.opensuse.org/OpenSUSE_11.0

www.shopping.com/xGS-Illustrator_11.0

www.mythtv.org/wiki/index.php/Opensuse_11.0

www.shopping.com/xGS-Suse_9.0

en.wikipedia.org/wiki/Mac_OS_X_10.0

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0

而非常相似的下面这些URL,Google就有收录:

en.wikipedia.org/wiki/Web_2

drupal.org/drupal-5.0-beta1

http://keznews.com/3799_Vista_Transformation_Pack_8_0_Final_-_VTP_8_0

drupal.org/drupal-6.0-beta1

www.mythtv.org/wiki/index.php/Opensuse_10.3

www.mythtv.org/wiki/index.php/Opensuse_10.2

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3

比较一下这两个URL,域名,链接深度等几乎都没什么区别,唯一的区别就是URL结尾的不同:

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3 收录

en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0 没收录

SEOMoz发现了这个问题后,发了一篇帖子。很快Matt Cutts也回了篇帖子,做出了回复和调整。Matt Cutts说,是因为连到URL

http://www.seomoz.org/web2.0

的链接足够多时使Google认为它是应该被收录的那个URL版本,但Google又不收录.0文件,所以SEOMoz的这个页面被删除了。

Matt Cutts还提到一个小技巧,要检查某种文件名是否会被Google中被收录,有一个很简单的指令如:

filetype:exe

上面的搜索结果可以看到,没有直接以.exe结尾的URL被收录,也就是说.exe文件Google不收录。

同样.0文件Google一直到两天前还都不收录。不过Matt Cutts看到SEOMoz的这个帖子后,与工程师重新审视了一下现在以.0结束的URL,肯定也不都是垃圾页面(可能以前大部分是),所以对Google收录算法做了一定调整,重新开始收录.0文件。其实很多网页以.0结束,并不是因为文件类型,而是像SEOMoz那样,在想写Web2.0时,很巧合的以.0结尾而已。

现在搜索一下的话,已经可以看到SEOMoz的这个Web2.0奖网页已经重新被收录了:

第一,这种细节问题,不碰到还真想象不到。

第二,认识人好办事。

第三,Google经常也从善如流。

来源:seo每天一贴 Zac 昝辉


Public @ 2013-10-31 15:34:40

讲3个SEO相关小问题!权重+收录+15天定律!

由于最近在忙另外一个项目,文章就耽误了,最近又有徒弟相关问题,还有一些同学催更。针对徒弟们问题,我们再来给大家统一讲解!一、15天定律(如何过)讲3个SEO相关小问题!权重+收录+15天定律! SEO优化 经验心得 第1张15天定律徒弟新上了一个站、说最近开始掉收录、蜘蛛都是正常蜘蛛,抓取也是正常抓取,就只是收录掉,曲线也有点下降。讲3个SEO相关小问题!权重+收录+15天定律! SEO优化 经验

Public @ 2010-01-22 15:27:11

外贸SEO难做吗?了解这些SEO优化关键因素,其实很简单!

对于外贸SEO来说针对于完全不同的google优化,有些人心生忌惮,以为非常复杂,非常难做,毕竟语言就是一大难关。小编以多年的外贸营销经验告诉大家,其实外贸SEO做起来很简单,简单到只要用心就能够出效果。1、服务器的选择先不说结构设计、内容、外链这块,支持这些内容的前提就是服务器。就好比说一个人想要会走、会跑,前提是要有一双健康的双腿。所以说外贸网站优化之前需要选择好的服务器。不要因为便宜而选择国

Public @ 2011-02-17 15:25:20

PC端收录移动端不收录是怎么回事?怎么解决

PC端和移动端之间的差异主要来自于页面内容和结构,可能导致移动端页面被搜索引擎排除在搜索结果之外。例如,移动设备上的页面可能会使用不同的HTML和CSS代码,从而影响页面的可访问性和可读性。此外,页面加载速度和网站安全性等因素也可能影响搜索引擎的决策。 要解决此问题,可以采取以下步骤: 1.正确设置移动设备的优化。创建移动友好的网站,并确保它可以在各种设备上进行访问。使用响应式设计或动态网站,

Public @ 2023-04-17 16:50:42

提高网站内容收录四大方法

1、网站提高收录的10种方法①保持规律的更新②保持原创度和内容长度③站上添加最新发布模块或者最新的更新模块④已收录的页面锚文本给未收录的页面⑤验证百度资源平台,设置好网站类型⑥手动在搜索引擎上做主动推送⑦每天手工的更新Sitemap⑧未收录页面的链接展示在首页一段时间⑨站外给未收录的页面引蜘蛛⑩百度资源平台诊断未收录的页面2、日志分析,查看蜘蛛抓取情况下载网站日志,查看蜘蛛抓取情况,如果返回值20

Public @ 2017-05-07 15:55:30

更多您感兴趣的搜索

0.511473s