Categories


Tags


为什么我的网站中的一些私密网页也会被百度收录?

Baiduspider对网页的抓取,是通过网页与网页之间的链接实现的。

网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。

百度Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被百度收录,原因有两点:

  A. 该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化

  B. 该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容

如果您不希望这些私密性内容被百度收录,一方面可以通过Robots协议加以限制;另一方面,也可以通过反馈中心反馈给我们进行解决。


Public @ 2020-06-19 15:55:52

关于百度快照问题的若干说明

一直以来,部分站长对百度快照的更新时间都存在一些误解,认为网站的快照更新时间与网站的权重状态存在一定关系,快照更新越频繁,网站的权重越高,反之,越低。而实际上,网站快照的更新频率与权重并不存在任何直接的关系。百度快照为什么会更新?首先,需要澄清一下网页的抓取频率和快照的更新频率是完全不同的两个概念。每一个被百度收录的网站,baiduspider都会根据其网站内容更新的频率不断的检查有无新网页产生,

Public @ 2015-06-17 15:34:26

百度搜索结果可能无法正常访问?

作为AI语言模型,我不能确定具体情况,但一些可能的原因是: 1. 网络连接问题:如果网络不可靠或不稳定,可能会导致无法访问某些网站或搜索结果。 2. 屏蔽或限制访问:一些网站或搜索结果可能被屏蔽或限制访问,这通常是由于政府规定、地区限制或版权问题等。 3. 服务器问题:某些网站或搜索结果的服务器可能出现故障或崩溃,这会导致无法访问。 4. 恶意软件:一些恶意软件可能会攻击搜索结果或网络连接

Public @ 2023-03-29 06:00:18

新网站上线一个月都没有被收录的原因及处理方式

一、原因: 1. 站点新建时间不够长:尽管Google等搜索引擎可以收录新的网站,但是它们并不会立即做出反应,因此,新建的网站一般需要等待一段相当长的时间才能被收录。 2. 网站内容无优势:网站内容不足,比如网站只有十几个页面,内容不够丰富,搜索引擎收录率会大打折扣。 3. 缺乏外链:搜索引擎获取网站信息主要依靠外部来源,如用户分享或社交媒体,而不是主要依靠网站内部的文章。如果网站缺乏外链,搜

Public @ 2023-03-04 15:00:34

百度为什么不收录我的站点?

搜索引擎为什么不收录我的站点呢?因为搜索引擎进行网站索引和排名过程是完全程序自动化的,所以:搜索引擎不会因为一些细小的网站错误而直接删除你的站点,如:某个页面出现乱码。搜索引擎不会因为主观问题而删除你的站点,如:网页上出现对百度不友好的言词。你的情况绝不是特例,其他的网站也会出现你这个情况。只要符合搜索引擎的索引条件,一般情况下是会被收录的。对于新站,百度一般需要一周到一个月的时间才能在搜索结果上

Public @ 2014-11-08 15:55:30

更多您感兴趣的搜索

0.511671s