Categories


Tags


为什么我的网站内一些不设链接的私密性网页,甚至是需要访问权限的网页,也会被搜狗收录?

sogou spider对网页的抓取,是通过网页与网页之间的链接实现的。

网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。

搜狗Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被搜狗收录,原因有两点:

A. 该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化。

B. 该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容。

如果您不希望这些私密性内容被搜狗收录,一方面可以通过robots协议加以限制;另一方面,也可以通过删除快照反馈给我们进行解决或者通过站长平台使用死链提交告知我们对其进行删除。


Public @ 2017-04-25 15:55:44

搜索引擎优化是自然和平衡的艺术

对于搜索引擎优化(SEO)来说,确实有一种自然和平衡的艺术。SEO的目标是通过优化网站的内容和结构,使其在搜索引擎结果页面(SERP)中获得更高的排名。然而,搜索引擎也在不断更新其算法和政策,以提供更优质、相关和有用的搜索结果。 搜索引擎优化需要遵循搜索引擎的准则和最佳实践,以确保网站被搜索引擎正确理解和评估。这包括使用适当的关键词,优化页面标题和元描述标签,改善网站速度和用户体验等。 然而,

Public @ 2023-07-21 03:00:27

网站不收录怎么办,这几个自测是否没做过?

其实站长们无非关注的就是网站收录情况、网站排名以及权重的问题,今天先给大家说下为什么网站不收录,这到底是什么原因?首先大家应该自测下,网站不收录的自身因素,是不是操作有误!4-5月百度更新,相信大家都发现索引收录以及排名变化很大,看网站数据就像过山车,太刺激了。本次更新针对网站模板内容以及更新情况比较敏感:首先说下网站模板,其实很多人仿站都是同一套模板,代码都懒得改,这样蜘蛛爬取看来都是类似站点。

Public @ 2022-08-23 15:55:17

如何让我的网站(独立网站或者blog)被百度收录?

百度会收录符合用户搜索体验的网站和网页。为促使百度Spider更快的发现您的站点,您也可以向我们提交一下您的网站的入口网址。提交地址是:http://zhanzhang.baidu.com/sitesubmit。您只需提交首页即可,无需提交详细的内容页面。百度的网页收录机制,只和网页价值有关,与百度推广等商业因素没有任何关联。

Public @ 2015-11-21 15:55:53

更多您感兴趣的搜索

0.496979s