Categories


Tags


如何使用Robots避免蜘蛛黑洞?

蜘蛛黑洞:

蜘蛛黑洞指的是网站通过极低的成本运营,制造出大量和内容相识但参数不同的动态URL ,像一个无限循环的“黑洞”将蜘蛛困住,蜘蛛花费太多的时间在网站,浪费了大量资源抓取的网页为无效网页。

如果你的网站存在蜘蛛黑洞现象,尽快的处理好,蜘蛛黑洞不利于网站的收录,也会影响搜索引擎对网站的评分。

如何使用Robots避免蜘蛛黑洞?

如何利用Robots避免蜘蛛黑洞操作:

普通的筛选结果页基本都是使用静态链接,比如:

http:// bj.XXXXX. com/category/zizhucan/weigongcun

当用户选择不同排序后,会自动生成带有不同参数的动态链接,即使选择是同一种排序条件,生成的参数也有不同的,比如:

http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

把带有不同参数的结果排序页面使用robots规则拒绝,告知搜索引擎,让搜索引擎只抓取筛选结果页,为用户和搜索引擎节省时间。

Robots文件写法中Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址,通过这种方式,如果网站的无效页面不希望被搜索引擎收录,可以屏蔽掉低质量的页面,告诉搜索引擎哪些页面可以抓取,有效的避免黑洞的形成。

来源:搜外网


Public @ 2014-02-24 16:09:26

二级域名如何绑定一级目录

二级域名如何绑定一级目录1、在 DNS 域名管理后台域名转发里,设置二级域名转发至你的目标一级目录。2、提交后,在主机记录列表会添加一个你刚才提交的二级域名,其指向的IP地址与主域名不同。比如,新网互联指向的是:124.42.122.46。这个是正确的。3、不管你使用的虚拟主机,还是独立服务器。只要主域名可以正常访问即可,不需要在虚拟主机或独立服务器上再设置二级域名。二级域名如何绑定一级目录基础知

Public @ 2015-08-05 16:11:39

百度搜索robots协议全新升级公告

Robots是站点与spider沟通的重要渠道,站点通过robots文件声明本网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。9月11日,百度搜索robots全新升级。升级后robots将优化对网站视频URL收录抓取情况。仅当您的网站包含不希望被视频搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。如您

Public @ 2017-06-06 16:09:00

头条搜索Robots匹配说明

在今日头条中,根据用户输入的关键字进行搜索,系统针对关键字进行多维度搜索,内容形成聚合后,统一展示给用户。同时,今日头条采用了多种Robot来爬取和抓取用户的相关关键字,然后精确的匹配给用户,技术上主要是Robot学习算法,和文本分析算法。 Robot算法主要是爬取网站上的关键字,并根据搜索词语进行匹配。Robot算法还可以根据语义分析算法来进行分析和匹配,优化搜索效果。Robot算法也可以

Public @ 2023-02-26 03:54:31

robots文件之前屏蔽了蜘蛛,现已开放,如何更新快照

一些域名之前通过robots.txt文件屏蔽了蜘蛛,后来对搜索引擎开放了,但搜索结果里,还是显示以下内容:“由于该网站的robots.txt文件存在限制指令(限制搜索引擎抓取),系统无法提供该页面的内容描述。”解决办法:在百度上搜索该域名,在搜索结果页面的末尾,点击用户反馈。来源:搜外网

Public @ 2011-07-02 16:09:24

更多您感兴趣的搜索

0.592922s