Categories


Tags


百度搜索robots协议全新升级公告

  百度搜索robots协议全新升级公告

整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容及代码片段有且仅有借鉴意义。

  尊敬的用户:

为了更好地保护网站主的合法权益、提升百度搜索用户搜索体验,百度搜索于2020年10月27日发布了新版robots协议,主要特性包括:

1. 支持抓取控制与数据保护视角的并存

新增规定了两个特殊的抓取指令: allow-if-previously-blocked 和 noindex-if-previously-indexed,用于方便网站主在控制抓取行为的同时,保护网站内容的安全性。

2. 明细化规范

为了更好地支持抓取控制与数据保护视角的并存,新版robots协议增加了大量规定,对协议的细节进行了明细化,以便网站主使用。

3. 融入网站主实际生活

新版robots协议进一步增强了其实用性。协议中包括了比较常用的content-disposition和content-language指令,并对User-agent指令在临时禁止搜索方面的规定进行了补充。

4. 增加特殊对待百度机器人的规定

针对百度搜索所使用的机器人,新版robots协议增加了特殊规定,为百度机器人提供更好的抓取引导,以提高搜索结果的质量。

本次robots协议的升级,将为广大网站主提供更加丰富的抓取控制功能和更好的搜索体验,我们诚恳地邀请各位网站主按照新版规范,完善自身站点的robots协议文件。

祝愿您的网站越来越优秀!

百度搜索运营团队

2020年11月4日

Public @ 2023-06-20 23:50:02 整理自网络ChatGPT产生之内容,文本内容不具备参考意义,程序内容有且仅有借鉴意义。

哪些网站的目录需求运用robots.txt文件制止抓取

以下是一些可能需要使用robots.txt文件制止抓取的网站目录: 1. 敏感网站:包括医疗机构、政府机构、银行和其他敏感机构的网站。 2. 私人网站:包括个人博客、论坛和社交媒体账号。 3. 用户数据:包括个人信息、照片、视频和其他敏感数据。 4. 搜索引擎排除页面:包括不想在搜索引擎结果中出现的页面。 5. 网站目录:包括一些不需要搜索引擎索引的目录,如网站的管理员和内部页面。 6

Public @ 2023-06-13 02:50:20

Nofollow属性的介绍和使用

什么是Nofollow?我们知道,反向链接是Google PR值的主要计算指标。为了添加反向链接,SEO作弊者在论坛和博客等大量发布带无关链接的内容。这些垃圾链接的存在给搜索引擎对网页质量的评估造成一定程度的麻烦。Nofollow 正是Google、Yahoo、MSN 为了应对垃圾链接(Spam)引入的一个属性,此属性目前应该被广泛采用。如果A网页上有一个链接指向B网页,但A网页给这个链接加上了

Public @ 2012-07-18 16:08:51

Robots META标签的写法

Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。INDEX 指令告诉搜索机器人抓取该页面;FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;Robots Me

Public @ 2019-08-04 16:09:30

robots.txt:如何让搜索引擎不要抓取没用的页面

| 什么是robots文件?Robots是站点与spider沟通的重要渠道,是网站与搜索引擎爬虫之间的协议,告知哪些可抓取哪些不允许。| 为什么要做robots文件?网站上总有一些页面是禁止蜘蛛抓取的。例如:搜索页面、筛选页面、后台登录地址等。| 如何制作 robots文件?编写robots.txt文件并上传到网站根目录。| 制作 robots.txt注意事项● 所有搜索引擎则用星号表示● All

Public @ 2019-03-13 16:09:27

更多您感兴趣的搜索

0.470174s