Categories


Tags


360搜索对Robots协议的扩展

360搜索根据站长们的反馈,会陆续推出扩展的Robots协议命令。这些命令将能帮助站长们提高和360搜索爬虫沟通的效率,减少站长们维护Robots协议文件的技术成本。

360搜索首个扩展命令是:indexpage,站长们可以使用此命令告知360搜索哪些网页经常更新。360搜索会根据站长的指示以及自己的算法,智能调整爬虫抓取频率,实现对您网站新内容的更高频率抓取。

在命令中可以使用*、$等通配符。

示例:

使用通配符的

Indexpage: http://bbs.360safe.com/forum-*-1.html$

Indexpage: http://ent.sina.com.cn/*/roll.html

不用通配符的:

Indexpage: http://roll.tech.sina.com.cn/internet_all/index.shtml

Indexpage: http://roll.tech.sina.com.cn/it/index.shtml

Indexpage: http://roll.tech.sina.com.cn/tele/index.shtml

Indexpage: http://roll.tech.sina.com.cn/discovery/index.shtml

Indexpage: http://roll.tech.sina.com.cn/elec/index.shtml


Public @ 2019-02-15 16:09:33

404页面该怎么做?

404页面是当用户请求的页面不存在时显示的页面。以下是创建一个好的404页面的要点: 1. 提示用户页面不存在:在页面上明确告诉用户,请求的页面不存在,这是最重要的 2. 提供导航链接:尽可能提供有用的导航链接以帮助用户找到他们可能想要查看的类似内容的链接 3. 提供搜索栏:在页面上提供搜索栏可让用户搜索相关内容或页面 4. 不要让它看起来太“错误”:确保页面看起来友好,避免使用太多的技术

Public @ 2023-06-09 15:50:15

网站结构优化:所谓F型结构是指什么

| 网站结构的种类:F型结构:网站的大部分页面内容展示方式如字母F一样。树状结构:指的是页面的归属关系。例如:首页->一级分类->二级分类->内容页面。| 为什么要用优化网站结构?符合用户使用习惯对SEO更友好| 案例展示:工业产品/服务类:williamlong.info教程/文章:seowhy.com/faq博客/资讯:gaosan.com(搜外网)

Public @ 2013-01-10 16:12:10

robots.txt:如何让搜索引擎不要抓取没用的页面

| 什么是robots文件?Robots是站点与spider沟通的重要渠道,是网站与搜索引擎爬虫之间的协议,告知哪些可抓取哪些不允许。| 为什么要做robots文件?网站上总有一些页面是禁止蜘蛛抓取的。例如:搜索页面、筛选页面、后台登录地址等。| 如何制作 robots文件?编写robots.txt文件并上传到网站根目录。| 制作 robots.txt注意事项● 所有搜索引擎则用星号表示● All

Public @ 2019-03-13 16:09:27

更多您感兴趣的搜索

0.645593s