Categories


Tags


百度Sitemap协议

百度Sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的Sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。百度Sitemap支持标准的XML格式Sitemap文件以及文本格式的Sitemap文件,如果您有多个Sitemap文件,还可以使用Sitemap索引文件提交。每个Sitemap文件最多可包含50,000个网址,并且应小于 10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。

XML格式Sitemap说明:

XML格式举例:

XML格式举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <urlset>

        <url>

          <loc>http://www.example.com/</loc>

          <lastmod>2010-01-01</lastmod>

          <changefreq>always</changefreq>

          <priority>1.0</priority>

        </url>

        <url>

          <loc>http://www.example.com/1.html</loc>

          <lastmod>2010-02-14</lastmod>

          <changefreq>weekly</changefreq>

          <priority>0.8</priority>

        </url>

   </urlset>

索引Sitemap举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <sitemapindex>

     <sitemap>

       <loc>http://www.example.com/1.xml</loc>

       <lastmod>2010-01-01</lastmod>

     </sitemap>

     <sitemap>

       <loc>http://www.example.com/2.xml</loc>

       <lastmod>2010-02-01</lastmod>

     </sitemap>

   </sitemapindex>

具体格式及规范说明请查看:http://zhanzhang.baidu.com/site/format

XML标签说明:



百度Sitemap协议-第1张图片-SEO自学网


文本格式Sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。

文本文件格式举例:

http://www.example.com/catalog?item=1

http://www.example.com/catalog?item=2

此文本文件需要遵循以下指南:


?         文本文件每行都必须只有一个网址。网址中不能有换行。


?         您必须指定完整的网址,包括“http://”。


?         每个文本文件最多可包含50,000个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过50,000个,则可将列表分割成多个文本文件,然后分别添加每个文件。


?         文本文件需使用UTF-8编码或GBK编码。


?         文本文件不应包含网址列表以外的任何信息。


?         您可以使用gzip压缩Sitemap文件,以减少带宽要求;但是压缩前的Sitemap文件应小于10MB(10,485,760字节)。

使用Sitemap索引文件(对多个Sitemap文件)说明:

使用Sitemap索引文件必须:


?         以开始标记作为开始,以结束标记作为结束。


?         每个Sitemap包含一个条目作为 XML 父标记。


?         每个父标记包含一个子标记条目。


Sitemap索引文件标签说明:



百度Sitemap协议-第2张图片-SEO自学网



Public @ 2021-10-21 16:11:58

robots文件中屏蔽的为什么还可以收录?

robots.txt 是一个标准,它通过提供一些规则,告诉搜索引擎爬虫哪些网页可以被爬取,哪些网页不应该被爬取。但是,一些搜索引擎爬虫可能会忽略这些规则,直接抓取它们想要的网页。 此外, robots.txt 文件的存在只是一个建议而不是命令。在一些情况下,搜索引擎爬虫可能会收录被 robots.txt 文件所屏蔽的网页,这有可能是因为发布这个网页的人想要让它被收录,也有可能是因为机器人误解了

Public @ 2023-04-24 07:50:07

robots.txt使用教程

用几个最常见的情况,直接举例说明:1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。2. 禁止所有SE收录网站的某些目录:User-agent: *Disallow: /目录名1/Disallow: /目录名2/Disallow: /目录名3/3. 禁止某个SE收录本站,例如禁止百度:User-agent: BaiduspiderDisallow: /4. 禁止所有SE收录

Public @ 2013-01-15 16:09:31

Sitemap协议类型及包含范围

Sitemap协议的类型有三种: 1. XML Sitemap:用于搜索引擎的索引。包含了网站中所有重要的URL地址,可以帮助搜索引擎更好地索引和排名网站。 2. Image Sitemap:用于搜索引擎的索引图片。包含了网站中的图片URL地址和相关信息,可以使搜索引擎更好地索引和展示网站内的图片。 3. Video Sitemap:用于搜索引擎的索引视频。包含了网站中的视频URL地址和相关

Public @ 2023-04-03 02:50:13

站点地图的重要性

1、搜索引擎每天都是让爬虫在互联网爬行来抓取页面,站点地图的作用就是给爬虫爬行构造了一个方便快捷的通道,因为网站页面是一层一层的链接的,其中可能会存在死链接的情况,如果没有站点地图,爬虫爬行在某个页面就因死链接爬行不了,那么就不能收录那些断链接的页面。2、站点地图的存在不仅是满足搜索引擎爬虫的查看,更多是方便网站访客来浏览网站,特别是例如门户型网站由于信息量太多很多访客都是通过站点地图来寻找到自己

Public @ 2010-08-07 16:09:53

更多您感兴趣的搜索

0.478881s