Categories


Tags


提交Sitemap

Sitemap(站点地图)是一种文件,站长可通过该文件列出网站上的网页,将网站内容的组织结构告知搜索引擎。

神马等搜索引擎网页抓取工具会读取此文件,以便更加智能地抓取网站内容

理想状况下,如果您的网站网页间关联得当,神马的网页抓取工具便能够发现其中的大多数网页。即便如此,提交站点地图仍有助于搜索引擎更加有效地抓取网站,尤其是当网站符合以下某个条件时:

1.网站为新建网站且指向该网站的外部链接不多。搜索引擎的网页抓取工具通过跟踪网页之间的链接来抓取网页,如果没有其他网站链接到您的网页,可能不会发现您的网页。

2.网站规模很大。 在这种情况下,神马的网页抓取工具可能会在抓取时漏掉部分新网页。

3.网站中大量内容页之间互不关联或缺少有效链接。 如果您的网站网页没有自然地相互引用,那么您可以在站点地图中列出这些网页,以确保搜索引擎不会漏掉您的网页。

需要注意的是,神马搜索会按正常流程分析、处理Sitemap,但不保证一定会抓取及索引您提交的所有网址,不保证其在搜索结果中的排名。

Sitemap格式:

神马搜索支持的Sitemap文件包括标准xml文件和索引型xml文件。标准xml文件最多包含10,000条url,如果url超过10,000条可采用索引型xml文件,索引型xml限定最多不超过三层。

标准xml文件格式示例:

<?xml version="1.0" encoding="utf-8"?>

<!-- XML文件需以utf-8编码-->

<urlset>

<!--必填-->

<url>

<!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->

<loc>http://m.domain.com/abc.xhtml</loc>

<!--必填,URL长度限制在256字节内-->

<lastmod>2014-05-01</lastmod>

<!--更新时间标签,非必填,用来表示最后更新时间-->

<changefreq>daily</changefreq>

<!--更新频率标签,非必填,用来告知引擎页面的更新频率 -->

<priority>0.5</priority>

<!--优先级标签,优先级值0.0-1.0,用来告知引擎该条url的优先级-->

</url>

<url>

<loc>http://m.domain.com/123.xhtml</loc>

<lastmod>2014-05-01</lastmod>

<changefreq>daily</changefreq>

<priority>0.8</priority>

</url>

</urlset>

索引xml文件格式示例:

1.顶层Sitemap格式

<sitemapindex>

<sitemap>

<loc>

http://www.abc.com/sitemap_v2/detail_new/index/index_1.xml

</loc>

<lastmod>2013-12-18 12:59:12</lastmod>

<!--更新时间标签,必填,用来表示xml文件最后更新时间-->

</sitemap>

</sitemapindex>

2.中间层Sitemap格式(非必要,视url数量而定)

<sitemapindex>

<sitemap>

<loc>

http://www.abc.com/sitemap_v2/detail_new/1/1.xml

</loc>

<lastmod>2013-12-18 12:59:12</lastmod>

</sitemap>

</sitemapindex>

3.内容层Sitemap格式

参照标准xml文件格式示例

来源:神马站长平台


Public @ 2022-11-08 16:09:48

大型网站如何做301重定向的策略

大型网站进行301重定向的策略可以根据以下步骤进行: 1.确定需要重定向的页面:首先需要确定哪些页面需要进行重定向,通常情况下包含以下几类:网站结构调整、页面风格更改、网站域名更变等。 2.建立一个完整的重定向清单:将需要重定向的页面以及它们的重定向目标URL列入一个清单。 3.执行重定向:将清单中的页面进行301重定向,确保所有重定向都指向正确的目标URL。 4.测试重定向:进行重定向测

Public @ 2023-06-21 01:00:15

搜狗资源平台-Sitemap提交帮助

功能说明提交Sitemap工具可以向搜狗提交网站Sitemap文件,帮助搜狗spider抓取您的网站。目前Sitemap采用邀请制,您可在此工具下选择已验证的站点,并观察站点是否已被邀请。Sitemap提交后,搜狗搜索会根据Sitemap了解网站中的网址及关于每个网址的其他元数据(上次更新的时间、更改的频率等)。注意事项1.sitemap采用邀请制,当您的网站存在原创或不可替代内容或不能被搜狗sp

Public @ 2021-11-12 16:09:46

ETag使用效果对比&;经验分享

ETag是一种HTTP协议中的实体标签,用于标记某个资源的版本号。它在浏览器与服务器之间起到了缓存控制的作用,提高了网页的加载速度和用户的浏览体验。下面是ETag使用效果对比和经验分享: 1. 提高缓存命中率:当用户再次访问同一资源时,浏览器会向服务器发送请求,服务器会比较资源的ETag值与请求头中的If-None-Match值是否一致。如果一致,则返回状态码304 Not Modified,表

Public @ 2023-07-21 06:50:49

Sitemap文件标准格式和大小说明

Sitemap文件标准格式: Sitemap文件通常是一个以XML格式编写的文本文件,其中包含URL信息和其他相关数据。Sitemap文件主要包含以下元素: 1. URL元素:用于指定页面的网址,并包含可选的数据,如最近的修改日期、相对于站点的相对权重等。 2. loc元素:为URL元素的子元素,用于指定页面的网址。 3. lastmod元素:为URL元素的子元素,用于指定页面的最近修改日期。

Public @ 2023-04-29 02:50:12

更多您感兴趣的搜索

0.612524s