Categories


Tags


Sitemap文件标准格式和大小说明

1、格式:

您可以采用如下三种格式的文件向360搜索提交Sitemap,文件编码可以是UTF-8或GBK:
1)标准的XML格式文件
2)文本格式文件
3)Sitemap索引文件(可同时包含多个Sitemap文件)

2、大小:
1)单个Sitemap文件:大小不超过10MB,且包含不超过50000个网址。如果网站所包含的网址超过50,000个,则可将列表分割成多个Sitemap文件,放在Sitemap索引中。
2)单个Sitemap索引文件:大小不能超过500M,如果超过请提交多个Sitemap索引文件接口。


各格式样式参见以下说明:

1、XML格式Sitemap说明
1) XML格式举例

   <?xml version="1.0" encoding="utf-8"?>
   <!-- XML文件需以utf-8编码-->
   <urlset>
      <!--必填-->
       <url>
           <!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->
           <loc>http://www.xxxxxx.html/000000.html</loc>
           <!--必填,URL长度限制在256字节内-->
           <lastmod>2012-12-01</lastmod>
           <!--更新时间标签,非必填,用来表示最后更新时间-->
           <changefreq>daily</changefreq>
           <!--更新频率标签,非必填,用来告知引擎页面的更新频率 -->
           <priority>0.8</priority>
           <!--优先权标签,优先权值0.0-1.0,用来告知引擎该条url的优先级-->
       </url>
       <url>
           <loc>http://www.xxxxxx.html/000001.html</loc>
           <lastmod>2012-12-01</lastmod>
           <changefreq>daily</changefreq>
           <priority>0.8</priority>
       </url>
   </urlset>
2) XML标签说明

标签名称

属性

标签说明

标签类型

标签限制

可选/必选

changefreq 

/

标示数据更新频率

字符串

有效值为:always、hourly、daily、weekly、monthly、yearly、never

可选

lastmod

/

标示数据最新一次更新时间

日期

时间格式为yyyy-mm-dd 

可选

loc 

/

标示该条数据的存放地址

url 

最小长度1个字符最大长度256个字符以"http://"开头

必选

priority

/

标示优先值

小数

[0.0 1.0](大于等于0小于等于1,保留一位小数)例如:<   priority >0.8< priority >

可选

url 

/

url地址的开始和结束

最多出现无限次

必选

urlset 

/

urlset用来标记整个文档的开头

/

必选

2、文本格式Sitemap说明

文本格式文件每一行写入一个网址,除此之外不包含其他信息。网址必须完整,网址中不能有换行,且包括协议头(http://)

3、使用Sitemap索引文件(对多个Sitemap文件)说明
1) 索引Sitemap举例
   <?xml version="1.0" encoding="UTF-8"?>
   <sitemapindex>
     <sitemap>
       <loc>http://www.example.com/1.xml</loc>
       <lastmod>2012-12-01</lastmod>
     </sitemap>
     <sitemap>
       <loc>http://www.example.com/2.xml</loc>
       <lastmod>2012-12-01</lastmod>
     </sitemap>
   </sitemapindex>
 
2) Sitemap索引文件标签说明:

属性

是否必填项

说明

<loc> </loc>

Sitemap位置标签,标示sitemap地址位置

<lastmod> </lastmod>

可填

Sitemap修改时间标签,标示最新修改时间

<sitemap> </sitemap>

Sitemap信息说明,标示某个sitemep的信息

<sitemapindex></sitemapindex>

标示索引文件中所有sitemap的信息


Public @ 2010-11-01 16:11:51

创建Sitemap时有哪些注意事项?

第一,一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。第二,一个站点支持提交的sitemap文件个数必须小于5万个,多于5万个后会不再处理,并显示“链接数超”的提示。第三,如果验证了网站的主域,那么Sitemap文件中可包含该网站

Public @ 2009-04-13 16:09:43

内部链接nofollow控制权重分布

Nofollow属性推出以后,Matt Cutts多次说过,nofollow既可以用在论坛,博客等的留言中,代表这些链接不是站长能控制和背书的,也可以用在某些内部链接,以达到控制内部链接权重和PR流动及分布的目的。最常见的应用是在网站联系我们,隐私权政策,用户条款等链接上。这些网页往往都是整站有链接,如果没有使用nofollow,整站的链接权重都会平等的流动到这些网页上。而像隐私权政策这些网页一般

Public @ 2017-01-19 16:08:47

站点地图注意要点

真实有效站点地图的主要目的是方便搜索抓取的,如果地图存在死链或坏链,会影响网站在搜索引擎中网站权重的,所以要仔细检查有无错误的链接地址,提交前通过站长工具,检查网站的链接是否有效。简化站点地图不要出现重复的链接,要采用标准W3C格式的地图文件,布局要简洁,清晰,如果地图是内容式地图,每页不要超过100内容个链接,采用分页的形式,逐一开来。更新建议经常更新站点地图,便于培养搜索爬虫爬行的频率。经常有

Public @ 2016-06-24 16:09:53

更多您感兴趣的搜索

0.505157s