Categories


Tags


头条搜索站长平台-sitemapindex文件要求

sitemapindex文件根节点必须是<sitemapindex>。

sitemapindex文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>。

sitemapindex文件禁止使用命名空间,禁止使用规定之外的属性。

sitemapindex文件大小不得超过5M,sitemap节点数量不超过1W。

必须保证sitemap中所有URL可访问,且内容符合XML数据文件规范。

1.XML数据文件规范

数据XML文件的根节点必须为<DOCUMENT>

数据XML文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>

数据XML文件禁止使用命名空间,禁止使用规定之外的属性。

数据XML单个文件大小不得超过10M(必须满足),item数目不得超过1W。

除根节点之外的其它节点,标签名建议采用英文小写字母及下划线‘_’

数据节点中包含转义字符,请使用CDATA

对于数组型的节点,请在只有一个子节点时保证和多个节点时的结构相同

2.Txt格式规范

Txt文件编码必须为UTF-8

Txt文件大小不得超过10M,每个文本文件最多可包含5w个网址

Txt文件每行都必须有一个网址,网址中不能有换行

Txt文件中不能包含网址列表以外的任何信息

- 必须书写完整的网址,包含http/https

- 必须保证Txt文件中所有URL 可访问,且内容符合Txt数据规范

注意事项

提交的sitemap有作弊嫌疑的url,头条将进行严厉的处罚措施并取消相关权限

头条spider有自身的爬取规则,sitemap只是帮助头条spider更好的收录您的网站,提交sitemap并不会决定网站收录或者排名。

来源:头条搜索站长平台


Public @ 2013-06-03 16:09:47

robots使用误区

1. 不需要在每个页面都添加robots.txt文件:robots.txt文件只是一份给搜索引擎看的指令,如果不希望搜索引擎从该页面抓取数据,那么每一页都是可以不用添加robots.txt文件的。 2. 不能用于移动设备:robots.txt文件可用于搜索引擎爬虫,但也可以在部分机型的移动设备上进行yu处理,可以用于控制移动设备的蜘蛛爬行进行内容抓取。 3. 不应该将robots保存到公用

Public @ 2023-03-03 14:00:19

什么是HTML版本网站地图?网站地图有什么作用?

HTML版本网站地图指的是一种包含网站所有页面的列表,可以直接在网站上进行访问和浏览的网页。它以HTML标记语言格式编写,被搜索引擎和爬虫程序识别,方便这些程序对网站内部链接结构的探索和索引。 网站地图主要有以下作用: 1.帮助搜索引擎和爬虫程序更好地索引网站,提高网站在搜索引擎中的排名; 2.方便用户快速找到需要的信息,提高用户体验; 3.展示网站的结构和内容,提升网站的可视性和可访问性

Public @ 2023-03-28 22:00:20

站点地图是什么

站点地图是一个网站所有链接的容器。很多网站的连接层次比较深,爬虫很难抓取到,站点地图可以方便爬虫抓取网站页面,通过抓取网站页面,清晰了解网站的架构,网站地图一般存放在根目录下并命名sitemap,为爬虫指路,增加网站重要内容页面的收录。站点地图就是根据网站的结构、框架、内容,生成的导航网页文件。站点地图对于提高用户体验有好处,它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。站点地图

Public @ 2013-03-27 16:11:51

什么是移动Sitemap协议,如何提交移动Sitemap协议

移动Sitemap协议是一种网站地图协议,用于帮助搜索引擎更好地理解和索引移动网站的内容。它包含移动网站中所有网页的URL列表、页面的更新频率和相关元数据等信息。 要提交移动Sitemap协议,需要遵循以下步骤: 1. 创建一个XML格式的移动Sitemap文件,包含移动网站中所有网页的URL列表,以及这些页面的描述、更新频率和优先级等信息。 2. 上传Sitemap文件到您的网站根目录下,

Public @ 2023-05-27 09:50:12

更多您感兴趣的搜索

0.555723s