Categories


Tags


搜狗资源平台-Sitemap提交帮助

功能说明

提交Sitemap工具可以向搜狗提交网站Sitemap文件,帮助搜狗spider抓取您的网站。目前Sitemap采用邀请制,您可在此工具下选择已验证的站点,并观察站点是否已被邀请。

Sitemap提交后,搜狗搜索会根据Sitemap了解网站中的网址及关于每个网址的其他元数据(上次更新的时间、更改的频率等)。

注意事项

1.sitemap采用邀请制,当您的网站存在原创或不可替代内容或不能被搜狗spider正确抓取时,才会开通sitemap权限。若您的站点满足上述条件但并没有sitemap权限,可发送邮件至申请。

2.提交sitemap仅支持txt、xml、xml一级索引三种格式文件。

3.每个文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,请将列表分割成多个文本文件,多于5万个后会不再处理;文件个数不得超过100个,即提交sitemap的url不超过5000,000条。

4.请您提供信息详情页,原创内容等优质、重要内容页面,我们会根据提交的url质量选择性收录优质网页。

5.对于搜索结果页,转载,动态加载的搜索结果页等页面我们不建议提交sitemap收录并且可能不收录。

6.如果您通过sitemap提交有作弊嫌疑的url,搜狗将进行严厉的处罚措施并且取消sitemap权限。

7.搜狗spider有自身的爬取规则,sitemap只是帮助搜狗spider更加智能地收录您的站点,即提交Sitemap并不直接影响网站收录,索引以及排名。

工具使用方法

步骤一Sitemap制作

一.xml格式

<?xml version="1.0" encoding="utf-8"?>

<!-- XML文件需以utf-8编码 -->

<urlset>

<url>

<!-- 必填,是具体某个链接的定义入口,每一条数据都要用<url>和</url>包含在其中 -->

<loc>http://www.yoursite.html/yoursite.html</loc>

<!-- 必填,URL链接地址,长度不得超过256字节 -->

<lastmod>2013-05-01</lastmod>

<!-- 选填,该链接的最后更新时间 -->

<changefreq>daily</changefreq>

<!-- 选填,此链接可能会出现的更新频率,

有效值为:always,hourly,daily,weekly,monthly,yearly,never -->

<priority>0.8</priority>

<!-- 选填,此链接相对于其他链接的优先权比值,定于0.0-1.0之间 -->

</url>

<!-- 另一条数据 -->

</urlset>

二.txt文本格式

http://www.example1.com/111.html

http://www.example2.com/222.html

http://www.example3.com/333.html

文本文件每行都必须有一个网址,网址中不能有换行,网址要完整,包括 http(s)://,且不包含除网址以外的信息,需使用UTF-8 编码或GBK编码。

三.Sitemap索引格式

如需提交多个Sitemap文件,可使用Sitemap索引文件:

<?xml version="1.0" encoding="UTF-8"?>

<sitemapindex>

<sitemap>

<loc>http://www.example.com/1.xml</loc>

<!-- 必填,识别Sitemap的位置 -->

<lastmod>2013-05-01</lastmod>

<!-- 选填,该链接的最后更新时间 -->

</sitemap>

<!-- 另一条数据 -->

</sitemapindex>

步骤二配置sitemap文件

按要求制作好Sitemap文件后将Sitemap文件放置在网站根目录下:

步骤三提交sitemap

完成Sitemap的制作和配置后即可使用Sitemap提交工具进行提交。

步骤四观察状态

一.提交成功

已提交:代表您的sitemap文件已提交成功,但文件尚未处理。

等待:代表您的sitemap文件已解析完毕,等待抓取。

正常:代表您的sitemap文件在抓取中。

等待更新:代表您的sitemap文件已处理完毕,等待您文件中更新新链接。

您还可以通过网站分析工具查看搜狗对您站点的收录索引量,观察Sitemap的提交效果。

二.提交失败

若在Sitemap提交工具使用中发生错误,请确认是否为以下原因:

Sitemap文件地址无法访问,请确认提交的地址可正常访问。

Sitemap文件地址与提交站点不是包含关系,请确认提交的地址属于已验证的站点,并且文件放置在根目录下。

相同的Sitemap文件地址已经添加过,请勿重新添加。

提交的Sitemap格式不规范,请检查该数据格式,修改后重新提交。

对Sitemap提交有其他问题?可以向提交反馈。

来源:搜狗资源平台


Public @ 2021-11-12 16:09:46

如何利用robots.txt对wordpress博客进行优化

1、禁止索引 /wp-admin:用于管理wordpress网站的控制面板,不允许百度收录,避免流量分散。 User-agent: * Disallow: /wp-admin/ 2、禁止索引/wp-includes:WordPress中的核心文件,利用文件禁止百度爬行,提高访问速度。 User-agent: * Disallow: /wp-includes/ 3、禁止索引/wp-c

Public @ 2023-03-02 23:00:12

内部链接(站内链接)的优化

大家都知道外部链接对网站排名的重要性,同时也建议不要忽略了站内链接的作用。外部链接大部分情况下是不好控制的,而且要经过很长时间的积累,内部链接却完全在自己的控制之下,是SEO手中可优化的重点内容之一。下面列几个优化站内链接的技巧和经验。建立网站地图稍有规模的网站,比如几百页以上,只要有可能,最好给网站建一个完整的网站地图sitemap。同时把网站地图的链接放在首页上,使搜索引擎能很方便的发现和抓取

Public @ 2017-11-09 16:11:23

什么是ETag?ETag作用有哪些

ETag 是一种用于标识网络资源的字符串。ETag 是由服务器为每个资源生成的,并且在资源内容发生变化时会改变。 ETag 主要用于缓存控制和条件请求。以下是 ETag 的一些作用: 1. 缓存验证:当客户端请求资源时,可以在请求头中通过 If-None-Match 字段将上一次请求中得到的 ETag 值发送给服务器。服务器可以根据这个值来判断资源是否发生了变化。如果 ETag 值匹配,服务器

Public @ 2023-07-30 17:50:26

什么是Sitemap

Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好

Public @ 2013-10-13 16:09:44

更多您感兴趣的搜索

0.663240s