Categories


Tags


百度Sitemap协议

百度Sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的Sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。百度Sitemap支持标准的XML格式Sitemap文件以及文本格式的Sitemap文件,如果您有多个Sitemap文件,还可以使用Sitemap索引文件提交。每个Sitemap文件最多可包含50,000个网址,并且应小于 10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。

XML格式Sitemap说明:

XML格式举例:

XML格式举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <urlset>

        <url>

          <loc>http://www.example.com/</loc>

          <lastmod>2010-01-01</lastmod>

          <changefreq>always</changefreq>

          <priority>1.0</priority>

        </url>

        <url>

          <loc>http://www.example.com/1.html</loc>

          <lastmod>2010-02-14</lastmod>

          <changefreq>weekly</changefreq>

          <priority>0.8</priority>

        </url>

   </urlset>

索引Sitemap举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <sitemapindex>

     <sitemap>

       <loc>http://www.example.com/1.xml</loc>

       <lastmod>2010-01-01</lastmod>

     </sitemap>

     <sitemap>

       <loc>http://www.example.com/2.xml</loc>

       <lastmod>2010-02-01</lastmod>

     </sitemap>

   </sitemapindex>

具体格式及规范说明请查看:http://zhanzhang.baidu.com/site/format

XML标签说明:



百度Sitemap协议-第1张图片-SEO自学网


文本格式Sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。

文本文件格式举例:

http://www.example.com/catalog?item=1

http://www.example.com/catalog?item=2

此文本文件需要遵循以下指南:


?         文本文件每行都必须只有一个网址。网址中不能有换行。


?         您必须指定完整的网址,包括“http://”。


?         每个文本文件最多可包含50,000个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过50,000个,则可将列表分割成多个文本文件,然后分别添加每个文件。


?         文本文件需使用UTF-8编码或GBK编码。


?         文本文件不应包含网址列表以外的任何信息。


?         您可以使用gzip压缩Sitemap文件,以减少带宽要求;但是压缩前的Sitemap文件应小于10MB(10,485,760字节)。

使用Sitemap索引文件(对多个Sitemap文件)说明:

使用Sitemap索引文件必须:


?         以开始标记作为开始,以结束标记作为结束。


?         每个Sitemap包含一个条目作为 XML 父标记。


?         每个父标记包含一个子标记条目。


Sitemap索引文件标签说明:



百度Sitemap协议-第2张图片-SEO自学网



Public @ 2021-10-21 16:11:58

robots.txt文件有什么必要?

什么是robots.txt文件?搜索引擎机器人通过链接抵达互联网上的每个网页,并抓取网页信息。搜索引擎机器人在访问一个网站时,会首先检查该网站的根目录下是否有一个叫做robots.txt的纯文本文件。当我们的网站有一些内容不想被搜索引擎收录,我们可以通过设置robots.txt文件告知搜索引擎机器人。如果网站上没有禁止搜索引擎收录的内容,则不用设置robots.txt文件,或设置为空。robots

Public @ 2018-10-22 16:09:22

robot.txt在SEO中的作用

鉴于网络安全与隐私的考虑,搜索引擎遵循robots.txt协议。通过根目录中创建的纯文本文件robots.txt,网站可以声明不想被robots访问的部分。每个网站都可以自主控制网站是否愿意被搜索引擎收录,或者指定搜索引擎只收录指定的内容。当一个搜索引擎的爬虫访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果该文件不存在,那么爬虫就沿着链接抓取,如果存在,爬虫就会按照该文

Public @ 2023-01-27 16:09:31

Sitemap协议类型及包含范围

Sitemap协议的类型有三种: 1. XML Sitemap:用于搜索引擎的索引。包含了网站中所有重要的URL地址,可以帮助搜索引擎更好地索引和排名网站。 2. Image Sitemap:用于搜索引擎的索引图片。包含了网站中的图片URL地址和相关信息,可以使搜索引擎更好地索引和展示网站内的图片。 3. Video Sitemap:用于搜索引擎的索引视频。包含了网站中的视频URL地址和相关

Public @ 2023-04-03 02:50:13

如何生成站点地图

网上有很多站点地图生成的方法,比如在线生成、软件生成等,sitemap地图可以提交给各大搜索引擎,从而使搜索引擎更好的对网站页面进行 收录,我们也可以通过robots.txt来告诉搜索引擎地图的位置。将制作好的网站地图上传至网站根目录下,最关键是把网站地图链接地址加入在 robots文件中以及做好网站地图在页面方便蜘蛛抓取的位置,一般把网站地图放在页眉和页脚位置。1、普通html格式的网站地图它的

Public @ 2020-08-31 16:11:49

更多您感兴趣的搜索