Categories


Tags


ETag助力站点提交Sitemap——ETag简介与作用

一、ETag简介

ETag(EntityTags)是URL的tag,用来标示URL对象是否改变,这样可利用客户端(例如浏览器)的缓存。由服务器首先产生ETag,客户端通过将该记号传回服务器要求服务器验证其(客户端)缓存。服务器使用它来判断页面是否已经被修改,如果未修改返回304,而不必重新传输整个对象。

二、现在站点Sitemap存在的问题

1.发现更新不及时

当站点或其Sitemap发生更新时,百度难以及时发现并响应,因为百度难以无时无刻地持续检查站点内容和Sitemap是否更新。

2.全量抓取,消耗带宽

现在百度对站点Sitemap的抓取会将Sitemap文件完整下载下来,鉴于Sitemap文件一般较大,而这种下载可能存在多次,故比较消耗网站的流量和带宽。

三、ETag作用

HTTP1.1用ag来判断请求的文件是否被修改,主要为了解决Last-Modified无法解决的一些问题

1、一些文件也许会周期性的更改,但是他的内容并不改变(仅仅改变的修改时间),这个时候并不希望客户端认为这个文件被修改了重新GET;

2、某些文件修改非常频繁, 1秒内修改了N次,If-Modified-Since能检查到的粒度是秒级的,这种修改无法判断

3、某些服务器不能精确的得到文件的最后修改时间;

为此,HTTP1.1引入了ETag.但标准并没有规定ETag的内容是什么或者说要怎么实现,唯一规定的是ETag需要放在双引号内。ETag由服务器端生成,客户端通过If-Match或者说If-None-Match这个条件判断请求来验证资源是否修改。我们常见的是使用If-None-Match.请求一个文件的流程可能如下:

第一次请求:

1.客户端发起HTTP GET请求一个文件;

2.服务器处理请求,返回文件内容和一堆Header,当然包括ETag(例如"1ec5-502264e2ae4c0")(假设服务器支持ETag生成和已经开启了ETag).状态码200,如下图所示,首次请求百度首页时,成功得到百度logo图片文件bd_logo1.png,状态码200,大小8.1KB,返回的Header中包括ETag(“1ec5-502264e2ae4c0”)。

第二次请求:

1.客户端发起HTTP GET请求一个文件,这个时候客户端同时发送一个If-None-Match头,这个头的内容就是我们第一次请求时服务器返回的ETag:1ec5-502264e2ae4c0

2.服务器判断发送过来的ETag和计算出来的ETag是匹配的,不返回200,返回304,让客户端继续使用本地缓存。如图所示这次对bd_logo1.png的请求,服务器只返回了Header没有返回内容,大小仅为349B。

四、站点启用ETag的好处

1.对Sitemap启用ETag后,百度可以更快速地响应Sitemap的更新,没有更改内容的情况下,服务器只发回304应答头,对流量的消耗极小,在每个head平均227B大小的通常情形下,一整天二十四小时每秒都回应的流量消耗仅为18.7M。

2.现在站长平台对每个站点的Sitemap主动抓取次数设有上限,且这项功能没有对所有站开放,如果您的站点Sitemap启用了ETag,并通过了测试,那么就可以用很小的流量享受百度及时更新您的Sitemap的功能,以便于百度更好地收录您网站的内容。

如果大家对ETag还有任何的疑问可以到站长社区[站长工具]ETag助力Sitemap讨论帖中进行讨论。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2021-07-08 16:09:45

导航结构如何优化?

导航结构的作用:网站号航主题是引导用户访间指定的网站菜单、栏目、内容等。一个合理的网站导购也是权重互传的重要途径。导航结构越清晰,越有利于用户在短时间内找到自己喜欢的内容。导航结构有如下三方面的作用:1、引导用户访问指定页面。其中全局导航、分类导航、辅助导航都是出于此目的进行的。2、理清网站各内容与链接间的联系。即对网站整理内容的一个索引和理解,这个最常见的应用就是网站地图和内容索引表,展现了整个

Public @ 2017-07-20 16:11:44

怎样优化网站结构

这篇写于2006年的贴子,在网上已经被抄得四处都是了,恐怕新入行的SEO已经很难知道原出处是这里了。网站结构的优化是搭建网站时第一个要考虑的,对SEO有重大影响。网站结构出问题,权重无法正常流动,搜索引擎将无法顺利抓取页面,也就谈不上排名和流量了。优化网站结构有两方面的意思,一是物理结构,二是逻辑结构。网站的物理结构网站物理结构指的是网站真实的目录及文件所存储的位置所决定的结构。一般来说比较好的物

Public @ 2011-04-29 16:12:05

Sitemap文件标准格式和大小说明

Sitemap文件标准格式: Sitemap文件通常是一个以XML格式编写的文本文件,其中包含URL信息和其他相关数据。Sitemap文件主要包含以下元素: 1. URL元素:用于指定页面的网址,并包含可选的数据,如最近的修改日期、相对于站点的相对权重等。 2. loc元素:为URL元素的子元素,用于指定页面的网址。 3. lastmod元素:为URL元素的子元素,用于指定页面的最近修改日期。

Public @ 2023-04-29 02:50:12

Google网站地图Sitemap与搜索引擎优化

Sitemap是指网站地图,是一个网站的结构图,包含了所有页面的链接和关系。它可以帮助搜索引擎更好地了解网站的结构和内容,以便更好地抓取和索引网站。对于SEO来说,网站地图是非常重要的一部分,因为它可以提高搜索引擎对网站内容的理解和评估,从而提高网站的排名。 以下是一些使用网站地图提高SEO效果的方法: 1. 提交地图到Google搜索控制台:将网站地图提交到Google搜索控制台可以告诉Go

Public @ 2023-04-04 05:00:19

更多您感兴趣的搜索

0.555958s