ETag使用效果对比及ETag配置图文教程

提起向百度提交数据,大家基本都会想到sitemap,最近又推出的etag是什么东东?真的能有效果吗?

sitemap是解决网站收录至关重要的途径之一,而通常sitemap的更新都不是很及时,并且体量都相对较大,此时也消耗了相应的网站流量及带宽。而ETag可以用来标示网页是否发生了变化,如果没有变化返回304状态码,就不用再重新传输整个网页了。

在我们的sitemap配置了ETag之后,对日志一段时间的监测发现,其sitemap响应时间以及耗时的平均时间均大幅度下降,爬虫访问 sitemap文件的次数有所增加,对于收录而言,通过图表也能看出相对的增长曲线,我们的整体收录率大致提升范围在2% – 5%左右。所以在此,强烈建议大家设置sitemap的ETag,简简单单的一个小动作就能看到相对明显的效果还是很不错的。

ETag全称EntityTags,HTTP协议规格说明中定义“ETag”为“被请求变量的实体值”。我们也可以把ETag理解为是一个客户端与 服务器关联的记号。这个记号告诉客户端,当前网页在上次请求之后是否有发生变化,当发生变化时,ETag的值重新计算,并返回200状态码。如果没有变 化,返回304状态码。从而不会重新加载整个页面信息。

如下,是我司站点的sitemap文件的头信息:

我们看到,ETag中包含了一连串的数据,这就是计算出来的一个值,如果它发生变化,说明其页面内容一定发生了变化。如果页面没有发生变化时,头信息应该如下:

在我们与技术沟通配置ETag时,需要通过此种方式进行验证。第一次访问200状态码,有ETag的一行文本,再次访问该页面时,状态码为304,ETag的值不变。至此,我们就可以确定ETag配置成功。

另外,sitemap启用Etag后:

1、百度可以更及时地响应sitemap的更新;

2、页面没有更新的情况下,对流量的消耗极小;

3、百度更加及时的抓取sitemap,便于更好的收录;

但多数情况下,ETag会与Last-Modified一起使用,这样可利用客户端(例如浏览器)的缓存。因为服务器首先产生Last- Modified/Etag标记,服务器可在稍后使用它来判断页面是否已经被修改。本质上,客户端通过将该记号传回服务器要求服务器验证其(客户端)缓 存。

站点服务器如何配置ETag?

最好是对全站进行配置ETag,这样对于站点而言,在带宽消耗、爬虫抓取上的提升还是会有很大收益的。

一、Apache  

Apache根据配置文件中的配置来设置Etag值,默认的Apache的FileEtag设置为:

FileEtagINode Mtime Size

也就是根据这三个属性来生成Etag值,他们之间通过一些算法来实现,并输出成hex的格式,相邻属性之间用-分隔,比如:"2e681a- 6-5d044840",这里面的三个段,分别代表了INode,MTime,Size根据算法算出的值的Hex格式,可以改变Apache的 FileEtag设置,比如设置成FileEtagSize,那么得到的Etag可能为:"6",设置了几个段,Etag值就有几个段。

详细配置:

步骤1

在要启用ETag的目录下增加.htaccess文件并在其中增加一行,如图:FileETagMTime Size

以覆盖默认的Innode MTime Size的ETag,因为默认的ETag使用到的Innode会导致相同的文件在分布式服务器上产生的ETag不同。

步骤2

如果.htacces文件已经存在,请确保要启用ETag的目录/.htacces文件中没有FileETagNone。如果存在FileETag None,请删去该行。

检查没有用mod_headers将ETag除去,即httpd.conf文件中没有出现下面的语句,

LoadModuleheaders_module modules/mod_headers.so

Headerunset ETag

如果出现如图情况,请删除Headerunset ETag这一行。

步骤3

重新启动httpd,就启用ETag了。

二、Nginx

步骤1

确认Nginx版本,命令:Nginx安装目录/sbin/nginx–v,

版本为1.7.3及更高,继续步骤2;版本为1.7.3以下,1.3.3及以上,进行步骤3;版本为1.3.3以下,不支持ETag,请升级您的Nginx。

步骤2

确认没有关闭ETag:打开Nginx的配置文件nginx.conf(默认位置Nginx安装目录/conf/),确保其中没有出现etagoff;,下图为出现的情况,请将此行删除。

确认没有使用ngx_headers_more清除ETag头:同样在配置文件中不能出现如下语句的任意一句,如果出现请将其删除。

重新启动Nginx,就启用ETag功能了。

步骤3

查看是否开启了gzip,且是否和etag出现冲突,出现冲突去步骤4,没有去步骤2。

打开Nginx的配置文件nginx.conf(默认位置Nginx安装目录/conf/),其中出现gzip on;语句证明开启了gzip,如图

开启gzip时,可能与etag出现冲突,用浏览器多次请求此网站的静态元素,如果只返回200,不返回304,证明存在冲突,请去步骤4;没有冲突去步骤2。

步骤4

请关闭gzip,即将上一步中的gzipon;改为gzip off;然后去步骤2。

若不想关闭gzip,并要开启ETag,同时仍要坚持使用当前的Nginx版本,只能修改源码并重新编译。

下载此版本安装包并解压,将其目录下/src/http/modules/ngx_http_gzip_filter_module.c

文件中约309行左右的ngx_http_clear_etag(r);一行注释掉或删掉。如下图

如果没有找到ngx_http_clear_etag(r);而是发现ngx_http_weak_etag(r);如下图,证明此Nginx

没有gzip和etag冲突的问题,不必进行任何修改。

重新编译源码安装Nginx,解决这个冲突,然后去步骤2。

三、IIS

IIS7是默认开启ETag的,如果没有ETag,请按以下步骤设置。

打开Internet Information Services (IIS) Manager,如图双击HTTP响应头部(HTTPResponse Headers),

选择No Grouping标签,在空白处右键选择Add。

设置Name为ETag,Value为双引号

配置web.config:­

<system.webServer>
...
<httpProtocol>
<customHeaders>
<add name="ETag"value="""" />
</customHeaders>
</httpProtocol>
...
</system.webServer>

完成。

(0)

相关推荐

  • ETag使用效果对比及ETag配置图文教程

    提起向百度提交数据,大家基本都会想到sitemap,最近又推出的etag是什么东东?真的能有效果吗? sitemap是解决网站收录至关重要的途径之一,而通常sitemap的更新都不是很及时,并且体量都相对较大,此时也消耗了相应的网站流量及带宽.而ETag可以用来标示网页是否发生了变化,如果没有变化返回304状态码,就不用再重新传输整个网页了. 在我们的sitemap配置了ETag之后,对日志一段时间的监测发现,其sitemap响应时间以及耗时的平均时间均大幅度下降,爬虫访问 sitemap文件的

  • 安装Python和pygame及相应的环境变量配置(图文教程)

    Hello,Everyone! Python是个好东西!好吧,以黎某人这寒碜的赞美之词,实在上不了台面,望见谅.那我们直接来上干货吧. 第一步:下载Python安装包https://www.python.org/ 1.进入Python官网,点击download 2.进入之后有两个安装包供选择(Python会根据你系统的位数智能选择,所以这里不用纠结你的电脑是32位的还是64位) 我的建议是下载Python3.0后面的版本,因为Python3在Python2的基础上,优化改进了一些代码格式.点击下

  • Mysql 5.7.17 winx64免安装版,win10环境下安装配置图文教程

    下载地址:http://dev.mysql.com/downloads/file/?id=467269 1.解压到自定义目录:我解压到了D盘的根目录 2.添加一个my.ini文件 配置如下: # 设置mysql客户端默认字符集 default-character-set=utf8 #安装目录 basedir = D:\mysql-5.7.17-winx64 #数据存放目录 data目录是要单独创建的,记得是个空文件夹 datadir =D:\mysql-5.7.17-winx64\data #端

  • Sql Server2012 使用IP地址登录服务器的配置图文教程

    最近在使用NFineBase框架+c#做一个系统的时候,在使用sql server 2012 连接数据库的时候 ,遇到几个问题. 一. 就是在本地或者远程连接别人的数据库的时候,以ip地址作为服务器名称 以SQL Server 身份验证(即输入登录名和密码)的方式登录数据库 总会出现错误 比如说会提示一下错误: 用户 'sa' 登录失败,该用户与可信 SQL Server 连接无关联. 但是使用 计算机名\实例名 这种方式就可以登录 \ 最后发现还是数据库的配置问题,解决方案如下: 我使用的是w

  • Oracle11g数据库win8.1系统安装配置图文教程

    1. Oracle11g安装 http://pan.baidu.com/s/1gfa3e63:这里是我在Oracle官网下载好了Windows系统64位的安装包,有2个zip文件.不想去官网找下载地址的童鞋可以直接用这个百度云盘的下载链接. 1.去www.oracle.com下载最新的oracle11g安装包的压缩文件,有2个压缩文件,都需要下载,下载完成以后需要解压缩在同一个目录下. 在开始oracle数据安装之前建议:1.关闭本机的病毒防火墙.2.断开互联网. 这样可以避免解压缩丢失文件和安

  • python虚拟环境的安装配置图文教程

    使用pip安装     pip install virtualenv 因为已经安装过了,所以显示这样 在这里我想在这里推荐大家以后再安装类库时可以用豆瓣源来安装,速度很快,因为在国内访问 官方pypi源非常慢,pip安装包经常会出错 豆瓣源 我来演示下django的安装 可以看到速度很快 好了回到虚拟环境的安装 virtualenv scrapytest(环境名) 安装好后输入activate.bat进入虚拟环境后输入python查看当前python版本为2.7 退出 退出虚拟环境:输入deac

  • YII中Ueditor富文本编辑器文件和图片上传的配置图文教程

    将Ueditor集成到YII框架中后,参照editor_config.js中的toolbars中的内容,更改options中标签可以给编辑器添加想要的功能: 因此要想添加文件和图片上传功能,应该加入以下两个标签: 文本编辑器中便出现了对应的两个选项: 但是点击上传图片按钮后发现,无法正常进行图片上传,文件上传也是失败的,问题都是Flash Player需要升级, 因此在火狐浏览器中安装对应的flash player组件,选择其中一个工作: 此时,文件上传和图片上传功能就能正常使用了: 上传路径的

  • MySQL5.7免安装版配置图文教程

    Mysql是一个比较流行且很好用的一款数据库软件,如下记录了我学习总结的mysql免安装版的配置经验. 一. 软件下载 5.7 32位https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.19-win32.zip 5.7 64位https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.19-winx64.zip 本次教程采用的是64位版本,诸君可根据自己电脑系统和个人喜好酌情处理. 二

  • Java环境配置图文教程(推荐)

    今年新开Java课程第一步就是-配置环境 就从Java的环境配置开始好了 以下是正式的步骤 首先,从Oracle的官网下载jdk的安装包 点我下载Java SE开发套件 先点接受许可协议,然后自行选择对应的系统版本下载.我的是64位的win10,直接选了最后一个,如果是32位的windows就需要倒数第二个. 下载完成后直接双击安装就好了,弹出pac权限要求的时候选择是(选否的话就不用继续了:) 这里的安装路径自己选择一个C盘以外的目录安装,防止在系统出现问题的时候Java的环境出现问题 接下来

  • Mysql5.7.17 winx64.zip解压缩版安装配置图文教程

    1.下载mysql-5.7.17-winx64.zip : 链接: https://pan.baidu.com/s/1tTqT2sn7cEaOwEvrQ-LrHg 密码: i444 2.解压到文件夹(例): 解压到当前文件夹 3.修改配置文件: 打开解压的文件夹(本例的配置文件位置 D:\Development\mysql\mysql-5.7.17-winx64\mysql-5.7.17-winx64\),删除my-default.ini,新建一个my.ini 修改my.ini内容如下: [my

随机推荐