http协议进阶之Transfer-Encoding和HttpCore实现详解

Transfer-Encoding简介

transfer-eccoding所描述的是消息请求(request)和响应(response)所附带的实体对象(entity)的传输形式,规范定义格式如下:

Transfer-Encoding = "Transfer-Encoding" ":" 1#transfer-coding 

举个例子:Transfer-Encoding: chunked

transfer-encoding的可选值有:chunked,identity ;

transfer-encoding的可选值有:chunked,identity,从字面意义可以理解,前者指把要发送传输的数据切割成一系列的块数据传输,后者指传输时不做任何处理,自身的本质数据形式传输。举个例子,如果我们要传输一本“红楼梦”小说到服务器,chunked方式就会先把这本小说分成一章一章的,然后逐个章节上传,而identity方式则是从小说的第一个字按顺序传输到最后一个字结束。

相关的头定义

Content-Encoding : content-encoding和transfer-encoding所作用的对象不同,行为目标也不同,前者是对数据内容采用什么样的编码方式,后者是对数据传输采用什么样的编码。前者通常是对数据内容进行一些压缩编码操作,后者通常是对传传输采用分块策略之类的。

Content-length : content-length头的作用是指定待传输的内容的字节长度。比如上面举的例子中,我们要上传一本红楼梦小说,则可以指定其长度大小,如:content-length:731017。细心的读者可能会有疑惑,它和transfer-encoding又有什么关系呢?如果想知道它们的关系,只要反过来问下自己,为什么transfer-encoding会有identity和chunked两种,各在什么上下文情景中要用到。比如chunked方式,把数据分块传输在很多地方就非常有用,如服务端在处理一个复杂的问题时,其返回结果是阶段性的产出,不能一次性知道最终的返回的总长度(content-lenght值),所以这时候返回头中就不能有content-lenght头信息,有也要忽略处理。所以你可以这样理解,transfer-encoding在不能一次性确定消息实体(entity)内容时自定义一些传输协议,如果能确定的话,则可以在消息头中加入content-length头信息指示其长度,可以把transfer-encoding和content-length看成互斥性的两种头。

transfer-encoding详解

chunked格式(rfc2616 3.6.1):

Chunked-Body = *chunk
          last-chunk
          trailer
          CRLF
chunk  = chunk-size [ chunk-extension ] CRLF
          chunk-data CRLF
chunk-size = 1*HEX
last-chunk = 1*("0") [ chunk-extension ] CRLF
chunk-extension= *( ";" chunk-ext-name [ "=" chunk-ext-val ] )
chunk-ext-name = token
chunk-ext-val = token | quoted-string
chunk-data = chunk-size(OCTET)
trailer = *(entity-header CRLF)

还是以上传“红楼梦”这本书举例:

24E5是指第一个块数据长度为24E5(16进制格式字符串表示),CRLF为换行控制符。紧接着是第一个块数据内容,其长度就是上面定义的24E5,以CRLF标志结束。3485是指第二块数据长度为3485,CRLF结束,然后后面是第二块的数据内容......,以这样的格式直到所有的块数据结束。最后以“0”CRLF结束,表示数据传输完成(这里对比rfc规范内容,省略了chunk-extension和trailer的东西,因为这并不重要)。

public class Main {

 /**
  * @param args
  */

 public static final int CR = 13; // <US-ASCII CR, carriage return (13)>
 public static final int LF = 10; // <US-ASCII LF, linefeed (10)>

 public static void main(String[] args) throws Exception{
  Socket socket = new Socket("localhost",8080);
  OutputStream out = socket.getOutputStream();
  InputStream in = socket.getInputStream();

  //send requestline
  out.write("POST /web/Hello HTTP/1.1".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);

  //send request header
  out.write("Host:localhost:8080".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  out.write("Accept-Encoding:gzip,deflate".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  out.write("Transfer-Encoding:chunked".getBytes());// 指定transfer-encodeing为chunked方式
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  out.write("Content-Type:application/x-www-form-urlencoded;charset=utf-8".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);

  // CRLF between headers and entity
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);

  /*
   * send chunked data
   */
  //send the first chunked data:hello,world
  //the first chunked data's size : 11
  out.write("B".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  //the first chunked data's content : hello,world
  out.write("hello,world".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  //send the second chunked data:tony
  //the first chunked data's size : 4
  out.write("4".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  //the first chunked data's content : hello,world
  out.write("tony".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  //send the chunked data end flag
  out.write("0".getBytes());
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);
  //send CRLF
  out.write(CR & 0xFF);
  out.write(LF & 0xFF);

  out.flush();

  //
  byte[] buffer = new byte[512];
  ByteArrayOutputStream bufferStream = new ByteArrayOutputStream();
  int len = -1;
  while((len = in.read(buffer)) != -1){
   bufferStream.write(buffer,0,len);
  }

  System.out.println(new String(bufferStream.toByteArray()));

  socket.close();

 }

上面这段代码发了两块数据,第一块是“hello,world”这11个字节长度的字符,第二块发送了“tony”四个字长的数据块。在服务端将收到“hello,worldtony”这个字符串.

HttpCore对transfer-encoding的实现

所以不管是对输入流(InputStream),还是输出流(OutputStream),httpcore都有三种实现:contentlength,identity,chunked。这是完全按照http规范实现的。这里再重复总结下这三种这间的关系。

当指定了"content-length"头信息时,说明已经确定消息体(entity)的长度大小,其值必需为非负整数。反之,如果有“transfer-encoding”头信息时,其值为“chunked”或者“identity”,说明不确定消息体的大小,这时应该不存在“content-length”头。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

(0)

相关推荐

  • 网络传输协议(http协议)

    概述:指服务器和客户端间进行通信时的约束和规范,客户端与服务端的数据交互并不是杂乱无章的,需要遵照(基于)一定的规范进行 常见的协议: a) HTTP.HTTPS 超文本传输协议 b) FTP 文件传输协议 c) SMTP 简单邮件传输协议 本文主要介绍http超文本传输协议. 1.HTTP协议 即超文本传输协议,网站是基于HTTP协议的,例如网站的图片.CSS.JS等都是基于HTTP协议进行传输的.HTTP协议是由从客户机到服务器的请求(Request)和从服务器到客户机的响应(Respons

  • http协议详解(超详细)

    http协议学习系列             1. 基础概念篇 1.1 介绍 HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写.它的发展是万维网协会(World Wide Web Consortium)和Internet工作小组IETF(Internet Engineering Task Force)合作的结果,(他们)最终发布了一系列的RFC,RFC 1945定义了HTTP/1.0版本.其中最著名的就是RFC 2616.RFC 2616定义了今天普遍使

  • 如何利用http协议发布博客园博文评论

    先给大家介绍下实现原理: 给博文提交评论的实质就是通过http协议服务器发送一个post请求.在发布评论前,我们需要做什么呢?对,是必须要登录的.但登录是另一件事情,我们这里先不讨论.用户登录后,服务器给客户端设置一个cookie.http是无状态的.也就是说客户端向服务器发送请求后,服务器返回响应.一次通信完成.服务器不会记得刚才是谁向自己发送请求.所以客户端需要拿着服务器给自己设定好的cookie向服务器发送请求并告知服务器自己的身份,服务器根据cookie产生响应. 准备工作: 为了完成本

  • 基于JAVA中Jersey处理Http协议中的Multipart的详解

    那么Http协议中的Multipart是个什么东东?下面是摘抄http协议1.1的一段话:在multipart entity(多部分实体)的例子中,一个或多个不同的数据集合并在一个单一的body(体)中,一个"multipart"(多部分)类型 field的(域)必须出现在实体的header(头域).body(体)必须包括一个或多个body part(体部分),每一个位于boundary(边界)定界符线之前,最后一个则跟着一个结束边界定界符线.在它的边界定界符线后,每一个体部分由头域.

  • Python函数进阶之迭代器的原理与使用详解

    目录 什么是迭代器 概念 特征 惰性序列 检查可迭代对象 定义迭代器 使用iter函数 使用__iter__方法 判断迭代器 检查内置方法 使用collections模块 调用迭代器 使用next方法和函数 什么是迭代器 能被 next 指针调用,并不断返回下一个值的对象,叫做迭代器.表示为Iterator,迭代器是一个对象类型数据. 概念 迭代器指的是迭代取值的工具,迭代是一个重复的过程,每次重复都是基于上一次的结果而继续的,单纯的重复并不是迭代. 特征 迭代器并不依赖索引,而通过 next

  • http协议进阶之Transfer-Encoding和HttpCore实现详解

    Transfer-Encoding简介 transfer-eccoding所描述的是消息请求(request)和响应(response)所附带的实体对象(entity)的传输形式,规范定义格式如下: Transfer-Encoding = "Transfer-Encoding" ":" 1#transfer-coding 举个例子:Transfer-Encoding: chunked transfer-encoding的可选值有:chunked,identity ;

  • obix协议在java中的配置和使用详解

    前言 本文主要给大家介绍的是关于obix协议在java中的配置和使用,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 什么是 oBIX? 简单来讲,obix是一种 XML 通讯协议,使用Http Request/Post方式进行数据通讯.所有数据通过可读字符进行传送,一个oBIX对象可以有唯一的一个URL识别. oBIX的实现原理 首先数据储存在Niagara的服务平台上,我们需要做的是从Niagara获取数据,并且储存在InfluxDB中.下面是实现的流程方法. 加粗 Ctr

  • Python进阶:生成器 懒人版本的迭代器详解

    从容器.可迭代对象谈起 所有的容器都是可迭代的(iterable),迭代器提供了一个next方法.iter()返回一个迭代器,通过next()函数可以实现遍历. def is_iterable(param): try: iter(param) return True except TypeError: return False params = [ 1234, '1234', [1, 2, 3, 4], set([1, 2, 3, 4]), {1:1, 2:2, 3:3, 4:4}, (1, 2

  • HTTP协议详解_动力节点Java学院整理

    一.概念 协议是指计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则,超文本传输协议(HTTP)是一种通信协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器. HTTP协议,即超文本传输协议(Hypertext transfer protocol).是一种详细规定了浏览器和万维网(WWW = World Wide Web)服务器之间互相通信的规则,通过因特网传送万维网文档的数据传送协议. HTTP协议是用于从WWW服务器传输超文本到本地浏览器的传送协议.

  • 详解.NET Core使用Quartz执行调度任务进阶

    一.前言运用场景 Quartz.Net是一个强大.开源.轻量的作业调度框架,在平时的项目开发当中也会时不时的需要运用到定时调度方面的功能,例如每日凌晨需要统计前一天的数据,又或者每月初需要统计上月的数据.当然也会出现既要统计日的也统计月的还需要进行其他的操作.那我们改如何来写这样的调度任务呢? 二.实际运用(.Net Core 2.2) 在一个解决方案中创建一个.Net控制台应用程序及一个类库,控制台应用程序用来作为程序的启动点.类库用来作为调度任务的执行程序. 然后我们需要完善一下项目的结构,

  • 详解Http协议以及post与get区别

    一.什么是HTTP协议 HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程.客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客户端与web服务器通迅的格式. 二.HTTP协议的版本 HTTP协议的版本:HTTP/1.0.HTTP/1.1 三.HTTP1.0和HTTP1.1的区别 在HTTP1.0协议中,客户端

  • Swift进阶教程Mirror反射示例详解

    目录 元类型与.self AnyObject AnyClass Any type(Of:) self self在方法里面的作用 Self Swift Runtime Mirror Mirror的基本用法 Mirror的简单应用-JSON解析 Mirror源码解析 Enum Metadata探索 还原TargetEnumMetadata 还原TargetEnumDescriptor 相对偏移指针 打印枚举中的属性 Struct Metadata探索 获取结构体的属性 swift_getTypeBy

  • Spring零基础到进阶之使用方法详解

    目录 一.Spring的创建和使用 1.创建一个Maven项目 2.添加Spring框架支持 3.添加启动类 二.存储Bean 1.添加配置文件(非第一次省略此步) 2.创建Bean对象 2.1.创建Bean对象 2.2.将Bean对象注入到Spring中 三.获取并使用 Bean 对象 1.先得到Spring上下文对象 2.再通过上下文提供的方法获取到Bean对象 3.使用Bean对象 今天介绍一下Spring的基本使用,为了更好的熟悉Spring,可以先看一下我前面的文章: Spring鸿蒙

随机推荐