Node.js中使用Buffer编码、解码二进制数据详解

JavaScript很擅长处理字符串,但是因为它最初的设计是用来处理HTML文档,因此它并不太擅长处理二进制数据。JavaScript没有byte类型,没有结构化的类型(structured types),甚至没有字节数组,只有数字和字符串。(原文:JavaScript doesn't have a byte type — it just has numbers — or structured types, or http://skylitecellars.com/ even byte arrays: It just has strings.)

因为Node基于JavaScript,它自然可以处理类似HTTP这样的文本协议,但是你也可以用它来跟数据库交互,处理图片或文件上传等,可以想象,如果仅仅用字符串来做这些事得有多困难。早些时候,Node通过将byte编码成文本字符来处理二进制数据,但这种方式后来被证明并不可行,既浪费资源,又缓慢,又不灵活,而且难以维护。

Node有一个二进制缓冲实现Buffer,这个伪类(pseudo-class)提供了一系列处理二进制数据的API,简化了那些需要处理二进制数据的任务。缓冲的长度由字节数据的长度决定,而且你可以随机的设置和获取缓冲内的字节数据。

注意:Buffer类有一个特殊的地方,缓冲内的字节数据所占用的内存不是分配在JavaScrp

It VM内存堆上的,也就是说这些对象不会被JavaScript的垃圾回收算法处理,取而代之的是一个不会被修改的永久内存地址,这也避免了因缓冲内容的内存复制所造成的CPU浪费。

创建缓冲

你可以用一个UTF-8字符串创建缓冲,像这样:

代码如下:

var buf = new Buffer(‘Hello World!');

也可以用指定编码的字符串创建缓冲:

代码如下:

var buf = new Buffer('8b76fde713ce', 'base64');

可接受的字符编码和标识如下:

1.ascii——ASCI,仅适用于ASCII字符集。
2.utf8——UTF-8,这种可变宽编码适用于Unicode字符集的任何字符,它已经成了Web世界的首选编码,也是Node的默认编码类型。
3.base64——Base64,这种编码基于64个可打印ASCII字符来表示二进制数据,Base64通常用于在字符文档内嵌入可以被转化成字符串的二进制数据,在需要时又可以完整无损的转换回原来的二进制格式。

如果没有数据来初始化缓冲,可以用指定的容量大小来创建一个空缓冲:

代码如下:

var buf = new Buffer(1024); // 创建一个1024字节的缓冲

获取和设置缓冲数据

创建或接收一个缓冲对象后,你可能要查看或者修改它的内容,可以通过[]操作符来访问缓冲的某个字节:

代码如下:

var buf = new Buffer('my buffer content');
// 访问缓冲内第10个字节
console.log(buf[10]); // -> 99

注意:当你(使用缓冲容量大小来)创建一个已初始化的缓冲时,一定要注意,缓冲的数据并没有被初始化成0,而是随机数据。

代码如下:

var buf = new Buffer(1024);

console.log(buf[100]); // -> 5 (某个随机值)

你可以这样修改缓冲里任何位置的数据:

代码如下:

buf[99] = 125; // 把第100个字节的值设置为125

注意:在某些情况下,一些缓冲操作并不会产生错误,比如:

1.缓冲内的字节最大值为255,如果某个字节被赋予大于256的数字,将会用256对其取模,然后将结果赋给这个字节。
2.如果将缓冲的某个字节赋值为256,它的实际值将会是0(译者注:其实跟第一条重复,256%256=0)
3.如果用浮点数给缓冲内某个字节赋值,比如100.7,实际值将会是浮点数的整数部分——100
4.如果你尝试给一个超出缓冲容量的位置赋值,赋值操作将会失败,缓冲不做任何修改。

你可以用length属性获取缓冲的长度:

代码如下:

var buf = new Buffer(100);

console.log(buf.length); // -> 100

还可以使用缓冲长度迭代缓冲的内容,来读取或设置每个字节:

代码如下:

var buf = new Buffer(100);

for(var i = 0; i < buf.length; i++) {

buf[i] = i;

}

上面代码新建了一个包含100个字节的缓冲,并从0到99设置了缓冲内每个字节。

切分缓冲数据

一旦创建或者接收了一个缓冲,你可能需要提取缓冲数据的一部分,可以通过指定起始位置来切分现有的缓冲,从而创建另外一个较小的缓冲:

代码如下:

var buffer = new Buffer("this is the content of my buffer");

var smallerBuffer = buffer.slice(8, 19);

console.log(smallerBuffer.toString()); // -> "the content"

注意,当切分一个缓冲的时候并没有新的内存被分配或复制,新的缓冲使用父缓冲的内存,它只是父缓冲某段数据(由起始位置指定)的引用。这段话含有几个意思。

首先,如果你的程序修改了父缓冲的内容,这些修改也会影响相关的子缓冲,因为父缓冲和子缓冲是不同的JavaScript对象,因此很容易忽略这个问题,并导致一些潜在的bug。

其次,当你用这种方式从父缓冲创建一个较小的子缓冲时,父缓冲对象在操作结束后依然会被保留,并不会被垃圾回收,如果不注意的话,很容易会造成内存泄露。

注意:如果你担心因此产生内存泄露问题,你可以使用copy方法来替代slice操作,下面将会介绍copy。

复制缓冲数据

你可以像这样用copy将缓冲的一部分复制到另外一个缓冲:

代码如下:

var buffer1 = new Buffer("this is the content of my buffer");

var buffer2 = new Buffer(11);

var targetStart = 0;

var sourceStart = 8;

var sourceEnd = 19;

buffer1.copy(buffer2, targetStart, sourceStart, sourceEnd);

console.log(buffer2.toString()); // -> "the content"

上面代码,复制源缓冲的第9到20个字节到目标缓冲的开始位置。

解码缓冲数据

缓冲数据可以这样转换成一个UTF-8字符串:

代码如下:

var str = buf.toString();

还可以通过指定编码类型来将缓冲数据解码成任何编码类型的数据。比如,你想把一个缓冲解码成base64字符串,可以这么做:

代码如下:

var b64Str = buf.toString("base64");

使用toString函数,你还可以把一个UTF-8字符串转码成base64字符串:

代码如下:

var utf8String = 'my string';

var buf = new Buffer(utf8String);

var base64String = buf.toString('base64')

小结

有时候,你不得不跟二进制数据打交道,但是原生JavaScript又没有明确的方式来做这件事,于是Node提供了Buffer类,封装了一些针对连续内存块的操作。你可以在两个缓冲之间切分或复制内存数据。

你也可以把一个缓冲转换成某种编码的字符串,或者反过来,把一个字符串转化成缓冲,来访问或处理每个bit。

(0)

相关推荐

  • 使用node.js中的Buffer类处理二进制数据的方法

    前言 在Node.js中,定义了一个Buffer类,该类用来创建一个专门存放二进制数据的缓存区.这篇文章就详细介绍了node.js中的Buffer类处理二进制数据的方法,下面话不多说,来看看详细的介绍. 创建Buffer对象 第一种:直接使用一个数组来初始化缓存区 var arr = [0,1,2] var buf = new Buffer(arr) console.log(buf) 执行效果: 第二种:直接使用一个字符串来初始化缓存区 var str = 'hello' var buf = n

  • 详解nodeJS之二进制buffer对象

    前面的话 在ES6引入TypedArray之前,JavaScript语言没有读取或操作二进制数据流的机制.Buffer类被引入作为Nodejs的API的一部分,使其可以在TCP流和文件系统操作等场景中处理二进制数据流.现在TypedArray已经被添加进ES6中,Buffer类以一种更优与更适合Node.js用例的方式实现了Uint8Array.本文将详细介绍buffer对象 概述 由于应用场景不同,在Node中,应用需要处理网络协议.操作数据库.处理图片.接收上传文件等,在网络流和文件的操作中

  • node.js根据不同请求路径返回不同数据详解流程

    目录 1.学习根据不同的请求路径返回:不同数据 2.发送的数据:数据类型,和什么编码:Content-Type 3.关于读入文件的:相对路径和绝对路径: 4.读图片 1.学习根据不同的请求路径返回:不同数据 var url=req.url //获取req.url值(req:是request简写) req.url: 获取的是端口号之后的路径 实现不同路径返回不同数据 我的端口号:3000,网址:http://127.0.0.1:3000 if(url==='/'){ res.end('index

  • Node.js中如何合并两个复杂对象详解

    前言 相信大家都知道在通常情况下,在Node.js中我们可以通过underscore的extend或者lodash的merge来合并两个对象,但是对于像下面这种复杂的对象,要如何来应对呢?下面来一起学习学习吧. Node.js合并两个复杂对象 例如我有以下两个object: var obj1 = { "name" : "myname", "status" : 0, "profile": { "sex":&q

  • Node.js中的异步生成器与异步迭代详解

    前言 生成器函数在 JavaScript 中的出现早于引入 async/await,这意味着在创建异步生成器(始终返回 Promise 且可以 await 的生成器)的同时,还引入了许多需要注意的事项. 今天,我们将研究异步生成器及其近亲--异步迭代. 注意:尽管这些概念应该适用于所有遵循现代规范的 javascript,但本文中的所有代码都是针对 Node.js 10.12 和 14 版开发和测试的. 异步生成器函数 看一下这个小程序: // File: main.js const creat

  • Node.js中使用Buffer编码、解码二进制数据详解

    JavaScript很擅长处理字符串,但是因为它最初的设计是用来处理HTML文档,因此它并不太擅长处理二进制数据.JavaScript没有byte类型,没有结构化的类型(structured types),甚至没有字节数组,只有数字和字符串.(原文:JavaScript doesn't have a byte type - it just has numbers - or structured types, or http://skylitecellars.com/ even byte arra

  • Node.js中的Buffer对象及创建方式

    目录 什么是Buffer? 注意 Buffer中存储的都是二进制数据,但是在显示时以16进制显示 Buffer.length表示占用内存的大小 Buffer打印数字时会以十进制方式显示 Buffer的创建方法 通过Buffer的构造函数,但不推荐使用 通过allocUnsafe方法 通过alloc方法 通过Buffer.from()方法 写入缓冲区 从缓冲区读取数据 将 Buffer 转换为 JSON 对象 拷贝缓冲区 缓冲区与迭代器 总结 什么是Buffer? js语言自身只有字符串数据类型,

  • Node.js基础入门之使用方式及模块化详解

    目录 什么是Node.js ? Node.js下载 Node.js和JavaScript的区别 Node.js安装与验证 Node.js使用方式 1. REPL模式 2. 文件模式 Node.js模块化 1. 什么是模块? 2. 模块分类 3. 创建自定义模块 4. 调用自定义模块 5. 模块测试 6. 主模块 7. 模块组成 在这个竞争日益激烈的今天,已经不是一门语言,一项技术走天下的时代了.正所谓艺多不压身,今天开始学习Node.js,学而时习之,不亦乐乎,希望可以借鉴经验,学以致用,如有不

  • js中的关联数组与普通数组详解

    var privArr = []; privArr['staProjQueryGrid'] = [{ btn_id : 'but_add', roles : ['2001','2005'] }] console.log(privArr,privArr.staProjQueryGrid[0].btn_id) 第一行是定义一个数组priArr,第二行是给这个数组添加一个属性staProjQueryGird,这个属性值是一个数组.打印结果是  but_add var unPrivArr = [];//

  • JS中正则表达式全局匹配模式 /g用法详解

    本文章来详细介绍js中正则表达式的全局匹配模式 /g用法,代码如下: var str = "123#abc"; var re = /abc/ig; console.log(re.test(str)); //输出ture console.log(re.test(str)); //输出false console.log(re.test(str)); //输出ture console.log(re.test(str)); //输出false 在创建正则表达式对象时如果使用了"g&q

  • JS中的hasOwnProperty()和isPrototypeOf()属性实例详解

    这两个属性都是Object.prototype所提供:Object.prototype.hasOwnProperty()和Object.prototype.isPropertyOf() 先讲解hasOwnProperty()方法和使用.在讲解isPropertyOf()方法和使用 看懂这些至少要懂原型链 一.Object.prototype.hasOwnProperty() 概述 hasOwnProperty()方法用来判断某个对象是否含有指定的自身属性 语法 obj.hasOwnPropert

随机推荐