又又叕出BUG啦!理智分析Java NIO的ByteBuffer到底有多难用

2025-02-12 21:51:06

一、前言

ByteBuf是Netty当中的最重要的工具类，它与JDK的ByteBuffer原理基本上相同，也分为堆内与堆外俩种类型，但是ByteBuf做了极大的优化，具有更简单的API，更多的工具方法和优秀的内存池设计。

二、API

Netty 的数据处理 API 通过两个组件暴露——抽象类ByteBuf 和接口 ByteBufHolder。

ByteBuf API 的优点：

它可以被用户自定义的缓冲区类型扩展
通过内置的复合缓冲区类型实现了透明的零拷贝；
容量可以按需增长（类似于 JDK 的 StringBuilder）
在读和写这两种模式之间切换不需要调用 ByteBuffer 的 flip()方法
读和写使用了不同的索引
支持方法的链式调用
支持引用
计数支持池化

其他类可用于管理 ByteBuf 实例的分配，以及执行各种针对于数据容器本身和它所持有的数据的操作。

三、Netty 的数据容器

所有网络通信最终都是基于底层的字节流传输，因此高效、方便、易用的数据接口是迷人的，而 Netty 的 ByteBuf 生而为满足这些需求。

3.1 工作原理

ByteBuf 维护俩不同索引：一个用于读取，一个用于写入：

从 ByteBuf 读取时，其 readerIndex 将会被递增已经被读取的字节数
当写入 ByteBuf 时，writerIndex 也会被递增
一个读索引和写索引都设置为 0 的 16 字节 ByteBuf

这些索引两两之间有什么关系呢？
若打算读取字节直到 readerIndex == writerIndex，会发生啥？此时，将会到达“可读取的”数据的末尾。类似试图读取超出数组末尾的数据一样，试图读取超出该点的数据也会抛 IndexOutOfBoundsException。

read、write 开头的 ByteBuf 方法，会推进对应索引
set、get 开头的操作则不会。后面的这些方法将在作为一个参数传入的一个相对索引上执行操作

可指定 ByteBuf 的最大容量。试图移动写索引（即 writerIndex）超过这个值将会触
发一个异常。（默认限制 Integer.MAX_VALUE。）

四、内存池化

非池化的堆内与堆外的 ByteBuf 示意图

ByteBuf heapBuffer = UnpooledByteBufAllocator.DEFAULT.heapBuffer(10);
ByteBuf directBuffer = UnpooledByteBufAllocator.DEFAULT.directBuffer(10);

注意要手动将GC 无法控制的非堆内存的空间释放：

池化的堆内与堆外的 ByteBuf 示意图

五、字节级操作

派生缓冲区

派生缓冲区为 ByteBuf 提供了以专门的方式来呈现其内容的视图。这类视图通过以下方法创建：

Unpooled.unmodifiableBuffer(…)
order(ByteOrder)
readSlice(int)

这些方法都将返回一个新的 ByteBuf 实例，但都具有自己独立的读、写和标记索引。
其内部存储和 JDK 的 ByteBuffer 一样，都是共享的。所以派生缓冲区的创建成本很低，但同时也表明若你修改了它的内容，也会同时修改对应源实例！

slice、slice(int, int)、retainedSlice、retainedSlice(int, int)

返回此缓冲区的可读字节的一部分。
此方法与buf.slice(buf.readerIndex(), buf.readableBytes())相同。
该方法不会调用retain()，引用计数不会增加。
retainedSlice系列方法调用类似slice().retain()，但此方法可能返回产生较少垃圾的缓冲区实现。

duplicate、retainedDuplicate

返回一个共享该缓冲区整个区域的缓冲区。
此方法不会修改此缓冲区的readerIndex或writerIndex

读取器和写入器标记将不会重复。
duplicate不会调用retain()，不会增加引用计数，而retainedDuplicate会。

readSlice、readRetainedSlice

返回部分空间，彼此共享底层缓冲区，会增加原缓冲区的readerIndex。

如果需要一个现有缓冲区的真实副本，请使用 copy()或者 copy(int, int)，因为这个调用所返回的 ByteBuf 拥有独立的数据副本。

六、引用与释放

ByteBuf 在使用完毕后一定要记得释放，否则会造成内存泄露。

引用计数

通过在某个对象所持有的资源不再被其他对象引用时释放该对象所持有的资源来优化内存使用和性能的技术。
Netty 在4.x为 ByteBuf 和 ByteBufHolder 带来了引用计数技术，都实现了：

ReferenceCounted接口

需要显式释放的引用计数对象。

当一个新的ReferenceCounted被实例化时，以1 作为初始值。

retain()

增加引用计数，将引用计数加1。只要引用计数>0，就能保证对象不会被释放。

release()

减少引用计数，将引用计数减1。若引用计数减少到0 ，对象将被显式释放，并且访问释放的对象通常会导致访问冲突。

若实现ReferenceCounted的对象是其他实现ReferenceCounted的对象的容器，则当容器的引用计数变为 0 时，所包含的对象也将通过release()被释放。

引用计数对于池化实现（如 PooledByteBufAllocator）很重要，它降低了内存分配的开销。

Channel channel = ...;
// 从 Channel 获取 ByteBufAllocator
ByteBufAllocator allocator = channel.alloc();
...
// 从 ByteBufAllocator 分配一个 ByteBuf
ByteBuf buffer = allocator.directBuffer();
// 检查引用计数是否为预期的 1
assert buffer.refCnt() == 1;

ByteBuf buffer = ...;
// 减少该对象的活动引用。当减少到 0 时，该对象被释放，该方法返回 true
boolean released = buffer.release();

试图访问一个已经被释放的引用计数的对象，将会抛IllegalReferenceCountException

一个特定的（ReferenceCounted 的实现）类，可以用它自己的独特方式来定义它的引用计数规则。例如可以设想一个类，其 release()方法的实现总是将引用计数设为
零，而不用关心它的当前值，从而一次性使所有的活动引用都失效。

谁负责释放

一般由最后访问（引用计数）对象的那一方来负责将它释放。

到此这篇关于又又叕出BUG啦!理智分析Java NIO的ByteBuffer到底有多难用的文章就介绍到这了,更多相关Java NIO的ByteBuffer内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Java NIO 文件通道 FileChannel 用法及原理

FileChannel 提供了一种通过通道来访问文件的方式,它可以通过带参数 position(int) 方法定位到文件的任意位置开始进行操作,还能够将文件映射到直接内存,提高大文件的访问效率.本文将介绍其详细用法和原理. 1. 通道获取 FileChannel 可以通过 FileInputStream, FileOutputStream, RandomAccessFile 的对象中的 getChannel() 方法来获取,也可以同通过静态方法 FileChannel.open(Path, Op
Java ByteBuffer网络编程用法实例解析

做tcp网络编程,要解析一批批的数据,可是数据是通过Socket连接的InputStream一次次读取的,读取到的不是需要转换的对象,而是要直接根据字节流和协议来生成自己的数据对象. 按照之前的编程思维,总是请求然后响应,当然Socket也是请求和响应,不过与单纯的请求响应是不同的. 这里Socket连接往往是要保持住的,也就是长连接,然后设置一个缓冲区,网络流不断的追加到缓冲区.然后后台去解析缓冲区的字节流. 如图所示,网络的流一直在传递,我们收到也许是完成的数据流,也可能是没有传递完的.这里
java中BIO、NIO、AIO都有啥区别

一.BIO(Blocking IO,也被称作old IO) 同步阻塞模型,一个客户端连接对应一个处理线程对于每一个新的网络连接都会分配给一个线程,每隔线程都独立处理自己负责的输入和输出, 也被称为Connection Per Thread模式缺点: 1.IO代码里read操作是阻塞操作,如果连接不做数据读写操作会导致线程阻塞,浪费资源 2.如果线程很多,会导致服务器线程太多,压力太大,比如C10K问题所谓c10k问题,指的是服务器同时支持成千上万个客户端的问题,也就是concurrent
Android在JNI中使用ByteBuffer的方法

本文实例讲述了Android在JNI中使用ByteBuffer的方法.分享给大家供大家参考.具体如下: 一.ByteBuffer 定义在NIO中,数据的读写操作始终是与缓冲区相关联的(读取时信道(SocketChannel)将数据读入缓冲区,写入时首先要将发送的数据按顺序填入缓冲区) 缓冲区是定长的,基本上它只是一个列表,它的所有元素都是基本数据类型.ByteBuffer是最常用的缓冲区,它提供了读写其他数据类型的方法,且信道的读写方法只接收ByteBuffer. ByteBuffer有以下几
一文学习Java NIO的ByteBuffer工作原理

网络数据的基本单位永远是 byte(字节).Java NIO 提供 ByteBuffer 作为字节的容器,但该类过于复杂,有点难用. ByteBuf是Netty当中的最重要的工具类,它与JDK的ByteBuffer原理基本上相同,也分为堆内与堆外俩种类型,但是ByteBuf做了极大的优化,具有更简单的API,更多的工具方法和优秀的内存池设计. 1 API Netty 的数据处理 API 通过两个组件暴露--抽象类ByteBuf 和接口 ByteBufHolder. ByteBuf API 的优
Java实现NIO聊天室的示例代码(群聊+私聊)

功能介绍功能:群聊+私发+上线提醒+下线提醒+查询在线用户文件 Utils 需要用maven导入下面两个包 <dependency> <groupId>org.projectlombok</groupId> <artifactId>lombok</artifactId> <version>1.16.18</version> </dependency> <dependency> <group
Java非阻塞I/O模型之NIO相关知识总结

组件说明 (1)Channel:NIO模型中的管道,管道是链接建立和通信的重要组件,我们可以理解管道是一个容器环境,我们所有的I/O的建立读取都可以在这个容器中进行 (2)Selector:NIO中的选择器,NIO是由事件驱动的,当有链接事件或者读取事件发生时,这个事件可以注册到这个选择器上,并且最终被我们检测到. (3)SelectionKey:我们可以在Selector中进行检测是否有SelectionKey产生,并且根据这个SelectionKey中的信息判断时什么事件发生了. 代码说明
浅谈Java中IO和NIO的本质和区别

IO的本质 IO的作用就是从外部系统读取数据到java程序中,或者把java程序中输出的数据写回到外部系统.这里的外部系统可能是磁盘,网络流等等. 因为对所有的外部数据的处理都是由操作系统内核来实现的,对于java应用程序来说,只是调用操作系统中相应的接口方法,从而和外部数据进行交互. 所有IO的本质就是对Buffer的处理,我们把数据放入Buffer供系统写入外部数据,或者从系统Buffer中读取从外部系统中读取的数据.如下图所示: 用户空间也就是我们自己的java程序有一个Buffer,系统
又又叕出BUG啦!理智分析Java NIO的ByteBuffer到底有多难用

一.前言 ByteBuf是Netty当中的最重要的工具类,它与JDK的ByteBuffer原理基本上相同,也分为堆内与堆外俩种类型,但是ByteBuf做了极大的优化,具有更简单的API,更多的工具方法和优秀的内存池设计. 二.API Netty 的数据处理 API 通过两个组件暴露--抽象类ByteBuf 和接口 ByteBufHolder. ByteBuf API 的优点: 它可以被用户自定义的缓冲区类型扩展通过内置的复合缓冲区类型实现了透明的零拷贝: 容量可以按需增长(类似于 JDK 的
Java NIO原理图文分析及代码实现

前言: 最近在分析hadoop的RPC(Remote Procedure Call Protocol ,远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议.可以参考:http://baike.baidu.com/view/32726.htm )机制时,发现hadoop的RPC机制的实现主要用到了两个技术:动态代理(动态代理可以参考博客:http://weixiaolu.iteye.com/blog/1477774 )和java NIO.为了能够正确地分析
详解java JDK 动态代理类分析(java.lang.reflect.Proxy)

详解java JDK 动态代理类分析(java.lang.reflect.Proxy) /** * JDK 动态代理类分析(java.lang.reflect.Proxy使用) * * @author 张明学 * */ public class ProxyStudy { @SuppressWarnings("unchecked") public static void main(String[] args) throws Exception { // 动态代理类:通用指定类加载器,和接
如何利用JConsole观察分析Java程序的运行并进行排错调优

一.JConsole是什么从Java 5开始引入了 JConsole.JConsole 是一个内置 Java 性能分析器,可以从命令行或在 GUI shell 中运行.您可以轻松地使用 JConsole(或者,它更高端的 "近亲" VisualVM )来监控 Java 应用程序性能和跟踪 Java 中的代码. 二.如何启动JConsole 1.如果是从命令行启动,使 JDK 在 PATH 上,运行 jconsole 即可. 2.如果从 GUI shell 启动,找到 JDK 安装路
分析java 中AspectJ切面执行两次的原因

分析java 中AspectJ切面执行两次的原因背景转眼之间,发现博客已经将近半年没更新了,甚是惭愧.话不多说,正如标题所言,最近在使用AspectJ的时候,发现拦截器(AOP切面)执行了两次了.我们知道,AspectJ是AOP的一种解决方案,本质上是通过代理类在目标方法执行通知(Advice),然后由代理类再去调用目标方法.所以,从这点讲,拦截器应该只会执行一次.但是在测试的时候发现拦截器执行了两次. 问题重现既然问题已经明了,那么可以通过代码简单重现这个问题,从而更深层次分析到底是什么
详细分析JAVA加解密算法

加解密算法分析日常开发中,无论你是使用什么语言,都应该遇到过使用加解密的使用场景,比如接口数据需要加密传给前端保证数据传输的安全:HTTPS使用证书的方式首先进行非对称加密,将客户端的私匙传递给服务端,然后双方后面的通信都使用该私匙进行对称加密传输:使用MD5进行文件一致性校验,等等很多的场景都使用到了加解密技术. 很多时候我们对于什么时候要使用什么样的加解密方式是很懵的.因为可用的加解密方案实在是太多,大家对加解密技术的类型可能不是很清楚,今天这篇文章就来梳理一下目前主流的加解密技术,本篇文
详细分析Java内部类——局部内部类

今天介绍第二种内部类--局部内部类. 局部内部类是什么?顾名思义,那就是定义在局部内部的类(逃).开玩笑的,局部内部类就是定义在代码块.方法体内.作用域(使用花括号"{}"括起来的一段代码)内的类.局部内部类有以下特性: 局部内部类只能在代码代码块.方法体内和作用域中使用. 局部内部类同样可以无限制调用外部类的方法和属性. 可以使用abstract修饰,声明为抽象类. 举个栗子: public class Outer2 { public void print(){ class Inne
JVM---jstack分析Java线程CPU占用,线程死锁的解决

本文章主要演示在Windows环境,Linux环境也差不多. 一.分析CPU占用飙高首先写一个Java程序,并模拟一个死循环.让CPU使用率飙高.CPU负载过大的话,新的请求就处理不了了,这就是很多程序变慢了甚至不能访问的原因之一. 下面是我这里的Controller,启动程序之后,开多个请求访问这个方法.死循环代码就不贴了,自己构造.我这里模拟的一个截取字符串的死循环. /** * 演示死循环导致cpu使用率飙高 * */ @RequestMapping("/loop") publ
深度分析java dump文件

JVM dump java内存dump是jvm运行时内存的一份快照,利用它可以分析是否存在内存浪费,可以检查内存管理是否合理,当发生OOM的时候,可以找出问题的原因.那么dump文件的内容是什么样的呢?我们一步一步来获取JVM dump文件获取dump文件的方式分为主动和被动主动方式: 1.利用jmap,也是最常用的方式:jmap -dump:[live],format=b,file= 2.利用jcmd,jcmd GC.heap_dump 3.使用VisualVM,可以界面操作进行dump
分析Java中为什么String不可变

常量池 Java中我们创建String对象有两种基本方法. String str1 = "zxhtom"; String str2 = new String("zxhtom"); 上面两种方式我们创建了两个String变量 . 但是第一种通过双引号创建的zxhtom这个对象我们称之为常量 . 在JVM中是存储在一块叫[常量池]中的.而第二种str2是我们称之为普通变量.new一次就在JVM中开辟一块内存. [常量池]的作用就是复用,当同样的内容再次被通过常量方式创建