Go如何优雅的使用字节池示例详解

目录
  • 背景
  • 为何需要字节池
  • 最简单的方式
    • 测试
      • 不预先申请空间
      • 预先申请空间
      • 字节数组池
      • 测试结果
  • 更优雅的方式
    • 测试
      • 直接使用Buffer
      • bytes.Buffer池
      • 测试结果
  • 限制池大小
    • 测试
      • 固定大小字节池
      • 测试结果
  • 总结
  • 总结

背景

在某些场景下,我们可能会大量的使用字节数组,比如IO操作、编解码,如果不进行优化,大量的申请和释放字节数组会造成一定的性能损耗,因此有必要复用字节数组。

为何需要字节池

在 Go 语言编程中,在从 io.Reader 中读取数据时,我们都要创建一个字节切片 []byte 去存储,在高频调用或并发比较高的场景中,需要频繁的进行内存申请和释放,增大了 GC 的压力,所以这时候需要采用 “字节池” 来优化。

最简单的方式

对于Go语言来说,我们第一个想到的就是使用sync.Pool来做字节数组的对象池,比如这样:

package bufferpool

import "sync"

type BytePool struct {
	p sync.Pool
}

func NewBytePool(size, cap int) *BytePool {
	if size > cap {
		panic("size must be less then cap")
	}
	p := &BytePool{}
	p.p.New = func() any {
		return make([]byte, size, cap)
	}
	return p
}

// 获取字节数组
func (p *BytePool) Get() []byte {
	return p.p.Get().([]byte)
}

// 归还字节数组
func (p *BytePool) Put(b []byte) {
	// 重置已用大小
	b = b[:0]
	p.p.Put(b)
}

我们简单的封装了sync.Poolsync.Pool.New根据指定的初始大小申请新的字节数组,在Put的时候重置字节数组的已用空间(这样下次才能从头开始使用)。

测试

我们进行一个简单性能测试,也就是不断的申请字节数组,然后写入长度为1024的字节数组块,共64块,也就是64KB,测试样例共3个:

不预先申请空间

这个样例我们不预先申请字节数组空间,因此在append的过程中会不断的申请新的更大的空间,然后转移字节数组内容。

func BenchmarkByte(b *testing.B) {
	for n := 0; n < b.N; n++ {
                // 从长度为0的字节数组开始
		var b []byte
		for i := 0; i < blocks; i++ {
			b = append(b, block...)
		}
	}
}

预先申请空间

由于这个测试的总大小的预先知道的,因此我们可以先提前申请空间,这样就不用在append过程中不断的申请新的更大空间,然后转移字节数组内容了。

func BenchmarkMake(b *testing.B) {
	for n := 0; n < b.N; n++ {
                // 预先保留需要的空间
		b := make([]byte, 0, blocks*blockSize)
		for i := 0; i < blocks; i++ {
			b = append(b, block...)
		}
	}
}

字节数组池

这里我们每次先从字节池拿一个字节数组Get(),使用完之后归还字节池Put()

func BenchmarkBytePool(b *testing.B) {
	pool := NewBytePool(0, blocks*blockSize)
	for n := 0; n < b.N; n++ {
                // 拿字节数组
		b := pool.Get()
		for i := 0; i < blocks; i++ {
			b = append(b, block...)
		}
                // 归还
		pool.Put(b)
	}
}

测试结果

可以看到我们简单的字节池就可以带来很大的性能提升!

BenchmarkByte-16                   32470             38136 ns/op
BenchmarkMake-16                  605449              1962 ns/op
BenchmarkBytePool-16             1000000              1162 ns/op

更优雅的方式

在实际的编程中,我们在使用字节数组时,很多时候都需要以一个流的形式去读写,同时也可能很难提前计算出需要的大小,因此bytes.Buffer可能更加适合实际的编程。

package bufferpool

import (
	"bytes"
	"sync"
)

type BufferPool struct {
	p sync.Pool
}

func NewBufferPool(size, cap int) *BufferPool {
	if size > cap {
		panic("size must be less then cap")
	}
	p := &BufferPool{}
	p.p.New = func() any {
		var b []byte
		if cap > 0 {
			b = make([]byte, size, cap)
		}
		return bytes.NewBuffer(b)
	}
	return p
}

// 获取字节数组
func (p *BufferPool) Get() *bytes.Buffer {
	return p.p.Get().(*bytes.Buffer)
}

// 归还字节数组
func (p *BufferPool) Put(b *bytes.Buffer) {
	// 重置已用大小
	b.Reset()
	p.p.Put(b)
}

测试

测试条件与上面相同。

直接使用Buffer

作为对比实验我们直接使用Buffer。

func BenchmarkBuffer(b *testing.B) {
	for n := 0; n < b.N; n++ {
		b := bytes.NewBuffer(make([]byte, 0, blocks*blockSize))
		for i := 0; i < blocks; i++ {
			b.Write(block)
		}
	}
}

bytes.Buffer池

func BenchmarkBufferPool(b *testing.B) {
	pool := NewBufferPool(0, blocks*blockSize)
	for n := 0; n < b.N; n++ {
		b := pool.Get()
		for i := 0; i < blocks; i++ {
			b.Write(block)
		}
		pool.Put(b)
	}
}

测试结果

可以看到使用bytes.Buffer池比字节数组池性能差了一点,主要是因为bytes.Buffer比较复杂,但是bytes.Buffer的功能比字节数组强大很多。

BenchmarkByte-16                   31748             38131 ns/op
BenchmarkMake-16                  605847              1964 ns/op
BenchmarkBytePool-16             1000000              1162 ns/op
BenchmarkBuffer-16                589336              2030 ns/op
BenchmarkBufferPool-16            962132              1235 ns/op

限制池大小

有时候我们不想对象池无限大,因此我们需要限制对象池的大小,对于Go语言来说,我们可以使用channel+select,也就是申请一个固定长度缓冲区的channel,配合select的default分支。

  • Put:channel不满则put,否则default分支丢弃这个对象。
  • Get:channel不空则get,否则default分支申请新对象。

这里我们直接使用minio的实现: github.com/minio/minio…

package bufferpool

type ByteFixPool struct {
	cache chan []byte
	size  int
	cap   int
}

// cacheSize: 字节池缓存长度
// size: 字节数组长度
// cap: 字节数组容量
func NewByteFixPool(cacheSize, size, cap int) *ByteFixPool {
	if size > cap {
		panic("size must be less then cap")
	}
	return &ByteFixPool{
		cache: make(chan []byte, cacheSize),
		size:  size,
		cap:   cap,
	}
}

func (p *ByteFixPool) Get() []byte {
	select {
	// 从channel读
	case b := <-p.cache:
		return b
		// 如果channel空则申请一个新的字节数组
	default:
		return make([]byte, p.size, p.cap)
	}
}

func (p *ByteFixPool) Put(b []byte) {
	// 重置已用大小
	b = b[:0]
	select {
	// 放入channel
	case p.cache <- b:
	// channel满了则丢弃字节数组
	default:
	}
}

测试

固定大小字节池

这里使用固定大小字节池,同时预先分配空间。

func BenchmarkByteFixPool(b *testing.B) {
	pool := NewByteFixPool(16, 0, blocks*blockSize)
	for n := 0; n < b.N; n++ {
		b := pool.Get()
		for i := 0; i < blocks; i++ {
			b = append(b, block...)
		}
		pool.Put(b)
	}
}

测试结果

可以看到使用channel+select的性能甚至更好一点,而且还能限制字节池大小,当然相比于sync.Pool的实现,它在字节池channel里面的空间是没办法自动回收的。

BenchmarkByte-16                   31748             38131 ns/op
BenchmarkMake-16                  605847              1964 ns/op
BenchmarkBytePool-16             1000000              1162 ns/op
BenchmarkBuffer-16                589336              2030 ns/op
BenchmarkBufferPool-16            962132              1235 ns/op
BenchmarkByteFixPool-16          1000000              1130 ns/op

总结

对于字节池来说。

字节对象可以是:

  • []byte:字节数组
  • bytes.Buffer:功能更加强大的字节数组
  • 其他:比如一组bytes.Buffer

实现方式可以是:

  • sync.Pool:根据GC期间对象是否使用回收对象
  • channel+select:限制字节池长度
  • 其他:比如限制对象池使用空间

当然,最通用的实现是sync.Pool+bytes.Buffer,因为sync.Pool能够自动回收字节对象,bytes.Buffer又能提供强大的功能。

上面介绍的几种都是比较常用的,而且实现也非常简单的字节池,如果在业务中有更加复杂的需求,也可以根据需求实现一个字节池。

代码地址:github.com/jiaxwu/gomm…

总结

到此这篇关于Go如何优雅的使用字节池的文章就介绍到这了,更多相关Go优雅使用字节池内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 简单谈谈Golang中的字符串与字节数组

    前言 字符串是 Go 语言中最常用的基础数据类型之一,虽然字符串往往都被看做是一个整体,但是实际上字符串是一片连续的内存空间,我们也可以将它理解成一个由字符组成的数组,Go 语言中另外一个与字符串关系非常密切的类型就是字节(Byte)了,相信各位读者也都非常了解,这里也就不展开介绍. 我们在这一节中就会详细介绍这两种基本类型的实现原理以及它们的转换关系,但是这里还是会将介绍的重点主要放在字符串上,因为这是我们接触最多的一种基本类型并且后者就是一个简单的 uint8 类型,所以会给予 string

  • Go语言按字节截取字符串的方法

    本文实例讲述了Go语言按字节截取字符串的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: // 按字节截取字符串 utf-8不乱码 func SubstrByByte(str string, length int) string {     bs := []byte(str)[:length]     bl := 0     for i:=len(bs)-1; i>=0; i-- {         switch {         case bs[i] >= 0 &

  • Go如何优雅的使用字节池示例详解

    目录 背景 为何需要字节池 最简单的方式 测试 不预先申请空间 预先申请空间 字节数组池 测试结果 更优雅的方式 测试 直接使用Buffer bytes.Buffer池 测试结果 限制池大小 测试 固定大小字节池 测试结果 总结 总结 背景 在某些场景下,我们可能会大量的使用字节数组,比如IO操作.编解码,如果不进行优化,大量的申请和释放字节数组会造成一定的性能损耗,因此有必要复用字节数组. 为何需要字节池 在 Go 语言编程中,在从 io.Reader 中读取数据时,我们都要创建一个字节切片

  • java中常见的6种线程池示例详解

    之前我们介绍了线程池的四种拒绝策略,了解了线程池参数的含义,那么今天我们来聊聊Java 中常见的几种线程池,以及在jdk7 加入的 ForkJoin 新型线程池 首先我们列出Java 中的六种线程池如下 线程池名称 描述 FixedThreadPool 核心线程数与最大线程数相同 SingleThreadExecutor 一个线程的线程池 CachedThreadPool 核心线程为0,最大线程数为Integer. MAX_VALUE ScheduledThreadPool 指定核心线程数的定时

  • Python异步爬虫多线程与线程池示例详解

    目录 背景 异步爬虫方式 多线程,多进程(不建议) 线程池,进程池(适当使用) 单线程+异步协程(推荐) 多线程 线程池 背景 当对多个url发送请求时,只有请求完第一个url才会接着请求第二个url(requests是一个阻塞的操作),存在等待的时间,这样效率是很低的.那我们能不能在发送请求等待的时候,为其单独开启进程或者线程,继续请求下一个url,执行并行请求 异步爬虫方式 多线程,多进程(不建议) 好处:可以为相关阻塞的操作单独开启线程或者进程,阻塞操作就可以异步会执行 弊端:不能无限制开

  • 优雅使用GoFrame共享变量Context示例详解

    目录 前言摘要 Context是什么? 为什么需要Context? Context是如何实现共享变量的? 如何使用? 一.结构定义 介绍 二.逻辑封装 三.上下文变量注入 四.上下文变量使用 方法定义 Context对象获取 自定义Key-Value 五.注意问题 总结 前言摘要 昨天和同事merge代码又遇到了很多冲突,发现之前有些方法写的参数不规范,没有传入Context,不方便进行链路追踪.他在review项目代码,基本把项目中的方法都加了Context参数. 今天就为大家介绍一下Cont

  • Java字符串常量池示例详解

    为什么会有常量池的概念? 不知道小伙伴们是否有思考过这个问题? 没有思考也无所谓,小编在这里类比一下,大家就会清晰了.什么是池? 我们听的最多的池,应该是数据库连接池. 为什么会有数据库连接池,其实就是为了节省资源,提高性能,防止重复创建连接,避免占用内存和网络资源. 常量池其实就是跟数据库连接池的目的都是一样的.那么他是如何实现的呢? 因为常量池是JVM的概念,源码我们也不好看,所以我们还以连接池来类比. 池化的目标就是缓存和管理 稍微提一点池化的概念,其实就是对资源做一个包装,在包装层来加一

  • Spring Boot之@Async异步线程池示例详解

    目录 前言 一. Spring异步线程池的接口类 :TaskExecutor 二.简单使用说明 三.定义通用线程池 1.定义线程池 2.异步方法使用线程池 3.通过xml配置定义线程池 四.异常处理 五.问题 前言 很多业务场景需要使用异步去完成,比如:发送短信通知.要完成异步操作一般有两种: 1.消息队列MQ 2.线程池处理. 我们来看看Spring框架中如何去使用线程池来完成异步操作,以及分析背后的原理. 一. Spring异步线程池的接口类 :TaskExecutor 在Spring4中,

  • C#的通用DbHelper类(支持数据连接池)示例详解

    每次新项目的时候,都要从头去找一遍数据库工具类.这里分享一个简单实用的C#的通用DbHelper工具类,支持数据连接池. 连接池配置 <connectionStrings> <add name="dh_web" connectionString="Data Source=xxx.com;Initial Catalog=xx_db;User ID=xx;Password=**; pooling=true;max pool size=200" prov

  • python编程中简洁优雅的推导式示例详解

    目录 1. 列表推导式 增加条件语句 多重循环 更多用法 2. 字典推导式 3. 集合推导式 4. 元组推导式 Python语言有一种独特的推导式语法,相当于语法糖的存在,可以帮助你在某些场合写出较为精简酷炫的代码.但没有它,也不会有太多影响.Python语言有几种不同类型的推导式. 1. 列表推导式 列表推导式是一种快速生成列表的方式.其形式是用方括号括起来的一段语句,如下例子所示: lis = [x * x for x in range(1, 10)] print(lis) 输出 [1, 4

  • java线程池ThreadPoolExecutor的八种拒绝策略示例详解

    目录 池化设计思想 线程池触发拒绝策略的时机 JDK内置4种线程池拒绝策略 拒绝策略接口定义 AbortPolicy(中止策略) DiscardPolicy(丢弃策略) DiscardOldestPolicy(弃老策略) 第三方实现的拒绝策略 Dubbo 中的线程拒绝策略 Netty 中的线程池拒绝策略 ActiveMQ 中的线程池拒绝策略 PinPoint 中的线程池拒绝策略 谈到 Java 的线程池最熟悉的莫过于 ExecutorService 接口了,jdk1.5 新增的 java.uti

  • Golang WorkerPool线程池并发模式示例详解

    目录 正文 处理CVS文件记录 获取测试数据 线程池耗时差异 正文 Worker Pools 线程池是一种并发模式.该模式中维护了固定数量的多个工作器,这些工作器等待着管理者分配可并发执行的任务.该模式避免了短时间任务创建和销毁线程的代价. 在 golang 中,我们使用 goroutine 和 channel 来构建这种模式.工作器 worker 由一个 goroutine 定义,该 goroutine 通过 channel 获取数据. 处理CVS文件记录 接下来让我们通过一个例子,来进一步理

随机推荐