Go内存节省技巧简单实现方法

目录
  • 正文
    • 预先分配切片
    • 结构体中的字段顺序
    • 使用 map[string]struct{} 而不是 map[string]bool

正文

除非您正在对服务进行原型设计,否则您可能会关心应用程序的内存使用情况。占用更小的内存,会使基础设施成本降低,扩展变得更容易。尽管 Go 以不消耗大量内存而闻名,但仍有一些方法可以进一步减少消耗。其中一些需要大量重构,但很多都很容易做到。

预先分配切片

要理解这种优化,我们必须了解切片在 Go 中是如何工作的,为此我们必须首先了解数组。

go.dev 上有一篇非常好的关于这个主题的文章。

数组是具有连续内存的相同类型的集合。数组类型定义时要指定长度和元素类型。

因为数组的长度是它们类型的一部分,数组的主要问题是它们大小固定,不能调整。

与数组类型不同,切片类型无需指定长度。切片的声明方式与数组相同,但没有数量元素。

切片是数组的包装器,它们不拥有任何数据——它们是对数组的引用。它们由指向数组的指针、长度及其容量(底层数组中的元素数)组成。

当您向没有足够容量的切片添加一个新值时 - 会创建一个具有更大容量的新数组,并将当前数组中的值复制到新数组中。这会导致不必要的内存分配和 CPU 周期。

为了更好地理解这一点,让我们看一下以下代码段:

func main() {
    var ints []int
    for i := 0; i < 5; i++ {
        ints = append(ints, i)
        fmt.Printf("Address: %p, Length: %d, Capacity: %d, Values: %v\n",
            ints, len(ints), cap(ints), ints)
    }
}

输出:

Address: 0xc000018030, Length: 1, Capacity: 1, Values: [0]
Address: 0xc000018050, Length: 2, Capacity: 2, Values: [0 1]
Address: 0xc000082020, Length: 3, Capacity: 4, Values: [0 1 2]
Address: 0xc000082020, Length: 4, Capacity: 4, Values: [0 1 2 3]
Address: 0xc000084040, Length: 5, Capacity: 8, Values: [0 1 2 3 4]

凭借输出结果我们可以得出结论,无论何时必须增加容量(增加 2 倍),都必须创建一个新的底层数组(新的内存地址)并将值复制到新数组中。

有趣是,当容量<1024 时会涨为之前的 2 倍,当容量>=1024时会以 1.25 倍增长。从 Go 1.18 开始,这已经变得更加线性。

Address: 0xc000018030, Length: 1, Capacity: 1, Values: [0]
Address: 0xc000018050, Length: 2, Capacity: 2, Values: [0 1]
Address: 0xc000082020, Length: 3, Capacity: 4, Values: [0 1 2]
Address: 0xc000082020, Length: 4, Capacity: 4, Values: [0 1 2 3]
Address: 0xc000084040, Length: 5, Capacity: 8, Values: [0 1 2 3 4]func BenchmarkAppend(b *testing.B) {
    var ints []int
    for i := 0; i < b.N; i++ {
        ints = append(ints, i)
    }
}
func BenchmarkPreallocAssign(b *testing.B) {
    ints := make([]int, b.N)
    for i := 0; i < b.N; i++ {
        ints[i] = i
    }
}
func BenchmarkAppend(b *testing.B) {
    var ints []int
    for i := 0; i < b.N; i++ {
        ints = append(ints, i)
    }
}
func BenchmarkPreallocAssign(b *testing.B) {
    ints := make([]int, b.N)
    for i := 0; i < b.N; i++ {
        ints[i] = i
    }
}

name               time/op
Append-10          3.81ns ± 0%
PreallocAssign-10  0.41ns ± 0%

name               alloc/op
Append-10           45.0B ± 0%
PreallocAssign-10   8.00B ± 0%

name               allocs/op
Append-10            0.00
PreallocAssign-10    0.00

由上述基准,我们可以得出结论,将值分配给预分配的切片和将值追加到切片之间是存在很大差异的。

两个工具有助于切片的预分配:

  • prealloc: 一个静态分析工具,用于查找可能被预分配的切片声明。
  • makezero: 一个静态分析工具,用于查找未以零长度初始化且稍后有追加的切片声明。

结构体中的字段顺序

您之前可能没有想到这一点,但结构体中字段的顺序对内存消耗有很大影响。

以下面的结构体为例:

type Post struct {
    IsDraft     bool      // 1 byte
    Title       string    // 16 bytes
    ID          int64     // 8 bytes
    Description string    // 16 bytes
    IsDeleted   bool      // 1 byte
    Author      string    // 16 bytes
    CreatedAt   time.Time // 24 bytes
}
func main(){
    p := Post{}
    fmt.Println(unsafe.Sizeof(p))
}

上述的输出为 96 字节,而所有字段相加为 82 字节。那额外的 14 个字节是来自哪里呢?

现代 64 位 CPU 以 64 位(8 字节)的块获取数据。如果我们有一个较旧的 32 位 CPU,它将以 32 位(4 字节)的块进行。

第一个周期占用 8 个字节,拉取“IsDraft”字段占用了 1 个字节并且产生 7 个未使用字节。它不能占用“一半”的字段。

第二个和第三个周期取 Title 字符串,第四个周期取 ID,依此类推。到取 IsDeleted 字段时,它使用 1 个字节并有 7 个字节未使用。

对内存节省的关键是按字段占用大小从上到下对字段进行排序。对上述结构进行排序,大小可减少到 88 个字节。最后两个字段 IsDraft 和 IsDeleted 被放在同一个块中,从而将未使用的字节数从 14 (2x7) 减少到 6 (1 x 6),在此过程中节省了 8 个字节。

type Post struct {
    CreatedAt   time.Time // 24 bytes
    Title       string    // 16 bytes
    Description string    // 16 bytes
    Author      string    // 16 bytes
    ID          int64     // 8 bytes
    IsDraft     bool      // 1 byte
    IsDeleted   bool      // 1 byte
}
func main(){
    p := Post{}
    fmt.Println(unsafe.Sizeof(p))
}

在 64 位架构上占用小于 8 字节的 Go 类型:

  • bool: 1 个字节
  • int8/uint8: 1 个字节
  • int16/uint16: 2 个字节
  • int32/uint32/rune: 4 个字节
  • float32: 4 个字节
  • byte: 1 个字节

不需要手动检查您的结构体并按大小对其进行排序,而是使用 工具找到这些结构并报告“正确”的排序。

  • maligned - 已弃用,用于报告未对齐的结构并打印出正确排序的字段。它在一年前被弃用,但您仍然可以安装旧版本并使用它。
  • govet/fieldalignment: gotools 和 govet 的一部分工具,fieldalignment 可打印出未对齐的结构和结构的当前/理想大小。

安装和运行 fieldalignment:

go install golang.org/x/tools/go/analysis/passes/fieldalignment/cmd/fieldalignment@latest
fieldalignment -fix &lt;package_path&gt;

对上面的代码使用 govet/fieldalignment:

fieldalignment: struct of size 96 could be 88 (govet)

使用 map[string]struct{} 而不是 map[string]bool

Go 没有内置的集合,通常使用 map[string]bool{} 表示集合。尽管它更具可读性(这非常重要),但将其作为一个集合使用是错误的,因为它具有两种状态(假/真)并且与空结构体相比使用了额外的内存。

空结构体 (struct{}) 是没有额外字段的结构类型,占用零字节的存储空间。Dave Chaney 有一篇关于空结构的详细博客 。

除非您的 map/set 包含大量值并且需要获得额外的内存,否则我建议使用 map[string]struct{}

100 000 000 次 map 写入的极端示例:

func BenchmarkBool(b *testing.B) {
    m := make(map[uint]bool)
    for i := uint(0); i < 100_000_000; i++ {
        m[i] = true
    }
}
func BenchmarkEmptyStruct(b *testing.B) {
    m := make(map[uint]struct{})
    for i := uint(0); i < 100_000_000; i++ {
        m[i] = struct{}{}
    }
}

多次运行程序得到的结果一致(MBP 14 2021,10C M1 Pro):

name            time/op
Bool          12.4s ± 0%
EmptyStruct   12.0s ± 0%

name            alloc/op
Bool         3.78GB ± 0%
EmptyStruct  3.43GB ± 0%

name            allocs/op
Bool          3.91M ± 0%
EmptyStruct   3.90M ± 0%

通过这些数字,我们可以得出结论,使用空结构映射的写入速度提高了 3.2%,分配的内存减少了 10%。

此外,使用map[type]struct{}是实现集合的正确解决方法,因为每个键都有一个值。map[type]bool 每个键有两个可能的值,这不是一个集合,如果目标是创建一个集合,则可能会被滥用。

然而,可读性大多数时候比(可忽略的)内存改进更重要。与空结构体相比,使用布尔值更容易查找:

m := make(map[string]bool{})
if m["key"]{
 // Do something
}
v := make(map[string]struct{}{})
if _, ok := v["key"]; ok{
    // Do something
}

以上就是Go内存节省技巧简单实现详解的详细内容,更多关于Go 内存节省的资料请关注我们其它相关文章!

(0)

相关推荐

  • Go通道channel通过通信共享内存

    目录 引言 通道的声明与创建 接收 & 发送数据 引言 不要通过共享内存来通信 应该通过通信来共享内存 这句话有网友的解释如下: 这句俏皮话具体说来就是,不同的线程不共享内存不用锁,线程之间通讯用通道(channel)同步也用channel. chanel是协程之间传递信息的媒介,优雅地解决了某些后端开发常用语言中随处可见的lock,unlock,临界区等,把从很多线程层面解决的问题移到协程,从而静态地保证没有数据竞争. 通道的声明与创建 伪代码如下: //声明类型 var 通道名 chan 数

  • Go语言开发必知的一个内存模型细节

    目录 引言 内存模型定义是什么 happens-before 是什么 A 不一定 happens-before B Go 语言中的 happens-before 定义 Go Channel 实例 例子 1 例子 2 例子 3 例子 4 总结 引言 在日常工作中,如果我们能够了解 Go 语言内存模型,那会带来非常大的作用.这样在看一些极端情况,又或是变态面试题的时候,就能够明白程序运行表现下的很多根本原因了. 当然,靠一篇普通文章讲完 Go 内存模型,不可能.因此今天这篇文章,把重点划在给大家讲解

  • Golang 内存管理简单技巧详解

    目录 引言 预先分配切片 结构中的顺序字段 使用 map[string]struct{} 而不是 map[string]bool 引言 除非您正在对服务进行原型设计,否则您可能会关心应用程序的内存使用情况.内存占用更小,基础设施成本降低,扩展变得更容易/延迟. 尽管 Go 以不消耗大量内存而闻名,但仍有一些方法可以进一步减少消耗.其中一些需要大量重构,但很多都很容易做到. 预先分配切片 数组是具有连续内存的相同类型的集合.数组类型定义指定长度和元素类型.数组的主要问题是它们的大小是固定的——它们

  • golang进程内存控制避免docker内oom

    目录 背景 测试程序 一.为gc预留空间方案 二.调整gc参数 背景 golang版本:1.16 之前遇到的问题,docker启动时禁用了oom-kill(kill后服务受损太大),导致golang内存使用接近docker上限后,进程会hang住,不响应任何请求,debug工具也无法attatch. 前文分析见:golang进程在docker中OOM后hang住问题 本文主要尝试给出解决方案 测试程序 测试程序代码如下,协程h.allocate每秒检查内存是否达到800MB,未达到则申请内存,协

  • Golang 内存模型The Go Memory Model

    目录 1. 简介(Introduction) 2. 建议(Advice) 3. 发生在…之前(Happens Before) 3.1 重排序 3.2 happens-before 3.3 规则 4. 同步(Synchronization) 4.1 初始化(Initialization) 4.2 Go协程的创建(Goroutine creation) 4.3 Go协程的销毁(Goroutine destruction) 4.4 信道通信(Channel communication) 有缓存chan

  • Go map发生内存泄漏解决方法

    目录 正文 hamp 结构体代码 查看占用的内存数量 对于 map 内存泄漏的解法 正文 Go 程序运行时,有些场景下会导致进程进入某个“高点”,然后就再也下不来了. 比如,多年前曹大写过的一篇文章讲过,在做活动时线上涌入的大流量把 goroutine 数抬升了不少,流量恢复之后 goroutine 数也没降下来,导致 GC 的压力升高,总体的 CPU 消耗也较平时上升了 2 个点左右. 有一个 issue 讨论为什么 allgs(runtime 中存储所有 goroutine 的一个全局 sl

  • Go内存节省技巧简单实现方法

    目录 正文 预先分配切片 结构体中的字段顺序 使用 map[string]struct{} 而不是 map[string]bool 正文 除非您正在对服务进行原型设计,否则您可能会关心应用程序的内存使用情况.占用更小的内存,会使基础设施成本降低,扩展变得更容易.尽管 Go 以不消耗大量内存而闻名,但仍有一些方法可以进一步减少消耗.其中一些需要大量重构,但很多都很容易做到. 预先分配切片 要理解这种优化,我们必须了解切片在 Go 中是如何工作的,为此我们必须首先了解数组. go.dev 上有一篇非

  • php单例模式的简单实现方法

    php单例模式的简单实现方法 <?php /** * 设计模式之单例模式 * $_instance必须声明为静态的私有变量 * 构造函数和析构函数必须声明为私有,防止外部程序new * 类从而失去单例模式的意义 * getInstance()方法必须设置为公有的,必须调用此方法 * 以返回实例的一个引用 * ::操作符只能访问静态变量和静态函数 * new对象都会消耗内存 * 使用场景:最常用的地方是数据库连接. * 使用单例模式生成一个对象后, * 该对象可以被其它众多对象所使用. */ cl

  • Python下载网络文本数据到本地内存的四种实现方法示例

    本文实例讲述了Python下载网络文本数据到本地内存的四种实现方法.分享给大家供大家参考,具体如下: import urllib.request import requests from io import StringIO import numpy as np import pandas as pd ''' 下载网络文件,并导入CSV文件作为numpy的矩阵 ''' # 网络数据文件地址 url = "http://archive.ics.uci.edu/ml/machine-learning

  • Java链表数据结构及其简单使用方法解析

    目录 认识链表结构 单向链表 双向链表 加深对链表结构的理解 实现单向和双向链表的反转 实现把链表中给定的值都删除 小结 认识链表结构 单向链表 单链表在内存中的表示: 可以看到,一个链表的节点包含数据域和指向下一个节点的引用,链表最后一个节点指向null(空区域). 我们可以根据这一定义,用Java语言表示一下单向链表的结构: public class Node { public int value; public Node next; public Node(int value) { thi

  • AngularJS表格样式简单设置方法示例

    本文实例讲述了AngularJS表格样式简单设置方法.分享给大家供大家参考,具体如下: 1.问题背景 AngularJS表格table,利用样式设置表格间隔色 2.实现源码 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>AngularJS之表格设置样式</title> <link rel="stylesheet" h

  • Tomcat内存溢出分析及解决方法

    JVM管理两种类型的内存,堆和非堆.堆是给开发人员用的上面说的就是,是在JVM启动时创建:非堆是留给JVM自己用的,用来存放类的信息的.它和堆不同,运行期内GC不会释放空间. 一.内存溢出类型 1.java.lang.OutOfMemoryError: PermGen space JVM管理两种类型的内存,堆和非堆.堆是给开发人员用的上面说的就是,是在JVM启动时创建;非堆是留给JVM自己用的,用来存放类的信息的.它和堆不同,运行期内GC不会释放空间.如果web app用了大量的第三方jar或者

  • Android开发之背景动画简单实现方法

    本文实例讲述了Android开发之背景动画简单实现方法.分享给大家供大家参考,具体如下: 1.先创建动画层,有三张图片 <?xml version="1.0" encoding="utf-8"?> <animation-list xmlns:android="http://schemas.android.com/apk/res/android" > <item android:drawable="@draw

  • JavaScript对象封装的简单实现方法(3种方法)

    本文实例讲述了JavaScript对象封装的简单实现方法.分享给大家供大家参考,具体如下: Javascript在HTML中变得越来越强大,富客户端,HTML5中的WebGL等.但是我们书写Javascript的时候往往很随意,使用对象的封装是极好的.这里介绍Javascipt三种创建对象的方法. 1. 使用关键字new创建对象 function Person(name, age) { this.name = name; this.age = age; } var p = new Person(

  • JS二叉树的简单实现方法示例

    本文实例讲述了JS二叉树的简单实现方法.分享给大家供大家参考,具体如下: 今天学习了一下 二叉树的实现,在此记录一下 简单的二叉树实现,并且实现升序和降序排序输出 function Node(data , left,right){ this.data = data; this.left = left; this.right = right; this.show = show; function show(){ return this.data; } }; function Bst(){ this

  • java web中图片验证码功能的简单实现方法

    用户在注册网站信息的时候基本上都要数据验证码验证.那么图片验证码功能该如何实现呢? 大概步骤是: 1.在内存中创建缓存图片 2.设置背景色 3.画边框 4.写字母 5.绘制干扰信息 6.图片输出 废话不多说,直接上代码 package com.lsgjzhuwei.servlet.response; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.Buffer

随机推荐