详解Go内存模型

介绍

Go 内存模型规定了一些条件,在这些条件下,在一个 goroutine 中读取变量返回的值能够确保是另一个 goroutine 中对该变量写入的值。【翻译这篇文章花费了我 3 个半小时 】

Happens Before(在…之前发生)

在一个 goroutine 中,读操作和写操作必须表现地就好像它们是按照程序中指定的顺序执行的。这是因为,在一个 goroutine 中编译器和处理器可能重新安排读和写操作的执行顺序(只要这种乱序执行不改变这个 goroutine 中在语言规范中定义的行为)。

因为乱序执行的存在,一个 goroutine 观察到的执行顺序可能与另一个 goroutine 观察到的执行顺序不同。 比如,如果一个 goroutine 执行a = 1; b = 2;,另一个 goroutine 可能观察到 b 的值在 a 之前更新。

为了规定读取和写入的必要条件,我们定义了 happens before (在…之前发生),一个在 Go 程序中执行内存操作的部分顺序。如果事件 e1 发生在事件 e2 之前,那么我们说 e2 发生在 e1 之后。同样,如果 e1 不在 e2 之前发生也不在 e2 之后发生,那么我们说 e1 和 e2 同时发生。

在一个单独的 goroutine 中,happens-before 顺序就是在程序中的顺序。

一个对变量 v 的 读操作 r 可以被允许观察到一个对 v 的写操作 w,如果下列条件同时满足:

r 不在 w 之前发生在 w 之后,r 之前,没有其他对 v 的写入操作 w' 发生。

为了确保一个对变量 v 的读操作 r 观察到一个对 v 的 写操作 w,必须确保 w 是唯一的 r 允许的写操作。就是说下列条件必须同时满足:

w 在 r 之前发生任何其他对共享的变量 v 的写操作发生在 w 之前或 r 之后。

这两个条件比前面两个条件要严格,它要求不能有另外的写操作与 w 或 r 同时发生。

在一个单独的 goroutine 中,没有并发存在,所以这两种定义是等价的:一个读操作 r 观察到的是最近对 v 的写入操作 w 。当多个 goroutine 访问一个共享的变量 v 时,它们必须使用同步的事件来建立 happens-before 条件来确保读操作观察到预期的写操作。

在内存模型中,使用零值初始化一个变量的 v 的行为和写操作的行为一样。

读取和写入超过单个机器字【32 位或 64 位】大小的值的行为和多个无序地操作单个机器字的行为一样。

同步

初始化

程序初始化操作在一个单独的 goroutine 中运行,但是这个 goroutine 可能创建其他并发执行的 goroutines。

如果包 p 导入了包 q,那么 q 的 init 函数执行完成发生在 p 的任何 init 函数执行之前。

函数 main.main【也就是 main 函数】 的执行发生在所有的 init 函数完成之后。

Goroutine 创建

启动一个新的 goroutine 的 go 语句的执行在这个 goroutine 开始执行前发生。

比如,在这个程序中:

var a string

func f() {
	print(a) // 后
}

func hello() {
	a = "hello, world"
	go f() // 先
}

调用 hello 函数将会在之后的某个事件点打印出 “hello, world”。【因为 a = “hello, world” 语句在 go f() 语句之前执行,而 goroutine 执行的函数 f 在 go f() 语句之后执行,a 的值已经初始化了 】

Goroutine 销毁

goroutine 的退出不保证发生在程序中的任何事件之前。比如,在这个程序中:

var a string

func hello() {
	go func() { a = "hello" }()
	print(a)
}

a 的赋值之后没有跟随任何同步事件,所以不能保证其他的 goroutine 能够观察到赋值操作。事实上,一个激进的编译器可能删除掉整个 go 语句。

如果在一个 goroutine 中赋值的效果必须被另一个 goroutine 观察到,那么使用锁或者管道通信这样的同步机制来建立一个相对的顺序。

管道通信

管道通信是在 goroutine 间同步的主要方法。一个管道的发送操作匹配【对应】一个管道的接收操作(通常在另一个 goroutine 中)。

一个在有缓冲的管道上的发送操作在相应的接收操作完成之前发生。

这个程序:

var c = make(chan int, 10) // 有缓冲的管道
var a string

func f() {
	a = "hello, world"
	c <- 0 // 发送操作,先
}

func main() {
	go f()
	<-c // 接收操作,后
	print(a)
}

能够确保输出 “hello, world”。因为对 a 的赋值操作在发送操作前完成,而接收操作在发送操作之后完成。

关闭一个管道发生在从管道接收一个零值之前。

在之前的例子中,将 c <- 0 语句替换成 close(c) 效果是一样的。

一个在无缓冲的管道上的接收操作在相应的发送操作完成之前发生。

这个程序 (和上面一样,使用无缓冲的管道,调换了发送和接收操作):

var c = make(chan int) // 无缓冲的管道
var a string

func f() {
	a = "hello, world"
	<-c // 接收操作,先
}

func main() {
	go f()
	c <- 0 // 发送操作,后
	print(a)
}

也会确保输出 “hello, world”。

如果管道是由缓冲的 (比如, c = make(chan int, 1))那么程序不能够确保输出 "hello, world". (它可能会打印出空字符串、或者崩溃、或者做其他的事)

在一个容量为 C 的管道上的第 k 个接收操作在第 k+C 个发送操作完成之前发生。

该规则将前一个规则推广到带缓冲的管道。它允许使用带缓冲的管道实现计数信号量模型:管道中的元素数量对应于正在被使用的数量【信号量的计数】,管道的容量对应于同时使用的最大数量,发送一个元素获取信号量,接收一个元素释放信号量。这是一个限制并发的常见用法。

下面的程序对工作列表中的每一项启动一个 goroutine 处理,但是使用 limit 管道来确保同一时间内只有 3 个工作函数在运行。

var limit = make(chan int, 3)

func main() {
	for _, w := range work {
		go func(w func()) {
			limit <- 1 // 获取信号量
			w()
			<-limit // 释放信号量
		}(w)
	}
	select{}
}

sync 包实现了两个锁数据类型,sync.Mutexsync.RWMutex

对任何 sync.Mutexsync.RWMutex 类型的变量 ln < m,第 n 个l.Unlock()操作在第 m 个 l.Lock() 操作返回之前发生。

这个程序:

var l sync.Mutex
var a string

func f() {
	a = "hello, world"
	l.Unlock() // 第一个 Unlock 操作,先
}

func main() {
	l.Lock()
	go f()
	l.Lock() // 第二个 Lock 操作,后
	print(a)
}

保证会打印出"hello, world"

Once

sync 包提供了 Once 类型,为存在多个 goroutine 时的初始化提供了一种安全的机制。多个线程可以为特定的 f 执行一次 once.Do(f),但是只有一个会运行 f(),其他的调用将会阻塞直到 f() 返回。

一个从 once.Do(f) 调用的 f()的返回在任何 once.Do(f) 返回之前发生。

在这个程序中:

var a string
var once sync.Once

func setup() {
	a = "hello, world" // 先
}

func doprint() {
	once.Do(setup)
	print(a) // 后
}

func twoprint() {
	go doprint()
	go doprint()
}

调用 twoprint 只会调用 setup 一次。setup 函数在调用 print 函数之前完成。结果将会打印两次"hello, world"。

不正确的同步

注意到一个读操作 r 可能观察到与它同时发生的写操作w 写入的值。当这种情况发生时,那也不能确保在 r 之后发生的读操作能够观察到在 w 之前发生的写操作。

在这个程序中:

var a, b int

func f() {
	a = 1
	b = 2
}

func g() {
	print(b)
	print(a)
}

func main() {
	go f()
	g()
}

可能会发生函数 g 输出 2 然后 0 的情况。【b 的值输出为2,说明已经观察到了 b 的写入操作。但是之后读取 a 的值却为 0,说明没有观察到 b 写入之前的 a 写入操作!不能以为 b 的值是 2,那么 a 的值就一定是 1 !】

这个事实使一些常见的处理逻辑无效。

比如,为了避免锁带来的开销,twoprint 那个程序可能会被不正确地写成:

var a string
var done bool

func setup() {
	a = "hello, world"
	done = true
}

func doprint() {
	if !done { // 不正确!
		once.Do(setup)
	}
	print(a)
}

func twoprint() {
	go doprint()
	go doprint()
}

这样写不能保证在 doprint 中观察到了对 done 的写入。这个版本可能会不正确地输出空串。

另一个不正确的代码逻辑是循环等待一个值改变:

var a string
var done bool

func setup() {
	a = "hello, world"
	done = true
}

func main() {
	go setup()
	for !done { // 不正确!
	}
	print(a)
}

和之前一样,在 main 中,观察到了对 done 的写入并不意味着观察到了对 a 的写入,所以这个程序可能也会打印一个空串。更糟糕的是,不能够保证对 done 的写入会被 main 观察到,因为两个线程间没有同步事件。 在 main 中的循环不能确保会完成。

类似的程序如下:

type T struct {
	msg string
}

var g *T

func setup() {
	t := new(T)
	t.msg = "hello, world"
	g = t
}

func main() {
	go setup()
	for g == nil { // 不正确
	}
	print(g.msg)
}

即使 main 观察到了 g != nil,退出了循环,也不能确保它观察到了 g.msg 的初始值。

在所有这些例子中,解决方法都是相同的:使用显示地同步。

到此这篇关于Go 内存模型的文章就介绍到这了,更多相关Go 内存模型内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Golang 内存模型详解(一)

    开始之前 首先,这是一篇菜B写的文章,可能会有理解错误的地方,发现错误请斧正,谢谢. 为了治疗我的懒癌早期,我一次就不写得太多了,这个系列想写很久了,每次都是开了个头就没有再写.这次争取把写完,弄成一个系列. 此 nil 不等彼 nil 先声明,这个标题有标题党的嫌疑. Go 的类型系统是比较奇葩的,nil 的含义跟其它语言有些差别,这里举个例子(可以直接进入 http://play.golang.org/p/ezFhXX0dnB 运行查看结果): 复制代码 代码如下: package main

  • 详解Go内存模型

    介绍 Go 内存模型规定了一些条件,在这些条件下,在一个 goroutine 中读取变量返回的值能够确保是另一个 goroutine 中对该变量写入的值.[翻译这篇文章花费了我 3 个半小时 ] Happens Before(在-之前发生) 在一个 goroutine 中,读操作和写操作必须表现地就好像它们是按照程序中指定的顺序执行的.这是因为,在一个 goroutine 中编译器和处理器可能重新安排读和写操作的执行顺序(只要这种乱序执行不改变这个 goroutine 中在语言规范中定义的行为)

  • 详解Java内存溢出的几种情况

    JVM(Java虚拟机)是一个抽象的计算模型.就如同一台真实的机器,它有自己的指令集和执行引擎,可以在运行时操控内存区域.目的是为构建在其上运行的应用程序提供一个运行环境.JVM可以解读指令代码并与底层进行交互:包括操作系统平台和执行指令并管理资源的硬件体系结构. 1. 前言 JVM提供的内存管理机制和自动垃圾回收极大的解放了用户对于内存的管理,大部分情况下不会出现内存泄漏和内存溢出问题.但是基本不会出现并不等于不会出现,所以掌握Java内存模型原理和学会分析出现的内存溢出或内存泄漏,对于使用J

  • 详解SpringCloudGateway内存泄漏问题

    SpringCloudGateway内存泄漏问题 项目完善差不多,在进入压力测试阶段期间,发现了gateway有内存泄漏问题,问题发现的起因是,当时启动一台gateway,一台对应的下游应用服务,在压力测试期间,发现特别不稳定,并发量时高时低,而且会有施压机卡住的现象,然后找到容器对应的宿主机,并使用container stats命令观察内存,经过观察发现,压力测试时内存会暴涨,并由于超过限制最大内存导致容器挂掉(这里由于用的swarm所以会自动选择节点重启)最终发现由于之前测试服务器配置低,所

  • 详解JAVA 内存管理

    前一段时间粗略看了一下<深入Java虚拟机 第二版>,可能是因为工作才一年的原因吧,看着十分的吃力.毕竟如果具体到细节的话,Java虚拟机涉及的内容太多了.可能再过一两年去看会合适一些吧. 不过看了一遍<深入Java虚拟机>再来理解Java内存管理会好很多.接下来一起学习下Java内存管理吧. 请注意上图的这个: 我们再来复习下进程与线程吧: 进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位. 线程是进程的一个实体,是CPU调

  • 详解python 内存优化

    写在之前 围绕类的话题,说是说不完的,仅在特殊方法,除了我们在前面遇到过的 __init__(),__new__(),__str__() 等之外还有很多.虽然它们只是在某些特殊的场景中才会用到,但是学会它们却可以成为你熟悉这门语言路上的铺路石. 所以我会在试图介绍一些「黑魔法」,让大家多多感受一下 Python 的魅力所在,俗话说「艺多不压身」就是这个道理了. 内存优化 首先先让我们从复习前面的类属性和实例属性的知识来引出另一个特殊方法: >>> class Sample: ... na

  • 详解JavaScript执行模型

    JavaScript执行模型 引言 JavaScript是一个单线程(Single-threaded)异步(Asynchronous)非阻塞(Non-blocking)并发(Concurrent)语言,这些语言效果通过一个调用栈(Call Stack).一个事件循环(Event Loop).一个回调队列(Callback Queue)有些时候也叫任务队列(Task Queue)与跟运行环境相关的API组成. 概念 调用栈 Call Stack 调用栈是一个LIFO后进先出数据结构的函数运行栈,它

  • 详解C++ 内存对齐

    操作系统64位和32位有什么区别? 64位操作系统意味着其cpu拥有更大的寻址能力.理论上来说,其性能相比于32位操作系统会提升1倍.但是这也需要在64位操作系统上运行的软件也是64位的. 软件中数据类型的的字节数大小其实和操作系统是多少位的没有关系,而是由编译器决定的.也就是说数据结构占多少位取决于在软件编译时我们选择的是64位还是32位的编译器.其具体占位数在编译器已经决定了. 数据类型对应字节数 下面是不同位数编译器下基本数据类型对应的字节数. 32位编译器: char :1个字节 cha

  • Java基础详解之内存泄漏

    一.什么是内存泄漏 内存泄漏是指你向系统申请分配内存进行使用(new/malloc),然后系统在堆内存中给这个对象申请一块内存空间,但当我们使用完了却没有归系统(delete),导致这个不使用的对象一直占据内存单元,造成系统将不能再把它分配给需要的程序. 一次内存泄漏的危害可以忽略不计,但是内存泄漏堆积则后果很严重,无论多少内存,迟早会被占完,造成内存泄漏. 二.Java内存泄漏引起的原因 1.静态集合类引起内存泄漏: 像HashMap.Vector等的使用最容易出现内存泄露,这些静态变量的生命

  • 详解php内存管理机制与垃圾回收机制

    一.内存管理机制 先看一段代码: <?php //内存管理机制 var_dump(memory_get_usage());//获取内存方法,加上true返回实际内存,不加则返回表现内存 $a = "laruence"; var_dump(memory_get_usage()); unset($a); var_dump(memory_get_usage()); //输出(在我的个人电脑上, 可能会因为系统,PHP版本,载入的扩展不同而不同): //int 240552 //int

  • 详解JS内存空间

    概述 变量对象与堆内存 var a = 20; var b = 'abc'; var c = true; var d = { m: 20 } 在很长一段时间里认为内存空间的概念在JS的学习中并不是那么重要.可是后我当我回过头来重新整理JS基础时,发现由于对它们的模糊认知,导致了很多东西我都理解得并不明白.比如最基本的引用数据类型和引用传递到底是怎么回事儿?比如浅复制与深复制有什么不同?还有闭包,原型等等. 因此后来我才渐渐明白,想要对JS的理解更加深刻,就必须对内存空间有一个清晰的认知. 一.栈

随机推荐