详解Go语言中泛型的实现原理与使用

目录
  • 前言
  • 问题
  • 解决方法
  • 类型约束
  • 重获类型安全
  • 泛型使用场景
  • 性能
    • 虚拟方法表
    • 单态化
    • Go 的实现
  • 结论

前言

原文:A gentle introduction to generics in Go byDominik Braun

万俊峰Kevin:我看了觉得文章非常简单易懂,就征求了作者同意,翻译出来给大家分享一下。

本文是对泛型的基本思想及其在 Go 中的实现的一个比较容易理解的介绍,同时也是对围绕泛型的各种性能讨论的简单总结。首先,我们来看看泛型所解决的核心问题。

问题

假设我们想实现一个简单的tree数据结构。每个节点持有一个值。在 Go 1.18 之前,实现这种结构的典型方法如下。

type Node struct {
    value interface{}
}

这在大多数情况下都很好用,但它也有一些缺点。

首先,interface{}可以是任何东西。如果我们想限制value可能持有的类型,例如整数和浮点数,我们只能在运行时检查这个限制。

func (n Node) IsValid() bool {
    switch n.value.(type) {
        case int, float32, float64:
            return true
        default:
            return false
    }
}

这样并不可能在编译时限制类型,像上面这样的类型判断在许多 Go 库中都是很常见的做法。这里有 go-zero 项目中的例子。

第二,对 Node 中的值进行处理是非常繁琐和容易出错的。对值做任何事情都会涉及到某种类型的断言,即使你可以安全地假设值持有一个int值。

number, ok := node.value.(int)
if !ok {
    // ...
}

double := number * 2

这些只是使用interface{}的一些不便之处,它没有提供类型安全,并有可能导致难以恢复的运行时错误。

解决方法

我们不打算接受任意数据类型或具体类型,而是定义一个叫做T的占位符类型作为值的类型。请注意,这段代码还不会通过编译。

type Node[T] struct {
    value T
}

首先需要声明泛型类型T,这是在结构或函数名称后面方括号里面使用的。

T可以是任何类型,只有在实例化一个具有明确类型的Node时,T才会被推导为该类型。

n := Node[int]{
    value: 5,
}

泛型Node被实例化为Node[int](整数节点),所以T是一个int

类型约束

上面的实现里,T的声明缺少一个必要的信息:类型约束。

类型约束用于进一步限制可以作为T的可能类型。Go 本身提供了一些预定义的类型约束,但也可以使用自定义的类型约束。

type Node[T any] struct {
    value T
}

任意类型(any)约束允许T实际上是任何类型。如果节点值需要进行比较,有一个comparable类型约束,满足这个预定义约束的类型可以使用==进行比较。

type Node[T comparable] struct {
    value T
}

任何类型都可以作为一个类型约束。Go 1.18 引入了一种新的interface语法,可以嵌入其他数据类型。

type Numeric interface {
    int | float32 | float64
}

这意味着一个接口不仅可以定义一组方法,还可以定义一组类型。使用Numeric接口作为类型约束,意味着值可以是整数或浮点数。

type Node[T Numeric] struct {
    value T
}

重获类型安全

相对于使用interface{},泛型类型参数的巨大优势在于,T的最终类型在编译时就会被推导出来。为T定义一个类型约束,完全消除了运行时检查。如果用作T的类型不满足类型约束,代码就不会编译通过。

在编写泛型代码时,你可以像已经知道T的最终类型一样写代码。

func (n Node[T]) Value() T {
    return n.value
}

上面的函数返回n.Value,它的类型是T。因此,返回值是T,如果T是一个整数,那么返回类型就已知是int。因此,返回值可以直接作为一个整数使用,不需要任何类型断言。

n := Node[int]{
    value: 5,
}

double := n.Value() * 2

在编译时恢复类型安全使 Go 代码更可靠,更不容易出错。

泛型使用场景

Ian Lance Taylor的 When To Use Generics 中列出了泛型的典型使用场景,归结为三种主要情况:

  • 使用内置的容器类型,如slicesmapschannels
  • 实现通用的数据结构,如linked listtree
  • 编写一个函数,其实现对许多类型来说都是一样的,比如一个排序函数

一般来说,当你不想对你所操作的值的内容做出假设时,可以考虑使用泛型。我们例子中的Node并不太关心它持有的值。

当不同的类型有不同的实现时,泛型就不是一个好的选择。另外,不要把Read(r io.Reader)这样的接口函数签名改为Read[T io.Reader](r T)这样的通用签名。

性能

要了解泛型的性能及其在 Go 中的实现,首先需要了解一般情况下实现泛型的两种最常见方式。

这是对各种性能的深入研究和围绕它们进行的讨论的简要介绍。你大概率不太需要关心 Go 中泛型的性能。

虚拟方法表

在编译器中实现泛型的一种方法是使用Virtual Method Table。泛型函数被修改成只接受指针作为参数的方式。然后,这些值被分配到堆上,这些值的指针被传递给泛型函数。这样做是因为指针看起来总是一样的,不管它指向的是什么类型。

如果这些值是对象,而泛型函数需要调用这些对象的方法,它就不能再这样做了。该函数只有一个指向对象的指针,不知道它们的方法在哪里。因此,它需要一个可以查询方法的内存地址的表格:Virtual Method Table。这种所谓的动态调度已经被 Go 和 Java 等语言中的接口所使用。

Virtual Method Table不仅可以用来实现泛型,还可以用来实现其他类型的多态性。然而,推导这些指针和调用虚拟函数要比直接调用函数慢,而且使用Virtual Method Table会阻止编译器进行优化。

单态化

一个更简单的方法是单态化(Monomorphization),编译器为每个被调用的数据类型生成一个泛型函数的副本。

func max[T Numeric](a, b T) T {
    // ...
}

larger := max(3, 5)

由于上面显示的max函数是用两个整数调用的,编译器在对代码进行单态化时将为int生成一个max的副本。

func maxInt(a, b int) int {
    // ...
}

larger := maxInt(3, 5)

最大的优势是,Monomorphization带来的运行时性能明显好于使用Virtual Method Table。直接方法调用不仅更有效率,而且还能适用整个编译器的优化链。不过,这样做的代价是编译时长,为所有相关类型生成泛型函数的副本是非常耗时的。

Go 的实现

这两种方法中哪一种最适合 Go?快速编译很重要,但运行时性能也很重要。为了满足这些要求,Go 团队决定在实现泛型时混合两种方法。

Go 使用Monomorphization,但试图减少需要生成的函数副本的数量。它不是为每个类型创建一个副本,而是为内存中的每个布局生成一个副本:intfloat64Node和其他所谓的"值类型"在内存中看起来都不一样,因此泛型函数将为所有这些类型复制副本。

与值类型相反,指针和接口在内存中总是有相同的布局。编译器将为指针和接口的调用生成一个泛型函数的副本。就像Virtual Method Table一样,泛型函数接收指针,因此需要一个表来动态地查找方法地址。在 Go 实现中的字典与虚拟方法表的性能特点相同。

结论

这种混合方法的好处是,你在使用值类型的调用中获得了Monomorphization的性能优势,而只在使用指针或接口的调用中付出了Virtual Method Table的成本。

在性能讨论中经常被忽略的是,所有这些好处和成本只涉及到函数的调用。通常情况下,大部分的执行时间是在函数内部使用的。调用方法的性能开销可能不会成为性能瓶颈,即使是这样,也要考虑先优化函数实现,再考虑调用开销。

到此这篇关于详解Go语言中泛型的实现原理与使用的文章就介绍到这了,更多相关Go语言泛型内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 浅谈Go1.18中的泛型编程

    目录 前言 以前的Go泛型 泛型是什么 Go的泛型 泛型函数 泛型类型 类型集合 和接口的差异 总结 前言 经过这几年的千呼万唤,简洁的Go语言终于在1.18版本迎来泛型编程.作为一门已经有了14年历史的强类型语言,很难相信它到现在才开始有一个正式的泛型. 以前的Go泛型 虽然直到1.18版本才加入泛型,但是在2014年便有相关的讨论要在Go中加入泛型设计.但是由于各种原因没有实现.而之后的接口(interface)的提出,让泛型进一步搁置.但是由于接口的缺陷,最终Go团队还是在1.18的版本中

  • Go 泛型和非泛型代码详解

    目录 1. 开启泛型 2.无泛型代码和泛型代码 2.1. AddSlice 2.2. 带方法的约束 StringConstraint 1. 开启泛型 在 Go1.17 版本中,可以通过: export GOFLAGS="-gcflags=-G=3" 或者在编译运行程序时加上: go run -gcflags=-G=3 main.go 2.无泛型代码和泛型代码 2.1. AddSlice 首先看现在没有泛型的代码: package main ​ import ( "fmt&qu

  • Golang 使用接口实现泛型的方法示例

    在C/C++中我们可以使用泛型的方法使代码得以重复使用,最常见例如stl functions:vector<int> vint or vector<float> vfloat等.这篇文章将使用interface{...}接口使Golang实现泛型. interface{...}是实现泛型的基础.如一个数组元素类型是interface{...}的话,那么实现了该接口的实体都可以被放置入数组中.注意其中并不一定必须是空接口(简单类型我们可以通过把他转化为自定义类型后实现接口).为什么i

  • 详解Go语言中泛型的实现原理与使用

    目录 前言 问题 解决方法 类型约束 重获类型安全 泛型使用场景 性能 虚拟方法表 单态化 Go 的实现 结论 前言 原文:A gentle introduction to generics in Go byDominik Braun 万俊峰Kevin:我看了觉得文章非常简单易懂,就征求了作者同意,翻译出来给大家分享一下. 本文是对泛型的基本思想及其在 Go 中的实现的一个比较容易理解的介绍,同时也是对围绕泛型的各种性能讨论的简单总结.首先,我们来看看泛型所解决的核心问题. 问题 假设我们想实现

  • 详解Go语言中关于包导入必学的 8 个知识点

    1. 单行导入与多行导入 在 Go 语言中,一个包可包含多个 .go 文件(这些文件必须得在同一级文件夹中),只要这些 .go 文件的头部都使用 package 关键字声明了同一个包. 导入包主要可分为两种方式: 单行导入 import "fmt" import "sync" 多行导入 import( "fmt" "sync" ) 如你所见,Go 语言中 导入的包,必须得用双引号包含,在这里吐槽一下. 2. 使用别名 在一些场

  • 详解R语言中生存分析模型与时间依赖性ROC曲线可视化

    R语言简介 R是用于统计分析.绘图的语言和操作环境.R是属于GNU系统的一个自由.免费.源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具. 人们通常使用接收者操作特征曲线(ROC)进行二元结果逻辑回归.但是,流行病学研究中感兴趣的结果通常是事件发生时间.使用随时间变化的时间依赖性ROC可以更全面地描述这种情况下的预测模型. 时间依赖性ROC定义 令 Mi为用于死亡率预测的基线(时间0)标量标记. 当随时间推移观察到结果时,其预测性能取决于评估时间 t.直观地说,在零时间测量的标记值应该

  • 详解R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

    在标准线性模型中,我们假设 .当线性假设无法满足时,可以考虑使用其他方法. 多项式回归 扩展可能是假设某些多项式函数, 同样,在标准线性模型方法(使用GLM的条件正态分布)中,参数  可以使用最小二乘法获得,其中  在  . 即使此多项式模型不是真正的多项式模型,也可能仍然是一个很好的近似值 .实际上,根据 Stone-Weierstrass定理,如果  在某个区间上是连续的,则有一个统一的近似值  ,通过多项式函数. 仅作说明,请考虑以下数据集 db = data.frame(x=xr,y=y

  • 详解R语言中的表达式、数学公式、特殊符号

      在R语言的绘图函数中,如果文本参数是合法的R语言表达式,那么这个表达式就被用Tex类似的规则进行文本格式化. y <- function(x) (exp(-(x^2)/2))/sqrt(2*pi) plot(y, -5, 5, main = expression(f(x) == frac(1,sqrt(2*pi))*e^(-frac(x^2,2))), lwd = 3, col = "blue") library(ggplot2) x <- seq(0, 2*pi, b

  • 详解C语言中不同类型的数据转换规则

    不同类型数据间的混合运算与类型转换 1.自动类型转换 在C语言中,自动类型转换遵循以下规则: ①若参与运算量的类型不同,则先转换成同一类型,然后进行运算 ②转换按数据长度增加的方向进行,以保证精度不降低.如int型和long型运算时,先把int量转成long型后再进行运算 a.若两种类型的字节数不同,转换成字节数高的类型 b.若两种类型的字节数相同,且一种有符号,一种无符号,则转换成无符号类型 ③所有的浮点运算都是以双精度进行的,即使是两个float单精度量运算的表达式,也要先转换成double

  • 详解C语言中二分查找的运用技巧

    目录 基础的二分查 查找左侧边界 查找右侧边界 二分查找问题分析 实例1: 爱吃香蕉的珂珂 实例2:运送包裹 前篇文章聊到了二分查找的基础以及细节的处理问题,主要介绍了 查找和目标值相等的元素.查找第一个和目标值相等的元素.查找最后一个和目标值相等的元素 三种情况. 这些情况都适用于有序数组中查找指定元素 这个基本的场景,但实际应用中可能不会这么直接,甚至看了题目之后,都不会想到可以用二分查找算法来解决 . 本文就来分析下二分查找在实际中的应用,通过分析几个应用二分查找的实例,总结下能使用二分查

  • 详解Go语言中的数据类型及类型转换

    目录 1.基本数据类型 2.基础数据类型转换 3.基本数据类型转为字符串 4.strconv的使用 5.字符串转为基础类型 1.基本数据类型 数据类型有很多,先研究一下基础的,例如:布尔型.数字类型.字符串类型. 数字类型有uint8.uint16.uint32.uint64.int8.int16.int32.int64(uint和int区别在于uint为无符号整数,即只支持正数,不支持负数形式) 数字浮点型有fload32.float64.complex64.complex126(后面两个均为

  • 详解Go语言中的作用域和变量隐藏

    目录 前言 包隐藏 全局变量 类型强制 闭包 := 的情况 总结 前言 变量隐藏在 Go 中可能会令人困惑,让我们尝试弄清楚. package main import ( "fmt" "io/ioutil" "log" ) func main() { f, err := ioutil.TempFile("", "") if err != nil { log.Fatal(err) } defer f.Clos

  • 详解Go语言中配置文件使用与日志配置

    目录 项目结构调整 配置文件使用 日志配置 小结 接着上一篇的文章构建的项目:Go语学习笔记 - 环境安装.接口测试 只是简单的把GET和POST接口的使用测试了一下. 我还是想按照正常的项目结构调整一下,这篇笔记主要是三个部分:调整项目目录结构.增加配置文件使用.增加日志配置,很常规而且也是每个项目都需要用到的. 项目地址:github地址 项目结构调整 说先对项目目录结构调整一下,按照我自己的开发习惯,增加了几个目录. 项目结构如下图: 解释一下目录结构 app/constants:主要放置

随机推荐