一、引入

随着Go 对泛型的支持,在提升了 Go 语言表达力的同时,也带来了不小的复杂性。也就是说,使用了泛型语法编写的代码在可读性、可理解性以及可维护性方面,相比于非泛型代码都有一定程度的下降。Go 当初没有及时引入泛型的一个原因就是泛型与 Go 语言“简单”的设计哲学有悖,现在加入了泛型,Go 核心团队以及 Go 社区却又开始担心“泛型被滥用”。

二、何时适合使用泛型?

Go 泛型语法体现在类型参数上,所以说,类型参数适合的场景就是适合应用泛型编程的时机。我们先来看看类型参数适合的第一种场景。

场景一:编写通用数据结构时

在 Go 尚不支持泛型的时候,如果要实现一个通用的数据结构,比如一个先入后出的 stack 数据结构,我们通常有两个方案。

第一种方案是为每种要使用的元素类型单独实现一套栈结构。如果我们要在栈里管理 int 型数据,我们就实现一个 IntStack;如果要管理 string 类型数据,我们就再实现一个 StringStack……总之,我们需要根据可能使用到的元素类型实现出多种专用的栈结构。

这种方案的优点是便于编译器的静态类型检查,保证类型安全,且运行性能很好,因为 Go 编译器可以对代码做出很好的优化。不过这种方案的缺点也很明显,那就是会有大量的重复代码。

第二种方案是使用 interface{} 实现通用数据结构。

在泛型之前,Go 语言中唯一具有“通用”语义的语法就是 interface{} 了。无论 Go 标准库还是第三方实现的通用数据结构都是基于 interface{} 实现的,比如下面标准库中 ring 包中 Ring 结构就是使用 interface{} 作为元素类型的:

// $GOROOT/src/container/ring/ring.go
type Ring struct {
next, prev *Ring
Value interface{}
}

使用 interface{} 固然可以实现通用数据结构,但 interface{} 接口类型的固有特性也决定了这个方案也自带以下“先天不足”:

  • Go 编译器无法在编译阶段对进入数据结构中的元素的类型进行静态类型检查;
  • 要想得到元素的真实类型,不可避免要进行类型断言或 type switch 操作;
  • 不同类型数据赋值给 interface{} 或从 interface{} 还原时执行的装箱和拆箱操作带来的额外开销。

我们可以看到,以上两个方案都有各自的不足,那么有比较理想的方案么?

有的,那就是使用 Go 泛型。其实不止 Go 语言,其他支持泛型的主流编程语言的通用数据结构实现也都使用了泛型。下面是用 Go 泛型实现一个 stack 数据结构的示例代码:

// stack.go
package stack type Stack[T any] []T func (s *Stack[T]) Top() (t T) {
l := len(*s)
if l == 0 {
return t
}
return (*s)[l-1]
} func (s *Stack[T]) Push(v T) {
(*s) = append((*s), v)
} func (s *Stack[T]) Len() int {
return len(*s)
} func (s *Stack[T]) Pop() (T, bool) {
var zero T
if len(*s) < 1 {
return zero, false
} // Get the last element from the stack.
result := (*s)[len(*s)-1] // Remove the last element from the stack.
*s = (*s)[:len(*s)-1] return result, true
}

泛型版实现基本消除了前面两种方案的不足,如果非要说和 IntStackStringStack 等的差异,那可能就是在执行性能上要差一些了。

$go test -bench .
goos: darwin
goarch: amd64
pkg: stack
BenchmarkStack-8 72775926 19.53 ns/op 40 B/op 0 allocs/op
BenchmarkIntStack-8 100000000 10.43 ns/op 45 B/op 0 allocs/op
PASS

当然,泛型版本性能略差与泛型的实现原理有关。

场景二:函数操作的是 Go 原生的容器类型时

如果函数具有切片、map 或 channel 这些 Go 内置容器类型的参数,并且函数代码未对容器中的元素类型做任何特定假设,那我们使用类型参数可能很有帮助。

我们来看个例子:

// max_generics.go
type ordered interface {
~int | ~int8 | ~int16 | ~int32 | ~int64 |
~uint | ~uint8 | ~uint16 | ~uint32 | ~uint64 | ~uintptr |
~float32 | ~float64 |
~string
} func maxGenerics[T ordered](sl []T) T {
if len(sl) == 0 {
panic("slice is empty")
} max := sl[0]
for _, v := range sl[1:] {
if v > max {
max = v
}
}
return max
}

我们看到,类型参数使得此类容器算法与容器内元素类型彻底解耦。在没有泛型语法之前,实现这样的函数通常需要使用反射。不过使用反射,会让代码可读性大幅下降,编译器也无法做静态类型检查,并且运行时开销也大得很。

场景三:不同类型实现一些方法的逻辑相同时

在 Go 编码过程中,我们经常会遇到这样一种情况,某个函数接受一个自定义接口类型作为参数,就像下面的 doSomething 函数以及其参数类型 MyInterface 接口。

type MyInterface interface {
M1()
M2()
M3()
} func doSomething(i MyInterface) {
}

只有实现了 MyInterface 中全部三个方法的类型,才被允许作为实参传递给 doSomething 函数。当这些类型实现 M1M2M3 的逻辑看起来都相同时,我们就可以使用类型参数来帮助实现 M1~M3 这些方法了,下面就是通过类型参数实现这些方法的通用逻辑代码(实际逻辑做了省略处理):

// common_method.go

type commonMethod[T any] struct{}

func (commonMethod[T]) M1() {}
func (commonMethod[T]) M2() {}
func (commonMethod[T]) M3() {} func main() {
var intThings commonMethod[int]
var stringThings commonMethod[string]
doSomething(intThings)
doSomething(stringThings)
}

我们看到,使用不同类型,比如 intstring 等作为 commonMethod 的类型实参就可以得到相应实现了 M1~M3 的类型的变量,比如 intThingsstringThings,这些变量可以直接作为实参传递给 doSomething 函数。

当然我们也可以再封装一个泛型函数来简化上述调用:

func doSomethingCM[T any]() {
doSomething(commonMethod[T]{})
} func main() {
doSomethingCM[int]()
doSomethingCM[string]()
}

这里的 doSomethingCM 泛型函数将 commonMethod 泛型类型实例化与调用 doSomething 函数的过程封装到一起,使得 commonMethod 泛型类型的使用进一步简化了。

其实,Go 标准库的 sort.Sort 就是这样的情况,其参数类型为 sort.Interface,而 sort.Interface 接口中定义了三个方法:

// $GOROOT/src/sort/sort.go
func Sort(data Interface) type Interface interface {
Len() int
Less(i, j int) bool
Swap(i, j int)
}

所有实现 sort.Interface 类型接口的类型,在实现 LenLessSwap 这三个通用方法的逻辑看起来都相同,比如 sort.go 中提供的 StringSliceIntSlice 两种类型的三个方法的实现如下:

type StringSlice []string

func (x StringSlice) Len() int           { return len(x) }
func (x StringSlice) Less(i, j int) bool { return x[i] < x[j] }
func (x StringSlice) Swap(i, j int) { x[i], x[j] = x[j], x[i] } type IntSlice []int func (x IntSlice) Len() int { return len(x) }
func (x IntSlice) Less(i, j int) bool { return x[i] < x[j] }
func (x IntSlice) Swap(i, j int) { x[i], x[j] = x[j], x[i] }

不过要注意:如果多个类型实现上述方法的逻辑并不相同,那么我们就不应该使用类型参数。

最后,如果非要总结为一条,那就是:如果你发现自己多次编写完全相同的代码,其中副本之间的唯一区别是代码使用不同的类型,那么可考虑使用类型参数了。

假使你目前遇到的场景适合使用泛型,你可能依然会犹豫要不要使用泛型,因为你还不清楚泛型对代码执行性能的影响。特别是在一些性能敏感的系统中,这一点尤为重要。那么如何知道泛型对执行性能的影响呢?这就要从 Go 泛型实现原理说起了。

三、Go 泛型实现原理

Go 核心团队对泛型实现的探索开始得很早,在 2009 年 12 月,Go 团队技术领导者 Russ Cox 就在其博客站点上发表一篇名为“泛型窘境”的文章。在这篇文章中,Russ Cox 提出了 Go 面对泛型可遵循的三个路径以及每个路径的不足,也就是三个 "slow"(拖慢)。

  • C 语言路径:不实现泛型,不会引入复杂性,但这会“拖慢程序员”,因为可能需要程序员花费精力做很多重复实现;
  • C++ 语言路径:就像 C++ 的泛型实现方案那样,通过增加编译器负担为每个类型实参生成一份单独的泛型函数的实现,这种方案产生了大量的代码,其中大部分是多余的,有时候还需要一个好的链接器来消除重复的拷贝,显然这个实现路径会“拖慢编译器”;
  • Java 路径:就像 Java 的泛型实现方案那样,通过隐式的装箱和拆箱操作消除类型差异,虽然节省了空间,但代码执行效率低,即“拖慢执行性能”。

如今 Go 加入了泛型,显然 C 语言的“拖慢程序员”这个路径被否决了,那么在剩下两个路径中,Go 选择了哪条呢?下面我们就来真正看一下 Go 泛型的实现方案。

Go 核心团队在评估 Go 泛型实现方案时是非常谨慎的,负责泛型实现设计的 Keith Randall 博士一口气提交了三个实现方案,供大家讨论和选择:

  1. Stenciling 方案
  2. Dictionaries 方案
  3. GC Shape Stenciling 方案

为了更好地理解泛型实现原理,接下来我们逐一对上述方案做个简单介绍。首先看一下 Stenciling 方案。

Stenciling 方案

Stenciling 方案也称为模板方案(如上图), 它也是 C++、Rust 等语言使用的实现方案。其主要思路就是在编译阶段,根据泛型函数调用时类型实参或约束中的类型元素,为每个实参类型或类型元素中的类型生成一份单独实现。这么说还是很抽象,下图很形象地说明了这一过程:

我们看到,Go 编译器为每个调用生成一个单独的函数副本(图中函数名称并非真实的,仅为便于说明而做的命名),相同类型实参的函数只生成一次,或通过链接器消除不同包的相同函数实现。

图示的这一过程在其他编程语言中也被称为“单态化(monomorphization)”。单态是相对于泛型函数的参数化多态(parametric polymorphism)而言的。

Randall 博士也提到了这种方案的不足,那就是拖慢编译器。泛型函数需要针对不同类型进行单独编译并生成一份独立的代码。如果类型非常多,那么编译出来的最终文件可能会非常大。同时由于 CPU 缓存无法命中、指令分支预测等问题,可能导致生成的代码运行效率不高。

当然,对于性能不高这个说辞,我个人持保留态度,因为模板方案在其他编程语言中基本上是没有额外的运行时开销的,并且是应该是对编译器优化友好的。很多面向系统编程的语言都选择该方案,比如 C++、D 语言、Rust 等。

Dictionaries 方案

Dictionaries 方案与 Stenciling 方案的实现思路正相反,它不会为每个类型实参单独创建一套代码,反之它仅会有一套函数逻辑,但这个函数会多出一个参数 dict,这个参数会作为该函数的第一个参数,这和 Go 方法的 receiver 参数在方法调用时自动作为第一个参数有些类似。这个 dict 参数中保存泛型函数调用时的类型实参的类型相关信息。下面是 Dictionaries 方案的示意图:

包含类型信息的字典是 Go 编译器在编译期间生成的,并且被保存在 ELF 的只读数据区段(.data)中,传给函数的 dict 参数中包含了到特定字典的指针。从方案描述来看,每个 dict 中的类型信息还是十分复杂的,不过我们了解这些就够了,对 dict 的结构就不展开说明了。

这种方案也有自身的问题,比如字典递归的问题,如果调用某个泛型函数的类型实参有很多,那么 dict 信息也会过多等等。更重要的是它对性能可能有比较大的影响,比如通过 dict 的指针的间接类型信息和方法的访问导致运行时开销较大;再比如,如果泛型函数调用时的类型实参是 int,那么如果使用 Stenciling 方案,我们可以通过寄存器复制即可实现 x=y 的操作,但在 Dictionaries 方案中,必须通过 memmove 了。

Go 最终采用的方案:GC Shape Stenciling 方案

GC Shape Stenciling 方案顾名思义,它基于 Stenciling 方案,但又没有为所有类型实参生成单独的函数代码,而是以一个类型的 GC Shape 为单元进行函数代码生成。一个类型的 GC Shape 是指该类型在 Go 内存分配器 / 垃圾收集器中的表示,这个表示由类型的大小、所需的对齐方式以及类型中包含指针的部分所决定。

这样一来势必就有 GC Shape 相同的类型共享一个实例化后的函数代码,那么泛型调用时又是如何区分这些类型的呢?

答案就是字典。该方案同样在每个实例化后的函数代码中自动增加了一个 dict 参数,用于区别 GC Shape 相同的不同类型。可见,GC Shape Stenciling 方案本质上是 Stenciling 方案和 Dictionaries 方案的混合版,它也是 Go 1.18 泛型最终采用的实现方案,为此 Go 团队还给出一个更细化、更接近于实现的 GC Shape Stenciling 实现方案

下面是 GC Shape Stenciling 方案的示意图:

那么如今的 Go 版本究竟会为哪些类型实例化出一份独立的函数代码呢?我们通过下面示例来看一下:

// gcshape.go
func f[T any](t T) T {
var zero T
return zero
} type MyInt int func main() {
f[int](5)
f[MyInt](15)
f[int64](6)
f[uint64](7)
f[int32](8)
f[rune](18)
f[uint32](9)
f[float64](3.14)
f[string]("golang") var a int = 5
f[*int](&a)
var b int32 = 15
f[*int32](&b)
var c float64 = 8.88
f[*float64](&c)
var s string = "hello"
f[*string](&s)
}

在这个示例中,我们声明了一个简单的泛型函数 f,然后分别用不同的 Go 原生类型、自定义类型以及指针类型作为类型实参对 f 进行调用。我们通过工具为上述 goshape.go 生成的汇编代码如下:

从上图我们看到,Go 编译器为每个底层类型相同的类型生成一份函数代码,像 MyIntintruneint32;对于所有指针类型,像上面的 *float64*int*int32,仅生成一份名为 main.f[go.shape.*uint8_0] 的函数代码。

这与新版 GC Shape 方案中的描述是一致的:“我们目前正在以一种相当精细的方式实现 GC Shapes。当且仅当两个具体类型具有相同的底层类型或者它们都是指针类型时,它们才会在同一个 GC Shape 分组中”。

四、泛型对执行效率的影响

通过上面对 Go 泛型实现原理的了解,我们看到目前的 Go 泛型实现选择了一条折中的路线:既没有选择纯 Stenciling 方案,避免了对 Go 编译性能带来较大影响,也没有选择像 Java 那样泛型那样的纯装箱和拆箱方案,给运行时带去较大开销。

GC Shape + Dictionaries 的混合方案也确实会给泛型在运行时的执行效率带去影响。我们来看一个简单的实例:

// benchmark_simple/add.go
type plusable interface {
~int | ~string
} func add[T plusable](a, b T) T {
return a + b
} func addInt(a, b int) int {
return a + b
}
func addString(a, b string) string {
return a + b
}

这个示例用于对比泛型函数实例化后的函数代码(如 add[int])的性能与单态下的函数(如 addInt)性能。下面是 benchmark 代码:

// benchmark_simple/add_test.go
func BenchmarkAddInt(b *testing.B) {
b.ReportAllocs()
var m, n int = 5, 6
for i := 0; i < b.N; i++ {
addInt(m, n)
}
}
func BenchmarkAddIntGeneric(b *testing.B) {
b.ReportAllocs()
var m, n int = 5, 6
for i := 0; i < b.N; i++ {
add(m, n)
}
}

运行这个 benchmark

 $go test -bench .
goos: darwin
goarch: amd64
pkg: demo
BenchmarkAddInt-8 1000000000 0.2692 ns/op 0 B/op 0 allocs/op
BenchmarkAddIntGeneric-8 1000000000 1.074 ns/op 0 B/op 0 allocs/op
PASS
ok demo 1.491s

我们看到,与单态化的 addInt 相比,泛型函数 add 实例化后的 add[int] 的执行性能还是下降了很多。这个问题在Go 官方 issue中也有 Gopher 提出。

Go 1.20 版本中,由于将使用 Unified IR(中间代码表示)替换现有的 IR 表示,Go 泛型函数的执行性能将得到进一步优化。上述的 benchmark 中两个函数的执行性能将不分伯仲,Go 1.19 中也可使用 GOEXPERIMENT=unified 来开启 Unified IR 试验性功能。

我们在 Unified IR 开启的情况下再跑一次上面的 benchmark:

$GOEXPERIMENT=unified go test -bench .
goos: darwin
goarch: amd64
pkg: demo
BenchmarkAddInt-8 1000000000 0.2713 ns/op 0 B/op 0 allocs/op
BenchmarkAddIntGeneric-8 1000000000 0.2723 ns/op 0 B/op 0 allocs/op

这次的对比结果就非常理想了!

综上,在一些性能敏感的系统中,还是要慎用尚未得到足够性能优化的泛型;而在性能不那么敏感的情况下,在符合前面泛型使用时机的时候,我们还是可以大胆使用泛型语法的。

五、小结

首先我们探讨了有关 Go 泛型的一个重要问题:何时使用泛型。泛型语法的加入不可避免地提升了 Go 语法的复杂性。为了防止 Gopher 滥用泛型,我们给出了几个 Go 泛型最适合应用的场景,包括编写通用数据结构、编写操作 Go 原生容器类型时以及不同类型实现一些方法的逻辑看起来相同时。除此之外的其他场景下,如果你要使用泛型,请务必慎重并深思熟虑。

Go 泛型的编译性能和执行性能也是影响我们是否应用泛型的重要因素。Go 核心团队在 Go 泛型实现方案的选择上也是煞费苦心,最终选择了 GC Shape Stenciling 的混合方案。目前这个方案很大程度上避免了对 Go 编译性能的影响,但对 Go 泛型代码的执行效率依然存在不小的影响。相信经过几个版本的打磨和优化后,Go 泛型的执行性能会有提升,甚至能接近于非泛型的单态版。

这里我还要提一下,Go 泛型的实现方案也可能在未来版本中发生变化。从目前看,本文中的内容仅针对 Go 1.18Go 1.19GC Shape Stenciling 方案适用。

Go 泛型之明确使用时机与泛型实现原理的更多相关文章

  1. Java泛型解析(03):虚拟机运行泛型代码

    Java泛型解析(03):虚拟机运行泛型代码      Java虚拟机是不存在泛型类型对象的,全部的对象都属于普通类,甚至在泛型实现的早起版本号中,可以将使用泛型的程序编译为在1.0虚拟机上可以执行的 ...

  2. java 泛型详解(普通泛型、 通配符、 泛型接口,泛型数组,泛型方法,泛型嵌套)

    JDK1.5 令我们期待很久,可是当他发布的时候却更换版本号为5.0.这说明Java已经有大幅度的变化.本文将讲解JDK5.0支持的新功能-----Java的泛型.  1.Java泛型  其实Java ...

  3. 从fastjson多层泛型嵌套解析,看jdk泛型推断

    给你一组json数据结构,你把它解析出来到项目中,你会怎么做? // data1 sample { "code" : "1", "msg" ...

  4. 泛型深入--java泛型的继承和实现、泛型擦除

    泛型实现类: package generic; /** * 泛型父类:子类为“富二代”:子类的泛型要比父类多 * 1,保留父类的泛型-->子类为泛型类 * 2,不保留父类泛型-->子类按需 ...

  5. C#中DataTable与泛型集合互转(支持泛型集合中对象包含枚举)

    最近在做WCF,因为是内部接口,很多地方直接用的弱类型返回(DataSet),这其实是一种非常不好的方式,最近将项目做了修改,将所有接口返回值都修改成强类型,这样可以减少很多与客户端开发人员的沟通,结 ...

  6. 阶段1 语言基础+高级_1-3-Java语言高级_04-集合_02 泛型_5_定义和使用含有泛型的接口

    定义泛型接口 Scanner的接口 接口的实现类.实现这个接口,规定数据类型为String类型 ArrayList是List接口的实现类 再看下List接口的源码 泛型实现类也定义为泛型 重写泛型的方 ...

  7. java 泛型实例详解(普通泛型、 通配符、 泛型接口)

    java 泛型详解(普通泛型. 通配符. 泛型接口) 2013-02-04 19:49:49| 分类: JAVA | 标签:java |举报|字号 订阅 下载LOFTER客户端 JDK1.5 令我们期 ...

  8. Java中泛型的详细解析,深入分析泛型的使用方式

    泛型的基本概念 泛型: 参数化类型 参数: 定义方法时有形参 调用方法时传递实参 参数化类型: 将类型由原来的具体的类型参数化,类似方法中的变量参数 类型定义成参数形式, 可以称为类型形参 在使用或者 ...

  9. 编写高质量代码改善C#程序的157个建议[优先考虑泛型、避免在泛型中声明静态成员、为泛型参数设定约束]

    前言 泛型并不是C#语言一开始就带有的特性,而是在FCL2.0之后实现的新功能.基于泛型,我们得以将类型参数化,以便更大范围地进行代码复用.同时,它减少了泛型类及泛型方法中的转型,确保了类型安全.委托 ...

  10. JAVA泛型-自动包装机制不能应用于泛型数据的测试

    <thinging in java>中指出自动包装机制不能应用于泛型数据,自己写的测试代码如下: package com.xt.thinks15_11_1; import java.uti ...

随机推荐

  1. Kubernetes(K8S) Node NotReady 节点资源不足 Pod无法运行

    k8s 线上集群中 Node 节点状态变成 NotReady 状态,导致整个 Node 节点中容器停止服务. 一个 Node 节点中是可以运行多个 Pod 容器,每个 Pod 容器可以运行多个实例 A ...

  2. 使用 Kubeadm 部署 Kubernetes(K8S) 安装 -- 持久化存储(NFS网络存储)

    使用 Kubeadm 部署 Kubernetes(K8S) 安装 使用 Kubeadm 部署 Kubernetes(K8S) 安装 -- Ingress-Ngnix Volume 是 Pod 中能够被 ...

  3. 【已解决】无法打开.xlsx文件,xlrd.biffh.XLRDError: Excel xlsx file; not supported

    原因是最近xlrd更新到了2.0.1版本,只支持.xls文件.所以x1 = xlrd.open_workbook("data.xlsx")会报错. 可以安装旧版xlrd,在cmd中 ...

  4. CodeFormer一款既能人脸修复、还能视频去码的AI软件,附下载使用教程

    CodeFormer是一款强大的人工智能工具,主要用于图像和视频的修复和增强.它基于深度学习技术,特别是人脸复原模型,可以轻松修复和增强面部图像,提升照片和视频的质量和视觉效果 工作原理 1.通过自动 ...

  5. Java 使用 slf4j + log4j 写日志

    没有SpringBoot等框架的情况下 pom.xml: <properties> <slf4j.version>1.7.26</slf4j.version> &l ...

  6. java读取解析endnote文件

    有些项目中会要求代码解析endnote文献资料获取一些标准的信息,例如XX在某著名期刊上发表了某篇文章,关于发表文章的这个事情的描述就会给坐着一个endnote文件来记录文章名称.作者.期刊名称.出版 ...

  7. <vue 路由 6、动态路由-方法传递参数>

    一.query效果 点击query按钮 二.param效果 点击param按钮 注意点 1:重新刷新浏览器后,参数都不在了. 2:url中能看不到传递的参数 3.分别用{{$route. params ...

  8. freeswitch的gateway实现出中继的主备方案

    概述 freeswitch是一款简单好用的VOIP开源软交换平台. 某些呼叫场景中,我们有2条出中继线路可选,2条出中继需要按照主备模式来配置,优先使用主中继呼叫,当主中继出现问题时,呼叫自动转移到备 ...

  9. 二分图的匹配 hdu 1083

    ***题意:n个学生,p门课,求最大匹配,即p门课是否都有人上*** 匈牙利算法 #include<iostream> #include<cstdio> #include< ...

  10. Vue第三篇 Vue组件

    01-组件的全局注册 <!DOCTYPE html> <html lang="en"> <head> <meta charset=&quo ...