Go语言中slice作为参数传递时遇到的一些“坑”

前言

相信看到这个题目,可能大家都觉得是一个老生常谈的月经topic了。一直以来其实把握一个“值传递”基本上就能理解各种情况了,不过最近遇到了更深一点的“小坑”,与大家分享一下。

首先还是从最简单的说起,看下面代码:

1
2
3
4
5
6
7
8
9
10
func main() {
 a := []int{7,8,9}
 fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
 ap(a)
 fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
}
 
func ap(a []int) {
 a = append(a, 10)
}

以上代码的输出是什么呢?

我这里不卖关子了直接说,再调用ap函数进行append操作后,a依然是[]int{7,8,9}。原因很简单,Go中没有引用传递全是值传递,值传递意味着传递的是数据的拷贝。这句话新手可能稍微有点云里雾里,而实际情况又比较诡异,比如说下面代码:

1
2
3
4
5
6
7
8
9
10
11
func main() {
  a := []int{7,8,9}
  fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
  ap(a)
  fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
}
 
func ap(a []int) {
  a[0] = 1
  a = append(a, 10)
}

这时ap后再输出a,会看到a[0]变成了1,但a的cap依然是3,看起来10并没有被append进去?

这看起来就比较匪夷所思了,不是说值传递吗,为什么还是影响外部变量的值了呢?按理说要么都变要么都不变才说得过去啊。

这实际上并不是匪夷所思,因为Go和C不一样,slice看起来像数组,实际上是一个结构体,在源码中的数据结构是:

1
2
3
4
5
type slice struct {
 array unsafe.Pointer
 len int
 cap int
}

这个结构体其实也很好理解,array是一个真正的数组指针,指向一段连续内存空间的头部,len和cap代表长度和容量。
换句话说,你看起来在代码里传参时写的是ap(a []int),实际上在代码编译期,这段代码变成了ap(a runtime.slice)
你可以尝试这么理解,把ap(a)替换成ap(array: 0x123, len: 3, cap: 3) 。可以很明显的看到,传递到ap函数的三个参数,仅仅是3个数值,并没有和外部变量a建立任何引用关系。这便是值传递。

但是,你可能会疑惑,为什么我改了a[0]的值,也会在外面体现呢?其实看到这里你应该已经可以自己想明白了,因为array是一个地址值(比如0x123),这个地址传入了ap函数,但是它代表的地址0x123和外部a的0x123是一个内存地址,这时候你修改a[0],实际上是修改0x123地址中存放的值,所以外部当然会受影响了。

举个形象点的例子,假设你是火车站货物管理员,你管理的是第1到第3节车厢(车厢是互通的)的装卸货货。有一天你生病了,找个人(叫A)临时来接手一下。但是火车的货不是谁想碰就碰的,你得有证明才行。于是你把你手上的证明原件复印了一份给A,同时把第一节车厢的钥匙给A。由于刚好那几天比较忙,站长又让A也负责第四节车厢,于是A也得到了车厢4的证明原件。一段时间后,你生病回来,你依然只有1到3节车厢的证件,你可以看到最近A在1到3车厢搞的事情,但是你没有资格去4车厢。

以上例子应该可以很好的说明slice传参的场景,记住,Go中只有值传递。

是不是就完事儿了呢?然而事情并没有这么简单。最近我工作时就遇到这个问题了。按照上面的举例,虽然你没有资格去查看4车厢,但是如果你好奇,你可以偷看啊,因为它们是连续的互通的,正如数组也是一段连续的内存,于是就有这样的代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
func main() {
  a := []int{}
  a = append(a, 7,8,9)
  fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
  ap(a)
  fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
  p := unsafe.Pointer(&a[2])
  q := uintptr(p)+8
  t := (*int)(unsafe.Pointer(q))
  fmt.Println(*t)
}
 
func ap(a []int) {
  a = append(a, 10)
}

虽然外部的cap和len并没有改变,但是ap函数往同一段内存地址append了一个10,那我是不是可以用比较trick的方法去偷看呢?比如找到a[2]的地址,往后挪一个int的长度,就应该是ap函数新增的10了吧?这里需要注意,Go官网的server是32位的,所以在go playground执行这段代码时,int是4字节。

执行结果和我预想的一样!

但是问题接踵而至

1
2
3
4
5
6
7
8
9
10
11
12
13
14
func main() {
  a := []int{7,8,9}
  fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
  ap(a)
  fmt.Printf("len: %d cap:%d data:%+v\n", len(a), cap(a), a)
  p := unsafe.Pointer(&a[2])
  q := uintptr(p)+8
  t := (*int)(unsafe.Pointer(q))
  fmt.Println(*t)
}
 
func ap(a []int) {
  a = append(a, 10)
}

这和上面一个例子唯一的区别就是slice一开始是用[]int{7,8,9}这种方式初始化。执行结果*t是3而不是10,这就比较困惑了。为啥?不是一段连续的内存空间吗?

这里其实涉及到的问题是slice的growth问题,当append时发现cap不够了,会重新分配空间,具体源码参见 runtime/slice.go中的growslice函数。我这里就不讲太多细节,只讲结果。当发生growslice时,会给slice重新分配一段更大的内存,然后把原来的数据copy过去,把slice的array指针指向新内存。也就是说,假如之前的数据是存放到内存地址 0x0 0x8 0x10,当不发生growslice,新append的数值会存到0x18,然而当发生growslice,以前的所有数据被copy到新的地址0x1000 0x1008 0x1010,新append的值放到0x1018了。

这时候你就可以理解为什么有时候用unsafe能拿到数据,有时候拿不到了。或许你可以理解为什么这个包叫做unsafe了。不过unsafe不是真的unsafe,是说如果你使用的姿势不对就非常容易unsafe。但是如果姿势优雅,其实很safe。对于slice操作,如果要使用unsafe,千万记得关注cap是否发送变化,它意味着内存的迁移

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

posted on 2021-03-31 23:39  ExplorerMan  阅读(526)  评论(0编辑  收藏  举报

导航