Go语言切片详解

1. 切片底层实现
- 1.1 切片简介
- 1.2 切片底层实现
2. 切片的基础操作
3. 多维切片
4. 参考文献

1. 切片底层实现

1.1 切片简介

Go语言中的切片是围绕动态数组的概念构建的，可以按需自动增长和缩小。切片的动态增长是通过内置函数append来实现的，还可以通过对切片再次切片来缩小一个切片的大小。因为切片在内存中是连续的，所以切片还能获得索引、迭代以及垃圾回收优化的好处。

1.2 切片底层实现

切片的底层实现包含3个字段：指向底层数组的指针、切片访问的元素的个数（长度）、切片允许增长到的元素的个数（容量），如下图所示。切片可以理解为对底层数组进行了抽象，并提供了相关的操作方法。

2. 切片的基础操作

2.1 创建和初始化

可以通过make、切片字面量来创建和初始化切片，也可以利用现有数组或切片直接创建切片（Go语言中的引用类型（slice、map、chan）不能使用new进行初始化）。

使用make时，需要传入一个参数指定切片的长度，如果只指定长度，则切片的容量和长度相等。也可以传入两个参数分别指定长度和容量。不允许创建容量小于长度的切片。

// make只传入一个参数指定长度，则容量和长度相等。以下输出："len: 5, cap: 5"
s := make([]int, 5)
fmt.Printf("len: %d, cap: %d\n", len(s), cap(s))

// make 传入长度和容量。以下输出："len: 5, cap: 10"
s := make([]int, 5, 10)
fmt.Printf("len: %d, cap: %d\n", len(s), cap(s))

// 不允许创建容量小于长度的切片。下面语句编译会报错："len larger than cap in make([]int)"
s := make([]int, 10, 5)

通过切片字面量来声明切片。

// 通过字面量声明切片，其长度和容量都为5。以下输出：“len: 5, cap: 5”
s := []int{1, 2, 3, 4, 5}
fmt.Printf("len: %d, cap: %d\n", len(s), cap(s))

// 可以在声明切片时利用索引来给出所需的长度和容量。
// 通过指定索引为99的元素，来创建一个长度和容量为100的切片
s := []int{99: 0}

基于现有数组或切片来创建切片的方法为：s := baseStr[low:high:max]，low指定开始元素下标，high指定结束元素下标，max指定切片能增长到的元素下标。这三个参数都可以省略，low省略默认从下标0开始，high省略默认为最后一个元素下标，max省略默认是底层数组或切片的容量（这里也要注意max不能小于high）。这种方式下，切片的长度和容量的计算方式为：

len = hith - low
cap = max - low

s1 := baseStr[1:3:10]
fmt.Printf("len: %d, cap: %d\n", len(s1), cap(s1)) // len: 2, cap: 9

s2 := baseStr[1:3]
fmt.Printf("len: %d, cap: %d\n", len(s2), cap(s2)) // len: 2, cap: 9

s3 := baseStr[:3]
fmt.Printf("len: %d, cap: %d\n", len(s3), cap(s3)) // len: 3, cap: 10

ss1 := s1[2:5]
ss2 := s1[3:8]
fmt.Printf("len: %d, cap: %d\n", len(ss1), cap(ss1)) // len: 3, cap: 7
fmt.Printf("len: %d, cap: %d\n", len(ss2), cap(ss2)) // len: 5, cap: 6

基于同一个数组或切片创建的不同切片都共享同一个底层数组。如果一个切片修改了该底层数组的共享部分，其他切片和原始数组或切片都能感知到。其底层数据结构如下面两个图所示：
共享同一底层数组：

改变互相感知：

baseSlice := []int{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
s1 := baseSlice[1:5:10]
s2 := baseSlice[2:7]

// 这里 baseSlice、s1、s2 都共享同一个底层数组
/*    s1 起始指针指向 baseSlice 下标为1的元素，可以访问到baseSlice下标为4的元素，
   可以通过append增加容量到baseSlice最后一个元素。
	  s1 起始指针指向 baseSlice 下标为1的元素，可以访问到baseSlice下标为4的元素，
   可以通过append增加容量到baseSlice最后一个元素。
*/

// 下面的例子可以看到，不管修改 baseSlice、s1、s2 中的哪个，这几个切片能访问到的数据都会跟着改变

// 修改 baseSlice 下标为3元素
/*
	baseSlice: [1 2 3 999 5 6 7 8 9 10]
	s1: [2 3 999 5]
	s2: [3 999 5 6 7]
*/
baseSlice[3] = 999
fmt.Printf("baseSlice: %v\n", baseSlice)
fmt.Printf("s1: %v\n", s1)
fmt.Printf("s2: %v\n", s2)

// 修改 s1 下标为1元素
/*
	baseSlice: [1 2 888 999 5 6 7 8 9 10]
	s1: [2 888 999 5]
	s2: [888 999 5 6 7]
*/
s1[1] = 888
fmt.Printf("baseSlice: %v\n", baseSlice)
fmt.Printf("s1: %v\n", s1)
fmt.Printf("s2: %v\n", s2)

// 修改 s2 下标为2元素
/*
	baseSlice: [1 2 888 999 222 6 7 8 9 10]
	s1: [2 888 999 222]
	s2: [888 999 222 6 7]
*/
s2[2] = 222
fmt.Printf("baseSlice: %v\n", baseSlice)
fmt.Printf("s1: %v\n", s1)
fmt.Printf("s2: %v\n", s2)

2.2 nil和空切片

用var s []int声明的切片如果未经初始化，就是nil切片。空切片是用make或字面量创建的切片，s := make([]int, 0)或者s := []int{}。空切片在底层数组包含0个元素，也没有分配任何存储空间。不管是空切片还是nil切片，对其调用函数append、len和cap的效果都是一样的。nil切片和空切片底层结构如下：

2.3 切片增长

切片的增长是通过调用append函数完成的。函数append总是会增加新切片的长度，而容量可能会改变，也可能不会改变，这取决于被操作切片的可用用量（注意：append不会修改传入的切片，而是会返回一个新的切片）。

// 创建一个整型切片
// 其长度和容量都是5个元素
slice := []int{10, 20, 30, 40, 50}

// 创建一个新切片
// 其长度为2 个元素，容量为4个元素
newSlice := slice[1:3]

// 使用原有的容量来分配一个新元素
// 将新元素赋值为 60
newSlice = append(newSlice, 60)

fmt.Printf("slice: %v\n", slice)       // slice: [10 20 30 60 50]
fmt.Printf("newSlice: %v\n", newSlice) // newSlice: [20 30 60]

以上代码运行的底层结构如下图：

因为newSlice在底层数组里还有额外的容量可用，append操作将可用的元素合并到切片的长度，并对其进行赋值。由于和原始的slice共享同一个底层数组，所以slice中索引为3的元素的值也被改动。如果切片的底层数组没有足够的容量可用，append函数会创建一个新的底层数组，将被引用的现有的值复制到新的数组里，再追加新的值。

// 创建一个整型切片
// 其长度和容量都是4个元素
slice := []int{10, 20, 30, 40}

// 向切片追加一个新元素
// 将新元素赋值为50
newSlice := append(slice, 50)

// 改变newSlice中的某个值，发现原始slice的值并没有变化
newSlice[2] = 999

fmt.Printf("slice: %v\n", slice)       // slice: [10 20 30 40]
fmt.Printf("newSlice: %v\n", newSlice) // newSlice: [10 20 999 40 50]

当这个append操作完成后，newSlice拥有一个全新的底层数组，这个数组的容量是原来的两倍。

函数append会智能地处理底层数组的容量增长。在切片的容量小于1000时，总是会成倍的增长容量。一旦元素个数超过1000，容量的增长因子会设为1.25，也就是每次增加25%的容量。

2.4 迭代切片

切片可以用range迭代，但是要注意：如果只用一个值接收range，则得到的只是切片的下标，用两个值接收range，则得到的才是下标和对应的值。

slice := []int{10, 20, 30, 40}

// 如果只用一个值接收range，则得到的只是切片的下标
for i := range slice {
	fmt.Println(i)
}

// 如果用两个值接收range，则得到的是下标和对应的值
for i, v := range slice {
	fmt.Println(i, v)
}

需要强调的是，range创建了每个元素的副本，而不是直接返回对该元素的引用。如果使用该值变量的地址作为指向每个元素的指针，就会造成错误。

slice := []int{10, 20, 30, 40}

/*
	下面的打印输出如下：
	Value: 10, Value-Addr: C00000C168, ElemAddr: C000012560
	Value: 20, Value-Addr: C00000C168, ElemAddr: C000012568
	Value: 30, Value-Addr: C00000C168, ElemAddr: C000012570
	Value: 40, Value-Addr: C00000C168, ElemAddr: C000012578

	Value-Addr 表示的是遍历时用到的变量 v
	ElemAddr 表示的是原来的切片slice里每个元素的地址
	可以看出 range 在遍历时，将slice的每个元素都复制到了同一个变量 v 。
	使用闭包的时候，尤其要注意range的这种特性。
*/
for i, v := range slice {
	fmt.Printf("Value: %d, Value-Addr: %X, ElemAddr: %X\n",
		v, &v, &slice[i])
}

2.5 在函数间传递切片

Go语言中参数的传递都是以值的方式传递的，引用类型也不例外。因为类型本身包装的是一个指针，所以传递引用类型是把指针复制一份，而不会复制其底层数据结构。

3. 多维切片

和多维数组类似。

4. 参考文献

《Go语言实战》
《Go语言学习笔记》

posted @ 2020-05-17 22:25 lvnux 阅读(3608) 评论(0) 收藏举报

刷新页面返回顶部

lvnux