go slice扩容策略

slice扩容代码在go/src/runtime/slice.go中，当前使用的使用的golang源码是GitHub中的master分支代码。时间是2021-10-11。

先抛出一个问题，你觉得应该是打印多少呢？

var b = []int64{1, 1}
b = append(b, 1, 1, 1)
fmt.Println("cap:", cap(b))

入参

slice.go中的growslice函数是扩容相关的代码，其中et可以理解为一个记录切片元数据的结构，在代码中常用et.size来获取切片元素的字节个数，比如一个[]byte类型的切片，它的et.size就是1。

old slice就是还未扩容的切片。cap是期望的切片容量，比如当前切片有3个元素，再往里加入2个元素，期望的容量就是5。

func growslice(et *_type, old slice, cap int) slice {

出参

growslice最终返回了一个新的slice，其中参数p是新申请的数组的指针，新切片的长度和老切片的一样，新切片的容量是变量newcap。

return slice{p, old.len, newcap}

那么从入参出参可以大致推断，扩容就是要获得newcap，根据newcap去决定申请的新数组的大小。那么下面我们关注newcap生成过程。

newcap

newcap的生成有两步：

小于1024变2倍，大于1024变1.25倍。（一个不准确的简述）
借助et进行内存对齐。

第一步

第一步的代码已经被说烂了，不过在我看master分支代码时，开发者进行了小小的修改：

threshold = 256，“门槛“由1024变为256。
newcap += (newcap + 3*threshold) / 4，不再是之前newcap += newcap / 4。

newcap := old.cap
doublecap := newcap + newcap
if cap > doublecap {
    newcap = cap
} else {
    const threshold = 256
    if old.cap < threshold {
        newcap = doublecap
    } else {
        // Check 0 < newcap to detect overflow
        // and prevent an infinite loop.
        for 0 < newcap && newcap < cap {
            // Transition from growing 2x for small slices
            // to growing 1.25x for large slices. This formula
            // gives a smooth-ish transition between the two.
            newcap += (newcap + 3*threshold) / 4
        }
        // Set newcap to the requested cap when
        // the newcap calculation overflowed.
        if newcap <= 0 {
            newcap = cap
        }
    }
}

第一步的逻辑是：

期望的容量如果比现有的二倍还大，那么newcap直接等于期望的容量。
如果期望容量在原容量2倍范围内，且原容量小于256，那么newcap就是原容量2倍。
如果原容量超了256，那么就循环每次增加（1.25x+192）

按第一步的逻辑，上述题目到这，newcap应该是5，因为原有容量2倍等于4，无法满足期望值。

第二步

还没结束，源码中接下来的部分和et有关，这里只留下上述题目会进入的case，其他case可更换切片元素类型自行尝试～

如果题设的类型换为[]byte，那么就走第1个case了。题设是int64，8个字节走第2个case。可以看到最后newcap是通过capmem得到的，capmem经过roundupsize函数得到。该函数意味向上取整的size。

roundupsize(uintptr(newcap) * goarch.PtrSize)可以计算转换为roundupsize(5 * 8)。

switch {
case et.size == 1:
    ...
case et.size == goarch.PtrSize:
    lenmem = uintptr(old.len) * goarch.PtrSize
    newlenmem = uintptr(cap) * goarch.PtrSize
    capmem = roundupsize(uintptr(newcap) * goarch.PtrSize)
    overflow = uintptr(newcap) > maxAlloc/goarch.PtrSize
    newcap = int(capmem / goarch.PtrSize)
case isPowerOfTwo(et.size):
    ...
default:
    ...
}

roundupsize函数返回了数组class_to_size中某个单元的值。再进一步点入数组，会发现该列表：

// class  bytes/obj  bytes/span  objects  tail waste  max waste  min align
//     1          8        8192     1024           0     87.50%          8
//     2         16        8192      512           0     43.75%         16
//     3         24        8192      341           8     29.24%          8
//     4         32        8192      256           0     21.88%         32
//     5         48        8192      170          32     31.52%         16
//     6         64        8192      128           0     23.44%         64
//     7         80        8192      102          32     19.07%         16
//     8         96        8192       85          32     15.95%         32
//     9        112        8192       73          16     13.56%         16
//    10        128        8192       64           0     11.72%        128

roundupsize(40)就是得出应该申请的内存容量，在代码逻辑中，通过class_to_size数组一层层获得结果。为了人为方便查阅，开发者将数组直接以注释方式写出。

我们只需要关注bytes/obj这一列，我们得到的40向上取整只能是48，也就是说通过内存对齐后，新切片要申请48个字节的内存。所以capmem就是48。

对应newcap = int(capmem / goarch.PtrSize)，就是48/8=6，也就是最终newcap=6。

posted @ 2021-11-20 20:37 moon_orange 阅读(485) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

moon orange

无论手里的牌多差，都要把它打好。

go slice扩容策略

入参

出参

newcap

第一步

第二步

公告