一起学RISC-V汇编第9讲之RISC-V ABI之寄存器使用约定

1 RISC-V 寄存器使用约定
2 Caller-saved 与 Callee-saved

寄存器使用约定告诉我们函数调用时通过哪些寄存器传递参数、通过哪些寄存器保存返回值、哪些寄存器可以任意使用而不用保存旧值等。

1 RISC-V 寄存器使用约定

第2讲寄存器这一章，列出了32个通用寄存器以及32个浮点寄存器：

整理如下：

Preserved（callee-saved）	NonPreserved（caller-saved）
Saved registers：`s0-s11`	Return address: `ra`
Stack pointer:`sp`	Argument registers:`a0-a7`
	Return values: `a0-a1`
	Temporary registers:`t0-t6`

2 Caller-saved 与 Callee-saved

由RISC-V寄存器的个数是有限的，而函数是非常多的，调用路径可能非常长，这么多函数共用有限的寄存器，怎么样才能安全的访问寄存器呢？最安全的做法是，每次调用其它的函数前把寄存器值保存到栈中，等从子函数返回后，再将寄存器的值出栈，恢复函数调用前的状态，通过这个办法，各个函数就都可以随意使用所有寄存器了。

我们将调用函数称为caller，被调用函数称为callee。

2.1 对比几种不同的寄存器保存方式

对比如下几种方式：

方式1：寄存器全部由caller 保存
方式2：寄存器全部由callee保存
方式3：按照程序调用约定，一部分寄存器由调用者保存（caller-saved），一部分由被调用者保存（callee-saved）

方式1 寄存器全部由caller保存-可行但效率很低

这种做法是最安全的，但效率非常低，访问栈相当于访问内存，比直接访问寄存器速度明显下降，所以有必要想办法减少栈的使用。

方式2 寄存器全部由callee保存-不可行

寄存器全部由callee保存行吗？答案是不可行，有些寄存器我们必须在改变之前保存（即caller中保存）。

参数寄存器（a0-a7）只能是 caller-saved 。为了传递参数，caller 必须将参数寄存器中原本的值覆盖成传给 callee 的参数，如果参数寄存器内之前有值，那么就需要 caller 进行保存。这个工作没法由 callee 进行，因为提交给 callee 的参数寄存器已经被污染（改变）了。

返回值寄存器(a0-a1)只能是 caller-saved 。如果让 callee 保存 caller 的返回值，那么 callee 的自己的返回值该怎么传递给 caller 呢？

返回地址寄存器(ra）只能是 caller-saved，如果 callee 在进入函数时保存了 caller 的 ra ，而退出函数前恢复了 caller 的 ra ,那么返回到一个错误的地方，应该保存自己的ra，而非caller的ra

方式3 一部分寄存器由调用者保存（caller-saved），一部分由被调用者保存（callee-saved）

我们将寄存器分为两组：

caller-saved （调用者保存），这是说调用者可以按照自己的需要来保存这些寄存器，如果自己使用了，那么就保存，如果没有使用，就不需要保存。
callee-saved （被调用者保存），被调用者在执行正式的功能前前需要将这些寄存器压栈，在返回前需要将这些寄存器弹栈恢复，从caller的视角看，这些寄存器在调用前后值肯定是一样的。从而叫做保存寄存器。

下面一段话引用自计算机组成-寄存器保存

不过这种标准的定义其实并不容易让人理解其中的原因。我们可以换一个角度去看这件事。

callee-saved 寄存器都会本着“谁污染，谁治理”的策略被保护起来，所以callee-saved register是 safe 的，也就是在 call后寄存器的值不会改变。。

而 caller-saved 的寄存器有可能被污染（在 caller 并不保存的情况下），其实核心特性是 unsafe ，也就是“调用前后并能保证寄存器中的值不发生变化”，所以这种寄存器也被称为临时寄存器，如果有需求才会由caller保存。

2.2 为什么要分caller-saved与callee-saved？

原因归根到底是因为编译器缺少全局优化的能力。

如果在全局视角下分析，在调用过程中，我们真正需要保存的寄存器，具有两个特性：

被 caller 使用且生命周期必须跨越调用过程。

被 callee 使用。

那无论是 callee 还是 caller 都没有办法很好达到这个理想状态，因为作为 caller 虽然可以正确的分析出具有第 1 点特性的寄存器，但是对于第 2 点无能为力。同样的 callee 可以清楚地知道第 2 点，但是对于第 1 点一无所知。这种困境是由于“函数”这个概念本就是为了代码段间的解耦和隔离，如果想要一个个解耦的函数，就必须承担无法全局优化的代价。

如果这样看，那么将寄存器分成差不多大小的两组的行为是有一定道理的，我们虽然不能做到全局优化，但是可以做到基于 caller 和 callee 各自一定的权力，使得双方的关于寄存器使用的“洞见”都可以得到利用。总好过只利用一方的信息。

2.3 caller-saved与callee-saved寄存器的灵活使用

从使用上来说，如果寄存器中是一个生命周期很长的变量，那么应当使用 callee-saved register ，它可以保证在其生命周期的多次函数调用中，值始终不发生变化；而如果寄存器中是一个用完就扔的临时变量，那么应当使用 caller-saved-register ，使用它并不需要保存，心理负担小。

caller-saved的使用场景：

临时数据的存放：在进行一系列计算时，编译器可能会选择使用caller saved registers来存储临时结果，因为这些结果在当前函数调用结束后不再需要。
非关键性数据的处理：对于那些不会被随后的函数调用所需的数据，使用caller saved registers可以在调用后立即丢弃。

callee-saved的使用场景：

重要数据的保护：当函数需要调用另一个函数时，它依赖callee saved registers来保护那些必须跨函数调用保存的关键数据。
保持状态的连续性：对于递归调用和多层嵌套调用，callee saved registers可以帮助保持调用链上每个函数的状态。

参考：

posted @ 2024-10-07 21:53 sureZ_ok 阅读(302) 评论(0) 编辑收藏举报

刷新页面返回顶部

sureZ