32 位的寄存器容量是 4 字节, 如果内存中的数据都按 4*n 字节对齐, 肯定会加快吞吐速度;
但事实并非如此, 不同大小的数据可能会让寄存器别别扭扭地去处理, 从而降低了运行速度!
如果使用对齐, 就会浪费掉一些内存空间; 其实这是一个需要权衡 "速度" 与 "内存" 得失的问题.
准备使用的测试文件:
; Test11_1.asm .586 .model flat, stdcall include windows.inc include kernel32.inc include masm32.inc include debug.inc includelib kernel32.lib includelib masm32.lib includelib debug.lib .data ;声明三个字节变量 v1 db 0 v2 db 0 v3 db 0 .code main proc ;三个字节变量的默认偏移地址如下(在没有对齐约束的情况下, 它们各占一个字节): PrintDec offset v1 ;4206592 PrintDec offset v2 ;4206593 PrintDec offset v3 ;4206594 ret main endp end main
ALIGN: 指定对齐边界
; Test11_2.asm .586 .model flat, stdcall include windows.inc include kernel32.inc include masm32.inc include debug.inc includelib kernel32.lib includelib masm32.lib includelib debug.lib .data v1 db 0 align 4 ;让下一个变量的起始地址保证是 4 的倍数 v2 db 0 v3 db 0 .code main proc PrintDec offset v1 ;4206592 PrintDec offset v2 ;4206596 (!) PrintDec offset v3 ;4206597 ret main endp end main ;align 后面的参数是 2n, 还可测试下: 1、2、8、16
EVEN 是偶对齐, 相当于 ALIGN 2
; Test11_3.asm .586 .model flat, stdcall include windows.inc include kernel32.inc include masm32.inc include debug.inc includelib kernel32.lib includelib masm32.lib includelib debug.lib .data v1 db 0 even ;(!) v2 db 0 v3 db 0 .code main proc PrintDec offset v1 ;4206592 PrintDec offset v2 ;4206594 (!) PrintDec offset v3 ;4206595 ret main endp end main
ORG 可以指定从当前位置跨越指定书目的字节再安排下一个数据:
; Test11_4.asm .586 .model flat, stdcall include windows.inc include kernel32.inc include masm32.inc include debug.inc includelib kernel32.lib includelib masm32.lib includelib debug.lib .data v1 db 0 org 100 ;(!) v2 db 0 v3 db 0 .code main proc PrintDec offset v1 ;4206592 PrintDec offset v2 ;4206692 (!) PrintDec offset v3 ;4206693 ret main endp end main
这些伪指令不对局部变量产生影响, 因为伪指令作用在编译之前, 局部变量使用内存是程序运行之后的事.
关于局部变量的对齐和速度, 除了编译的工作外, 我们在安排变量类型和次序时也应该考虑到 "对齐" 的问题.