Data structure alignment by binary operation
在寫C的過程中,我們會很自然地以為,我連續宣告一堆大小不一的char array。
經過Complier之後這些char array未必是連續擺放。至於為什麼就要談到我們今天的主角了alignment
以x86-32bit為例,
他喜歡一次讀取 4 Bytes (i.e. 32 bits),記憶中可以想成一格一格為 4 Bytes.其indes從 0 ~ 2^32 - 1
我們可以用 printf(sizeof(void *)); 來得知。machine在讀取指令時以多少Bytes為單位。
printf(sizeof(unsigned long));也行。
好讓每次讀取的位置皆為4的倍數,e.g. 0, 4, 8, 12 ...etc.
為了電腦的執行速度,Complier 會幫我們增加一些padding(填充),好讓每次讀取的位置都能是4的倍數。
實例:
在exploit(http://www.exploit-db.com/exploits/15285/)中
假設 def_ops 指向struct security_operations開頭
先看一下 Kernel source code
struct security_operations { char name[SECURITY_NAME_MAX + 1]; //SECURITY_NAME_MAX 預設10,所以我們知道為何target要+11 int (*ptrace_access_check) (struct task_struct *child, unsigned int mode); int (*ptrace_traceme) (struct task_struct *parent); .... http://lxr.linux.no/linux+v2.6.36/include/linux/security.h#L1363
解讀一下exploit
target = def_ops + sizeof(void *) + ((11 + sizeof(void *)) & ~(sizeof(void *) - 1)); //target想跳至ptrace_traceme
第一個 sizeof(void *) 因為要跳過 int (*ptrace_access_check) 這個pointer。
然而 name 這個 string 因為大小為11,但是為了做alignment。所以寫成
(11 + sizeof(void *)) & ~(sizeof(void *) - 1)
11 長度的char array 為了要入memory 又要 alignment 4 的倍數情況下,是要 給他三格(i.e. 12 Bytes)
多出的那 1 Bytes, 就是我們所謂的padding。 而"&"這邊的技巧在Linux Kernel也有用到[註1]。
& ~(sizeof(void *) - 1) == & 1100 //sizeof(void *) = 4
而(11 + sizeof(void *)) & 1100 在 Binary的角度來看就是做mask來遮蔽後面2-bits
前面兩個2-bits則保留。而最後
(11 + sizeof(void *)) & ~(sizeof(void *) - 1) == 12 Bytes
用我們人類常用的10進位來舉例更貼近,假設記憶體中以0, 10, 20, 30 ...來存取指令。
假設有一到指令從0放到15的位置。為了alignment 10 的倍數, 我們必須這指令從0~20。
實作上就是 15 + 10 = 25 個位數的地方mask掉變成20。 就像前面我們做
& ~(sizeof(void *) - 1) 一樣。
[註1]
#define PAGE_MASK (~(PAGE_SIZE-1))
http://lxr.free-electrons.com/source/arch/arm/include/asm/page.h#L15