逆向知识第七讲,三目运算符在汇编中的表现形式,以及编译器优化方式
---恢复内容开始---
逆向知识第七讲,三目运算符在汇编中的表现形式
一丶编译器优化方式
首先说一下编译器优化方式.
1.常量折叠
2.常量传播
3.复写传播
4.公共表达式
5.去掉不可达到分支
6.顺序代替分支
7.数学变化
8.代码外提
9.减少变量.
10 强度削弱.
优化方式解析
1.常量折叠
常量折叠已经讲过, 就是两个常量相加 8 + 8 ,那么在编译前期就能计算出来.
2.常量传播
当一个变量,没有对齐进行写入或者更改的时候,这个时候可以当做常量.(优化为常量)
3.复写传播
这个需要好好说说了,我们都知道,C语言中,C调用约定都需要平栈.比如你调用完毕一个printf,那么就需要平栈.
而优化的时候,直接一起平栈了.
就比如:
int i = (a * a + b);
int j = i * 5;
那么此时可以变成 int j = (a * a + b) * 5 ;这样就会省掉一个变量(当然和去除变量不一样)
call addr
add esp,8
call addr
add esp,8
此时汇编代码可以变成
call addr
call addr
add esp,16 这样就省掉了一个add 指令了.
4.公共表达式
公共表达式和复写传播有点不一样.(看着是相反的.但是不能说是相反的.)
比如 int i = (a *a * b) * 7;
int j = (a * a * b) * 7 * 3
优化之后变成.
int j = i * 3;
什么是公共表达式,就是说,表达式用的都是一样的.重复使用,这样的时候,可以使用变量来存着了.或者中专一个寄存器保存其结果.
这样效率会很快,不用重新计算了.
5.去掉不可达到分支
这个应该很好理解.
if(1) { ...... } else { ..... }
此时if语句会成立,而else永远不会成立,那么编译器优化的时候就可以去掉else语句了.
6.顺序代替分支
这个下方讲解三木运算符的时候可以明白.
7.数学变化
这也很好理解.
3a + 5a
那么此时可以变为一条表达式计算直接变成8a
8.代码外提
也很好理解.
for (int i = 0; i < (argc / 3);i++) { .............. //中间没有使用argc变量 }
中间没有使用argc变量.
那么此时优化的时候,可能会用寄存器,也或者会用一个局部变量保存 (argc / 3)
int j = (argc / 3);
那么此时for循环的条件变成了 i < j即可.
这样就不用每次循环一遍就计算一遍(argc / 3)了.
9.减少变量.
定义的变量没有使用,优化的时候自然就会消失了.(减少空间)
10 强度削弱.
很好理解.我们都知道除法的指令周期很长.所以前边讲解除法的时候各种套路,各种数学定理各种公式.
目的是什么,目的就是为了让指令周期缩短一点.
强度削弱指的就是,当时用高指令周期的指令的时候,可不可以使用低指令周期完成高指令周期做的事情.
比如说:
一个DIV指令是100指令周期(当然你可以想象成100秒)
那么一个移位是10个指令周期
此时我计算 一个公式 n / 4;
那么可以变成
mov eax,[ebp - xxx]
sar eax,2
也完成了DIV的作用. 如果看做是100秒时间,那么我们只用了10^n秒(n的取值看上面的指令,比如mov,占4个指令周期,举个例子,那么合起来才14个指令周期)
二丶三木运算符在汇编中的表现形式
高级代码:
#include "stdafx.h" #include "MyClass.h" int main(int argc, char* argv[]) { unsigned int nVar_4 = 5; scanf("%d", &nVar_4); printf("%d\r\n", argc == 0 ? 0 : -1); 第一种表达方式,判读为零还是为1的情况 printf("%d\r\n", argc > 9 ? argc*nVar_4 : nVar_4/argc); 第二种表达方式,无法优化的表达方式. printf("%d\r\n", argc == 9 ? 35 : 98); 第三种表达方式,利用0和-1来运算 printf("%d\r\n", argc >= 9 ? 35 : 98); 第四种表达方式,指令支持 }
1.三木运算符第一种表达形式.
有用的汇编代码就4行.
1.变量给寄存器保存.
2.寄存器内容求补码
3.带进位的减法.
首先说下什么意思.
这里是无分支三木运算
neg的意思就是求补, 但是运算的时候是 ecx = 0 - ecx值.
neg只有 0 - 0的时候才不会借位.
还原代码要从三方面考虑
为零的情况下
为零的时候,neg 一下,那么其结果还是 0,CF位没有借位.
还原代码为:
if(argc == 0) { ecx = 0; }
为负数的时候:
如果为负数的时候,那么
neg一下,其结果是 0 - 负数 (CF借位,则置位1)
sbb 负数- 负数 - CF 结果是-1
还原代码为:
if(argc < 0) { ecx = -1; }
为正数的情况下
如果是正数
neg一下 0 - 正数 = 负数, 那么CF借位了,其结果是1
sbb一下. 负数- 负数 - CF 其结果是 -1 (负数- 负数= 0,0 - CF(1) = -1)
还原代码:
if(argc > 0) { ecx == -1; }
总结上面方面情况还原得出其还原代码为.
if(argc < 0) ecx = -1; if(argc ==0) ecx = 0; if(argc > 0) ecx = -1;
如果转化为三木运算符,这个就看自己爱怎么转化了
比如:
argc ==0 ? 0 : -1
a ? b :c 以后分为a b c讲解,a代表表达式和条件 ,b和C代表其结果.
其中,这种优化方式,则是顺序优化.也就是上面没说的.结果之后有一方成立
2.三木运算符的第二种表达方式
高级代码:
printf("%d\r\n", argc > 9 ? argc*nVar_4 : nVar_4/argc);
这个代码,无法优化,因为不知道变量是多少.
看下汇编代码把.
这个很简单了.
1.局部变量给寄存器保存.
2.和9比较
3.小于怎么怎么做
4.大于怎么怎么做.
3.三木运算符的高级汇编表示,利用0和-1
高级代码:
printf("%d\r\n", argc == 9 ? 35 : 98);
对应汇编代码:
这个汇编代码要分为两部分看,三部分代入.
1.相等的情况下怎么走
2.大于的时候怎么走
3.小于的时候怎么走.
1.相等的时候怎么走(属于代入)
看第一部分代码:
看上面汇编代码解析
这里的esi是argc变量,因为上下文关系,所以变量的值已经在esi保存了。
现在我们带入走汇编指令
当esi == 9的时候
第二句 sub edx,9 (结果为0)
第三句 neg edx (0 - 0 还是0)
第四句 sbb edx,edx (0 - 0 - CF, 此时因为neg所以CF = 0 所以就是 0 - 0 - 0 还是0
接着看下方第二部分代码
为零的时候,edx 走到and之后,还是0
然后接着add 那么其结果是23h
由此还原汇编代码:
if(argc == 9) edx = 23h
2.大于的时候怎么走
还是同上
1.如果> 9,那么 sub后结果是正数
2.neg之后. 0 - 正数= 负数 (0 - 正数的时候,借位了,所以CF位是1)
3.sbb 之后 负数- 负数 = 0, 然后- CF位 = -1;
4.如果是-1,那么and之后其结果是3FH
5.接着add之后其结果是 (3fh + 23h)
还原代码:
if (argc > 9) edx = (3fh + 23h)
3.小于的时候怎么走
1.sub之后, 结果为负数
2.neg之后( 0 - 负数 = 取负数的绝对值(负负得正),有借位,所以CF = 1)
3.sbb 之后, 正数- 正数 - CF = 正数- 正数 - 1 = -1;
4.结果为-1,那么and起作用
5,执行add,加23h
还原代码:
if (argc < 9) edx = (0c1h + 23h)
综上条件,换成三目运算其结果是:
if(argc < 9) edx = 3fh + 23h if(argc ==9)edx = 23h if(argc > 9) edx = (3fh + 23h)
那么可以还原成:
argc == 9 ? 23h : 62h
注意这里的3Fh,这里的3Fh,是 c - b (如果条件取反,那么则是b-c)的结果.
四丶指令支持版本
高级代码:
printf("%d\r\n", argc >= 9 ? 35 : 98);
汇编代码:
注意,esi还是 argc的值
这里出现了新的指令 setl指令,这属于set系列
和条件跳转指令一样
比如 jns jle(小于等于) jge(大于等于) ....
这里setl l代表小的意思也就是小于
那么就很简单了.
1.局部变量和9比较
2.如果小于9,则al设置为1
3.dec相减,结果为0
4.根据0和非0的值去and,如果为零,则 and al 0c1h则没用
5.最后add即可.
也是三部分代入,这里和上面类似.我直接代入还原代码.
但是需要注意,这里是如果小于则会设置al,那么就是小于的时候会走一个,而大于或者等于,其结果有不一样.
小于的情况下:
1.和9比较
2.小于9,al设置为1
3.dec eax, 1 - 1 = 0;结果为零.
4.为零,那么and执行之后还是0
5.执行add
还原代码:
根据上面得知,小于9 会执行 add
if(argc < 9) reg32 = 62h
大于或者等于的情况下.
1.和9比较,大于9
2.大于9,则al不设置,结果为0
3.dec eax, 0 - 1 = -1,其结果变成-1,也就是FFFFFFFF
4.结果为-1,则and成立,其结果变为0C1H
5.add eax,62 紧接着加上其结果
还原代码
if(argc >=9) reg32 = (c1 + 62h)注意这里会进位的.
综上所述,可以得出:
if(argc < 9) reg32 = 62h if(argc >= 9)reg32 = (0c1h + 62h);
(0c1h + 62)然后看结果,后八位(因为我们是32位系统)其结果是35
还原三目运算符为:
argc >= 9 ? 35:98
坚持两字,简单,轻便,但是真正的执行起来确实需要很长很长时间.当你把坚持两字当做你要走的路,那么你总会成功. 想学习,有问题请加群.群号:725864912(收费)群名称: 逆向学习小分队 群里有大量学习资源. 以及定期直播答疑.有一个良好的学习氛围. 涉及到外挂反外挂病毒 司法取证加解密 驱动过保护 VT 等技术,期待你的进入。
详情请点击链接查看置顶博客 https://www.cnblogs.com/iBinary/p/7572603.html
本文来自博客园,作者:iBinary,未经允许禁止转载 转载前可联系本人.对于爬虫人员来说如果发现保留起诉权力.https://www.cnblogs.com/iBinary/p/7824555.html
欢迎大家关注我的微信公众号.不定期的更新文章.更新技术. 关注公众号后请大家养成 不白嫖的习惯.欢迎大家赞赏. 也希望在看完公众号文章之后 不忘 点击 收藏 转发 以及点击在看功能. QQ群: