Windows逆向分析入门（二）——原理篇

前言

　　正向开发，是先写代码，再编译成软件。而逆向分析，到手的只有软件。从软件入手，推测对应的代码，需要了解一下编译之后的软件是怎么跑起来的。

软件运行过程

　　1、软件加载到内存。

　　2、CPU读取内存的指令。

　　3、根据指令，再读取数据，进行运算。

　　4、运算的过程，数据是存在CPU里面的寄存器。

　　5、运算过程，用到另一个功能，需要保存当前环境，存到堆栈。

　　（这里涉及操作系统和计算组成原理，大概了解，心里有底就好）

代码语言的变化

　　1、C/C++语言：高级语言，给人看的

　　2、汇编语言：低级语言，给机器用的

　　（逆向分析，接触多是汇编语言，需要自行学习下）

软件加载过程

　　磁盘 >>内存>>寄存器

　　1、代码编译成软件，先放在磁盘（C盘，D盘这些）

　　2、开始运行的时候，就会加载进内存（平时说的内存条）

　　3、真正运行的是在CPU（也就是所谓的芯片），里面存数据的地方叫寄存器。

软件的构成

　　软件的外部

　　　　包含：一个主要程序（exe后缀），多个独立库（dll后缀）。

　　　　内存一开始加载exe，有必要的时候，exe再把dll加载进内存来。

　　　　exe或者dll在内存的开始位置，叫做基址。（每次加载，随机放置，基址不固定）

　　　　exe或者dll里面和基址的距离，叫做偏移。（每次加载，内部不变，偏移固定）

　　　　打个比喻：exe和dll相当小尺子，要放在内存这个大尺子上。

　　　　大尺子上只要有空位，小尺子就可以随便放。

　　　　小尺子不管怎么放，里面的刻度固定的。

　　软件的内部

　　　　软件 = 代码 + 数据

　　　　数据 = 静态数据（数据不会变）+ 动态数据（数据会改变）

　　　　动态数据 = 全局数据（多个函数共用）+ 局部数据（单个函数私有）

　　　　代码和静态数据在软件运行过程不会改变，位置固定，可以方便使用。

　　　　全局数据，因为是共用的，位置固定，也可以方便使用。

　　　　所以这三种的偏移是不变的。

　　　　内存地址 = 基址 + 偏移。

　　　　基址可以用GetModuleHandle得知。

　　　　偏移又是不变的，内存地址也就可以算出来了。

　　　　而偏移会变化的局部数据，就不能直接算出来了。

　　　　局部数据，是软件运行过程中，临时生成又销毁的。

　　　　所以要获取局部数据，只能在软件的运行过程进行拦截。(也就是所谓的HOOK)

逆向分析目的

　　逆向分析的两个目的

　　　　1、调用功能

　　　　2、获取数据

　　通过上面的原理可以知道

　　　　1、调用功能

　　　　　　代码是固定的，找到偏移，就可以调用。

　　　　2、获取数据

　　　　　　对于全局数据，找到偏移，就可以得到。

　　　　　　对于局部数据，需要拦截，才可以得到。

　　　　　　（拦截的是代码，所以要找代码的偏移）

　　所以，逆向的核心点，是找固定的偏移。

下一篇，找偏移的方法。

参考资料（下功夫，基础扎实，逆向才顺手）

汇编：http://c.biancheng.net/asm/

反汇编：《C++反汇编与逆向分析技术揭秘》

函数调用：https://blog.csdn.net/zhongguoren666/article/details/7586074?utm_source=blogxgwz6

工具和教程，放群里（163419350），方便交流。

实战代码也会放在github：https://github.com/KongKong20/WeChatPCHook

posted @ 2020-06-22 08:58 万物归空阅读(5645) 评论(3) 编辑收藏举报

刷新页面返回顶部

万物归空

Windows逆向分析入门（二）——原理篇

公告