llvm的初步理解
LLVM是一个构建编译器的开源项目,其中Clang是其中一个比较典型的子项目。
LLVM的核心架构思想如下图
上图关键是LLVM IR,LLVM IR 把这个编译流程分为前端-中间优化-后端三个部分。
前端是把某种语言编译为LLVM IR,中间优化是LLVM的固定优化管线,后端是针对LLVM IR 生成各种目标框架支持的汇编语言。
LLVM IR有三种形式:二进制文件.bc、人类可阅读文件.ll、内存的表达;
类似 clang -emit-llvm -c hello.c -o hello.bc 生成bc文件
类似 llvm-dis hello.bc 生成.ll文件
.ll文件结构如下:语法接近C语言,比汇编语言抽象,比C语言底层而繁杂。
IR的结构简单分为Module、body
其中全局变量用@,局部变量用%,%1指的是第一个寄存器(抽象意义上的寄存器,不同于CPU的寄存器), alloca 是声明, align是字节对齐位数,store是存储,load是加载
通过LLVM源码还可以定制自己的编译器和编译流程,我们留待下篇解答。
享受HelloWorld带来的思考盛宴