llvm的初步理解

LLVM是一个构建编译器的开源项目,其中Clang是其中一个比较典型的子项目。

LLVM的核心架构思想如下图

 

上图关键是LLVM IR,LLVM IR 把这个编译流程分为前端-中间优化-后端三个部分。

前端是把某种语言编译为LLVM IR,中间优化是LLVM的固定优化管线,后端是针对LLVM IR 生成各种目标框架支持的汇编语言。

LLVM IR有三种形式:二进制文件.bc、人类可阅读文件.ll、内存的表达;

类似 clang -emit-llvm -c hello.c -o hello.bc 生成bc文件

类似 llvm-dis hello.bc 生成.ll文件

.ll文件结构如下:语法接近C语言,比汇编语言抽象,比C语言底层而繁杂。

IR的结构简单分为Module、body

其中全局变量用@,局部变量用%,%1指的是第一个寄存器(抽象意义上的寄存器,不同于CPU的寄存器), alloca 是声明, align是字节对齐位数,store是存储,load是加载

 通过LLVM源码还可以定制自己的编译器和编译流程,我们留待下篇解答。

文档链接:https://llvm.org/docs/WritingAnLLVMPass.html

posted @ 2018-06-05 10:50  colin_chan  阅读(2734)  评论(0编辑  收藏  举报