compiler 学习

一款强大的编译器LLVM:http://llvm.org/docs/GettingStarted.html#layout
http://llvm.org/docs/LangRef.html
http://blog.csdn.net/banyao2006/article/details/7045216(中文版)
转载:http://blog.163.com/newcountry@126/blog/static/164768490201302847113/
 

入门指导里介绍如何使用llvm的tool来进行编译

http://llvm.org/docs/GettingStarted.html#id34

 

LLVM笔记(八) 关于pass的摘录

http://blog.163.com/newcountry@126/blog/static/164768490201329102423113/

 

LLVM笔记(九) 关于pass的摘录2

http://blog.163.com/newcountry@126/blog/static/164768490201321195754879/

llvm笔记(十):IR 

 http://blog.163.com/newcountry@126/blog/static/1647684902013213113342194/

 

 
一个现代编译器的主要工作流程:源代码 (source code) → 预处理器 (preprocessor) → 编译器 (compiler) → 汇编程序 (assembler) → 目标代码 (object code) → 链接器 (Linker) → 可执行程序 (executables)
 
源代码一般为高级语言 (High-level language)
 
目标语言(Target language)则是汇编语言或目标机器的目标代码(Object code),有时也称作机器代码(Machine code)。
 
编译器可以生成用来在与编译器本身所在的计算机和操作系统(平台)相同的环境下运行的目标代码,这种编译器又叫做“本地”编译器。另外,编译器也可以生成用来在其它平台上运行的目标代码,这种编译器又叫做交叉编译器
 

预处理器(preprocessor)作用是通过代入预定义等程序段源程序补充完整。

 

编译器前端(frontend)前端主要负责解析(parse)输入的源代码,由语法分析器和语意分析器协同工作

 

编译器后端(backend)编译器后端主要负责分析,优化中间代码(Intermediate representation)以及生成机器代码(Code Generation)。

 
一般说来所有的编译器分析,优化,变型都可以分成两大类: 函数内(intraprocedural)还是函数之间(interprocedural)进行。很明显,函数间的分析,优化更准确,但需要更长的时间来完成。(interprocedural很重要,是我这次看的point)
 

编译器分析(compiler analysis)

编译器分析的对象是前端生成并传递过来的中间代码,现代的优化型编译器(optimizing compiler)常常用好几种层次的中间代码来表示程序,高层的中间代码(high level IR)接近输入的源代码的格式,与输入语言相关(language dependent),包含更多的全局性的信息,和源代码的结构;中层的中间代码(middle level IR)与输入语言无关,低层的中间代码(Low level IR)与机器语言类似。 不同的分析,优化发生在最适合的那一层中间代码上。
 
常见的编译分析有函数调用树(call tree),控制流程图(Control flow graph),以及在此基础上的 变量定义-使用,使用-定义链(define-use/use-define or u-d/d-u chain),变量别名分析(alias analysis),指针分析(pointer analysis),数据依赖分析(data dependence analysis)等等。
上述的程序分析结果是编译器优化(compiler optimization)和程序变形(compiler transformation)的前提条件。常见的优化和变新有:函数内嵌(inlining),无用代码删除(Dead code elimination),标准化循环结构(loop normalization),循环体展开(loop unrolling),循环体合并,分裂(loop fusion,loop fission),数组填充(array padding),等等。 优化和变形的目标是减少代码的长度,提高内存(memory),缓存(cache)的使用率,减少读写磁盘,访问网络数据的频率。更高级的优化甚至可以把序列化的代码(serial code)变成并行运算,多线程的代码(parallelized,multi-threadedcode)。
 
编译器工作方式:
首先编译

  编译器

器进行语法分析,也就是要把那些字符串分离出来。
然后进行语义分析,就是把各个由语法分析分析出的语法单元的意义搞清楚。
最后生成的是目标文件,也称为obj文件。
再经过链接器的链接就可以生成最后的可执行代码了。
有些时候需要把多个文件产生的目标文件进行链接,产生最后的代码。这一过程称为交叉链接。

 

posted @ 2014-10-16 15:54  道以万计  阅读(526)  评论(0编辑  收藏  举报