编译原理:python编译器--从AST到字节码

首先了解下从AST到生成字节码的整个过程:

编译过程

Python编译器把词法分析语法分析叫做 "解析(Parse)", 并且放在Parser目录下。
从AST到生成 字节码的过程,才叫做 "编译(Compile)"

Python编译工作的主干代码是在**Python/compile.c **, 它主要完成5项工作:

  • 第一步,检查future语句。future 语句是 Python 的一个特性,让你可以提前使用未来版本的特性,提前适应语法和语义上的改变。

  • 第二步,建立符号表

  • 第三步,为基本块产生指令

  • 第四步,汇编过程:把所有基本块的代码组装在一起

  • 第五步,对字节码做窥孔优化

语义分析:建立符号表和引用消解

通常来说,在语义分析阶段首先是建立符号表,然后在此基础上做引用消解类型检查

Python为动态类型的语言,类型检查应该是不需要的,但引用消解还是要做的

python的符号表定义在 Include/symtable.h中,其中定义了两个结构,分别是符号表符号表的条目:

image

image

image

在编译过程中,针对每个模块(也就是一个python文件)会产生一个符号表(symtable)

Python程序被划分为"块(block)",块分为三种:模块,类和函数。每种块就是一种作用域,而在Python里面还叫命名空间每个块对应一个符号表条目(PySTEntryObject),每个符号表条目里存有该块里的所有符号(ste_symbols)。 每个块还可以有多个子块(ste_children),形成树状结构

在符号表里,有一个 st_blocks 字段,这是个字典,它能通过模块、类和函数的 AST 节点,查找到 Python 程序的符号表条目,通过这种方式,就把 AST 和符号表关联在了一起。

示例:下面的程序 对应的符号表长什么样子

a = 2 #模块级变量
class myclass:
    def __init__(self, x):
        self.x = x    
    def foo(self, b):
        c = a + self.x + b  #引用了外部变量a
        return c

这个示例程序有模块,类和函数三个级别的块,他们分别 对应一个符号表条目:
示例程序对应的符号表:
image

可看到,每个块中都有ste_sybol字段,它是一个字典,里面保存了本命名空间涉及的符号,以及每个符号的各种标志位(flags)

然后,针对这个示例程序,看看符号表的主要字段的取值:
image

符号表的建立过程
建立符号表的主程序是Python/symtable.c中的 PySymtable_BuildObject() 函数

Python建立符号表的过程,需要做两遍处理,如下图所示:
image

  • 第一遍,主要做了两件事情。第一件事情是建立一个个的块(也就是符号表条目),并形成树状结构,就像示例程序那样;第二件事情,就是给块中的符号打上一定的标记(flag)。
    用 GDB 跟踪一下第一遍处理后生成的结果
    可以参考下图,看一下 Python 的 REPL 中的输入信息:
    image
    在 symtable_add_def_helper() 函数中设置了断点,便于调试。当编译器处理到 foo 函数的时候,我在 GDB 中打印输出了一些信息:
    image

重点想让看的,是 foo 块中各个符号的标志信息:self 和 b 是 20,c 是 2,a 是 16。这是什么意思呢?

ste_symbols = {'self': 20, 'b': 20, 'c': 2, 'a': 16}

这就需要看一下 symtable.h 中,对这些标志位的定义:
image
整理成了一张更容易理解的图,你参考一下:
符号标志信息中每个位的含义:
image
根据上述信息,你会发现 self 和 b,其实是被标记了 3 号位和 5 号位,意思是这两个变量是函数参数,并且在 foo 中被使用。而 a 只标记了 5 号位,意思是 a 这个变量在 foo 中被使用,但这个变量又不是参数,所以肯定是来自外部作用域的。我们再看看 c,c 只在 2 号位被标记,表示这个变量在 foo 里被赋值了。

通过第一遍处理,我们会知道哪些变量是本地声明的变量、哪些变量在本块中被使用、哪几个变量是函数参数等几方面的信息。

  • 编译器会做第二遍的分析(见 symtable_analyze() 函数)。在这遍分析里,编译器会根据我们刚才说的 Python 关于变量引用的语义规则,分析出哪些是全局变量、哪些是自由变量,等等。这些信息也会被放到符号的标志位的第 12~15 位。
ste_symbols = {'self': 2068, 'b': 2068, 'c': 2050, 'a': 6160}

symtable.h中对作用域的标志位:
image

以变量 a 为例,它的标志值是 6160,也就是二进制的 1100000010000。其标记位设置如下,其作用域的标志位是 3,也就是说,a 是个隐式的全局变量。而 self、b 和 c 的作用域标志位都是 1,它们的意思是本地变量。
作用域的标志位:
image

在第二遍的分析过程中,Python 也做了一些语义检查。

可以搜索一下 Python/symtable.c 的代码,里面有很多地方会产生错误信息,比如“nonlocal declaration not allowed at module level(在模块级不允许非本地声明)”。

另外,Python 语言提供了访问符号表的 API,方便你直接在 REPL 中,来查看编译过程中生成的符号表。你可以参考我的屏幕截图:
image

现在符号表已经生成了。基于 AST 和符号表,Python 编译器就可以生成字节码。

生成 CFG 和指令

可以用Python调用编译器的API,来 观察字节码生成的情况:

>>> co = compile("a+2", "test.py", "eval")  //编译表达式"a+2"
>>> dis.dis(co.co_code)                     //反编译字节码
          0 LOAD_NAME                0 (0)  //装载变量a
          2 LOAD_CONST               0 (0)  //装载常数2
          4 BINARY_ADD                      //执行加法
          6 RETURN_VALUE                    //返回值

其中的 LOAD_NAMELOAD_CONSTBINARY_ADDRETURN_VALUE 都是字节码的指令。

Python 和 Java 的虚拟机一样,都是基于栈的虚拟机。所以,它们的指令也很相似。比如,加法操作的指令是不需要带操作数的,因为只需要取出栈顶的两个元素相加,把结果再放回栈顶就行了。

对比下python指令和Java指令的异同点:
image

它们主要的区别就在于,Java 的字节码对不同的数据类型会提供不同的指令,而 Python 则不加区分。因为 Python 对所有的数值,都会提供统一的计算方式。

所以一门语言的 IR,是跟这门语言的设计密切相关的。

生成 CFG 和字节码的代码在 **Python/compile.c **中。调用顺序如下:

image
总的逻辑是:以 visit 模式遍历整个 AST,并建立基本块和指令。对于每种 AST 节点,都由相应的函数来处理。

以 compiler_visit_expr1() 为例,对于二元操作,编译器首先会递归地遍历左侧子树和右侧子树,然后根据结果添加字节码的指令。

compiler_visit_expr1(struct compiler *c, expr_ty e)
{
    switch (e->kind) {
...
.    
    case BinOp_kind:
        VISIT(c, expr, e->v.BinOp.left);    //遍历左侧子树
        VISIT(c, expr, e->v.BinOp.right);   //遍历右侧子树
        ADDOP(c, binop(c, e->v.BinOp.op));  //添加二元操作的指令
        break;
...
}

那么基本块是如何生成的呢?

编译器在进入一个作用域的时候(比如函数),至少要生成一个基本块。而像循环语句、if 语句,还会产生额外的基本块。
所以,编译的结果,会在 compiler 结构中保存一系列的基本块,这些基本块相互连接,构成 CFG;基本块中又包含一个指令数组,每个指令又包含操作码、参数等信息。
基本块和指令:
image
为了直观理解,我设计了一个简单的示例程序。foo 函数里面有一个 if 语句,这样会产生多个基本块。

def foo(a):
    if a > 10 :
        b = a
    else:
        b = 10
    return b

通过 GDB 跟踪编译过程,我们发现,它生成的 CFG 如下图所示:
image

在 CFG 里,你要注意两组箭头
实线箭头是基本块之间的跳转关系,用 b_next 字段来标记。
虚线箭头能够基于 b_list 字段把所有的基本块串起来,形成一个链表,每一个新生成的基本块指向前一个基本块。只要有一个指针指向最后一个基本块,就能访问所有的基本块。

汇编(Assembly)

汇编过程是在 **Python/compiler.c ** 中的assemble() 函数中完成的。

Python 的汇编阶段,是生成字节码,它们都是生成目标代码。

具体来说,汇编阶段主要会完成以下任务:

  • 把每个基本块的指令对象转化成字节码。
  • 把所有基本块的字节码拼成一个整体。
  • 对于从一个基本块跳转到另一个基本块的 jump 指令,它们有些采用的是相对定位方式,比如往前跳几个字的距离。这个时候,编译器要计算出正确的偏移值。
  • 生成 PyCodeObject 对象,这个对象里保存着最后生成的字节码和其他辅助信息,用于 Python 的解释器执行。

通过示例程序,来直观地看一下汇编阶段的工作成果。你可以参照下图,使用 instaviz 工具看一下 foo 函数的编译结果。
image
在 PyCodeObject 对象中,co_code 字段是生成的字节码(用 16 进制显示)。你还能看到常量表和变量表,这些都是在解释器中运行所需要的信息。
image

如果把 co_code 字段的那一串字节码反编译一下,你会得到下面的信息:
image

一共 11 条指令,其中 BB1 是 7 条,BB2 和 BB3 各 2 条。BB1 里面是 If 条件和 if 块中的内容,BB2 对应的是 else 块的内容,BB3 则对应 return 语句。

窥孔优化

总体来说,在编译的过程中,Python 编译器的优化功能是很有限的。在 compiler.c 的代码中,你会看到一点优化逻辑。比如,在为 if 语句生成指令的时候,编译器就会看看 if 条件是否是个常数,从而不必生成 if 块或者 else 块的代码。
image

另一个优化机会,就是在字节码的基础上优化,这就是窥孔优化,其实现是在 Python/peephole.c 中。它能完成的优化包括:

  • 多个 LOAD_CONST 指令替换为一条加载常数元组的指令。
  • 如果一个跳转指令,跳到 return 指令,那么可以把跳转指令直接替换成 return 指令。
  • 如果一个条件跳转指令,跳到另一个条件跳转指令,则可以基于逻辑运算的规则做优化。比如,“x:JUMP_IF_FALSE_OR_POP y”和“y:JUMP_IF_FALSE_OR_POP z”可以直接简化为“x:JUMP_IF_FALSE_OR_POP z”。这是什么意思呢?第一句是依据栈顶的值做判断,如果为 false 就跳转到 y。而第二句,继续依据栈顶的值做判断,如果为 false 就跳转到 z。那么,简化后,可以直接从第一句跳转到 z。
  • 去掉 return 指令后面的代码。
  • ......

在做优化的时候,窥孔优化器会去掉原来的指令,替换成新的指令。如果有多余出来的位置,则会先填充 NOP 指令,也就是不做任何操作。最后,才扫描一遍整个字节码,把 NOP 指令去掉,并且调整受影响的 jump 指令的参数。

小结

  • Python 通过一个建立符号表的过程来做相关的语义分析,包括做引用消解和其他语义检查。由于 Python 可以不声明变量就直接使用,所以编译器要能识别出正确的“定义 - 使用”关系。

  • 生成字节码的工作实际上包含了生成 CFG、为每个基本块生成指令,以及把指令汇编成字节码,并生成 PyCodeObject 对象的过程。

  • 窥孔优化器在字节码的基础上做了一些优化,研究这个程序,会让你对窥孔优化的认识变得具象起来。

image


image

image

参考: Python编译器(二):从AST到字节码

posted @ 2022-09-16 00:09  牛犁heart  阅读(1352)  评论(0编辑  收藏  举报