Fork me on GitHub

Python内部执行过程

一、编译过程概述

  当我们执行Python代码的时候,在Python解释器用四个过程“拆解”我们的代码,最终被CPU执行返回给用户。

  首先当用户键入代码交给Python处理的时候会先进行词法分析,例如用户键入关键字或者当输入关键字有误时,都会被词法分析所触发,不正确的代码将不会被执行。

  下一步Python会进行语法分析,例如当"for i in test:"中,test后面的冒号如果被写为其他符号,代码依旧不会被执行。

  下面进入最关键的过程,在执行Python前,Python会生成.pyc文件,这个文件就是字节码,如果我们不小心修改了字节码,Python下次重新编译该程序时会和其上次生成的字节码文件进行比较,如果不匹配则会将被修改过的字节码文件进行覆盖,以确保每次编译后字节码的准确性。

  那么什么是字节码?字节码在Python虚拟机程序里对应的是PyCodeObject对象。.pyc文件是字节码在磁盘上的表现形式。简单来说就是在编译代码的过程中,首先会将代码中的函数、类等对象分类处理,然后生成字节码文件。有了字节码文件,CPU可以直接识别字节码文件进行处理,接着Python就可执行了。

二、过程图解

三、编译字节码

  Python中有一个内置函数compile(),可以将源文件编译成codeobject,首先看这个函数的说明:

  compile(...) compile(source, filename, mode[, flags[, dont_inherit]]) -> code object

  参数1:源文件的内容字符串

  参数2:源文件名称

  参数3:exec-编译module,single-编译一个声明,eval-编译一个表达式 一般使用前三个参数就够了

  使用示例:

#src_file.py
#some function
def f(d=0):
    c=1 
    print "hello"
a=9
b=8
f()

>>> a=open('src_file.py','r').read()    #命令行模式中打开源文件进行编译
>>> co=compile(a,'src_file','exec')
>>> type(co)
<type 'code'>    #编译出了codeobject对象

四、codeobject对象的属性

  codeobject有哪些变量,接上节的内容分析一下:

>>> print co.co_names    #所有的符号名称
('f', 'a', 'b')

>>> print co.co_name    #模块名、函数名、类名
<module>

>>> print co.co_consts    #常量集合、函数f和两个int常量a,b,d
(0, <code object f at 0xb7273b18, file "src_file", line 2>, 9, 8, None)

>>> print co.co_consts[1].co_varnames    #可以看到f函数也是一个codeobject,打印f中的局部变量
('c',)

>>> print co.co_code    #字节码指令
dZdZdZedS

>>> print co.co_consts[1].co_firstlineno    #代码块在文件中的起始行号
2

>>> print co.co_stacksize    #代码栈大小
2

>>> print co.co_filename    #文件名
src_file    #模块名、函数名、类名

  codeobject的co_code代表了字节码,这个字节码有什么含义?我们可以使用dis模块进行python的反编译:

import dis
dis.dis(co)
>>> output
 2        0 LOAD_CONST               0 (0)
          3 LOAD_CONST               1 (<code object f at 0xb7273b18, file "src_file", line 2>)
          6 MAKE_FUNCTION            1
          9 STORE_NAME               0 (f)
 5        12 LOAD_CONST              2 (9)
          15 STORE_NAME              1 (a)

 6        18 LOAD_CONST              3 (8)
          21 STORE_NAME              2 (b)

 7        24 LOAD_NAME               0 (f)
          27 CALL_FUNCTION           0
          30 POP_TOP             
          31 LOAD_CONST              4 (None)
          34 RETURN_VALUE

  从反编译的结果来看,python字节码其实是模仿的x86的汇编,将代码编译成一条一条的指令交给一个虚拟的cpu去执行。

  • 第一列:行号
  • 第二列:指令在代码块中的偏移量
  • 第三列:指令
  • 第四列:操作数
  • 第五列:操作数说明
posted @ 2016-01-31 00:24  stefan.liu  阅读(5175)  评论(0编辑  收藏  举报