Python对象体系揭秘

Guido用C语言创造了Python,在Python的世界中一切皆为对象.

 

一.C视角中的Python对象

让我们一起追溯到源头,Python由C语言实现,且向外提供了C的API http://docs.python.org/c-api/index.html .

我们思考问题的时候,可能对于对象这种东西很容易理解,而计算机能理解的只有0,1序列这样的字节序列,从根本上讲,我们所说的计算机语言中的对象只是在内存中的一块内存空间里的0,1序列而已,这些连续或者非连续的内存空间在更高层次上可以看作是一个整体.在Python中,我们所提到的一般的对象都是C中的结构体在堆Heap上申请的一块内存空间.

 

为了能够用C语言实现Python的面向对象的机制,需要定义一些结构体,能够操作那些对象的内存空间。

 

1.PyObject&PyVarObject

 

所有的Python对象都有一些共同的东西,我们将其高度抽象成一个结构体PyObject

C代码  收藏代码
  1. typedef struct _object{  
  2.     PyObject_HEAD  
  3. } PyObject;  
  4. //其实PyObject_HEAD这个宏在发行版本中的为  
  5. int ob_refcnt;  
  6. struct _typeobject *ob_type;  

 

ob_refcnt,就是对象引用计数,它的存在是为了实现了Python的基于引用技术的垃圾回收机制.

还有一个是指向一个类型对象结构体的指针,用以代表该对象的类型.

 

在C语言的实现的时候,还有一个结构体扩展于PyObject

那便是PyVarObject,其内容为PyObject_VAR_HEAD这个宏,它比PyObject多了一个ob_size,用来表示变长对象的长度,详情见http://docs.python.org/c-api/structures.html

 

还有一点请大家不要搞混,这里的PyObject和PyVarObject和Python世界中的真实对象没有对应关系,这两个只是Python对象全体在C语言表示中的一种抽象.也就是说在C语言中,只要是一个Python对象结构体的数据,那么其内存的开始部分都会有上面结构体的几个变量,所以一个PyObject的指针便可以指向所有的C语言中的表示Python对象的结构体,这样在C语言的实现中,我们便可以通过这个统一的指针操作所有的内置的Python对象结构体了.

 

2.PyTypeObject

刚刚还有一个东西没有讲,那便是_typeobject(PyTypeObject)这个结构体,它是Python中所有类型对象的抽象,这样我们在C语言的层次里对于所有的类型对象结构体都可以通过PyTypeObject的指针来调用

C代码  收藏代码
  1. typedef struct _typeobject {  
  2. //注意开始部分为PyObject_VAR_HEAD  
  3. PyObject_VAR_HEAD  
  4. char *tp_name; /* For printing, in format  
  5. "<module>.<name>" */  
  6. int tp_basicsize, tp_itemsize; /* For allocation */  
  7. /* Methods to implement standard operations */  
  8. destructor tp_dealloc;  
  9. printfunc tp_print;  
  10. ……  
  11. /* More standard operations (here for  
  12. binary compatibility) */  
  13. hashfunc tp_hash;  
  14. ternaryfunc tp_call;  
  15. ……  
  16. } PyTypeObject;  

 

3.Python内置对象和C结构体的对应

 

现在Python面向对象机制的对象和类型的抽象都已经说过了,接下来我们来看下在python中真实存在的对象在C语言实现的时候是怎么样的呢?

 

首先需要谈的是那些Python的内置对象,这些都是C语言定义了的,当Python环境初始化后,这些对象便创建好了。

 

C代码  收藏代码
  1. PyAPI_DATA(PyTypeObject) PyType_Type; /* built-in 'type' */  
  2. PyAPI_DATA(PyTypeObject) PyBaseObject_Type; /* built-in 'object' */  

 

object对象在Python中是一个比较基础的对象,它在C语言中对应的结构体是PyBaseObject_Type,从C语言中的这个命名我们可以大概知道这个类是一个类型对象.

 

还有就是Python中的<type 'type'>在C语言中对应着PyType_Type

C代码  收藏代码
  1. PyTypeObject PyType_Type = {  
  2. PyObject_HEAD_INIT(&PyType_Type)  
  3. 0, /* ob_size */  
  4. "type", /* tp_name */  
  5. sizeof(PyHeapTypeObject), /* tp_basicsize */  
  6. sizeof(PyMemberDef), /* tp_itemsize */  
  7. ……  
  8. };  

 

我们再看看比较具体的整数

一个整数instance在C语言中的表示的结构体是PyIntObject

 

C代码  收藏代码
  1. typedef struct {  
  2. PyObject_HEAD  
  3. long ob_ival;  
  4. } PyIntObject;  

 也就是说通过这样的结构体我们就可以在C语言的的运行时中指向Python的整数对象.

 那么相应的我们Python的整数类型对象为

C代码  收藏代码
  1. yTypeObject PyInt_Type = {  
  2. PyObject_HEAD_INIT(&PyType_Type)  
  3. 0,  
  4. "int",  
  5. sizeof(PyIntObject),  
  6. ……  
  7. };  

 

4.自定义对象

当我们创建一个Python对象的时候,最终都是通过Python的底层来做的,

当我们通过Python语言定义了自己的一个class A之后,Python首先根据你写的代码创建了一个A这样的class对象(类对象),然后当你需要创建A的实例的时候,其实在Python的底层都是通过A这个Class对象进行创建的。

 

 

二.Python视角中的对象体系

在单纯的Python的世界中,一切都是对象.这些对象可以分为三类,

metaclasses,classes,instance

其中classes又可以分为内置的type和用户自定义的class

 

下面我们通过一张图片来作详细的说明

 


注:

其中C的定义的方式如下(python 中继承于某类直接写在类名后面的括号中):

 

Python代码  收藏代码
  1. class C(object):  
  2.    ......  

 


其中实线表示 is-kind-of 的关系 ,虚线表示is-instance-of的关系.

查看当前classes对象(instances对象没有__bases__属性)的基类的时候,可以用过classes_name.__bases__进行查看,其值为一个Tuple元组(Python支持多继承).

查看当前对象的类型的方法是object_name.__class__

 

我们可以通过一些测试来证实上面的图:


type为所有类的类

 

后记:

在看了《Python源码解析》的相关章节之后,感觉作者写的不是很条理或者自己的思维没有跟得上作者的思维。所以我就想抽一个空余时间按照自己的思维方式整理下。

自己计算机的入门语言便是C语言,所以写起来还算顺手。

posted @ 2014-10-11 08:58  juggd  阅读(741)  评论(3编辑  收藏  举报