boost.python入门教程 ----python 嵌入c++

Python语言简介

       Python是一种脚本语言。以开放的开发接口和独特的语法著称。尽管Python在国内引起注意只有几年的时间,但实际上Python出现于上世纪90年代(据www.python.org介绍,这个时间可以上溯至1990年),已经有十几年的时间,它的流行也有很久,在嵌入脚本、互联网应用、系统管理和维护等领域,Python使用的非常广泛。

       Python的语法与我们常见的C系语法有很大不同,对于Python,书写格式也是语法的部分。主要表现在,每一个子语句段都要比它的父级缩进一层。例如:

  • >>> a, b = 0, 1
  • >>> while b < 1000:
  • ...     print b,
  • ...     a, b = b, a+b
  • ...

以上是一段求Fibonacci数列的程序,>>>和…都是Python控制台的交互提示符。我们可以看到,while循环的循环体不是通过括号或者end之类的关键字标示,而是用缩进与上一级区分开。在Python中,每级代码之间的缩进距离不做要求,但是在同一个文件中必须保持一致,最常见的写法是缩进四个空格。

理解这一点后,Python代码的可读性非常高。在强制性的书写规范下,更容易写出规范的代码。

Python支持通用的各种语法结构,包括if、while/for循环、函数、类、异常处理以及模块(module)和包(Package)。以下是一些常见的语法示例:

(展示Python代码)

时间所限,我们不可能在这里详细了解Python语言,对于交互式开发人员,有几点值得注意,在这里简单介绍下:

Python采用命名—对象实体机制。任何Python中的元素都可以看作是一种对象。包括所有的数据类型和定义。对变量的定义和赋值,实际上是将一个命名绑定到托管环境中的一个对象上。这个过程不涉及对象本身的运算,也不进行类型检查,所以在程序运行过程中可以任意对某个命名赋值并改变其类型。

 

Python对象在运行期可以动态的添加和删除成员,不受类型限制(当然,也可以设计出静态类型的数据结构)。

Python支持运算符重载。

Python C API

       Python虚拟机开放了大量的API,几乎所有的语法内容,和虚拟机功能,都可以通过C-API从外部调用实现。加上整个虚拟机开放源码,用C语言操作Python虚拟机非常方便,从某种意义上说,Python可以作为一个C语言的运行时环境存在。同时,C语言也可以作为Python的底层扩展使用。

       Python C API的引用头文件是python.h,在Python安装目录的include子目录可以找到。静态连接库pythonxx.lib(xx=主版本号+一级子版本号,如python2.4对应python24.lib)在libs目录下。

扩展Python系统

       扩展Python,即编写可供Python加载的模块,由Python程序进行调用。简单来讲,主要有以下几个步骤:

       编写符合Python封装约定的函数和结构定义。对于函数而言,要求参数均为PyObject*

或其“子”类型。当然,C语言中没有这样的语法,这个继承关系是Python语法意义的。而对于自定义的对象,Python有一套完备的约定,我们在Python的文档中可以看到若干示例。(展示代码)。

       对于需要开放的函数,要编写方法定义表,这是一个UNION,按照固定格式填写数据。(展示代码)。对于类型对象,则是通过PyModule_AddObject方法引入。

       要引入函数定义的话,还需要执行模块初始化函数。

       将项目编译为动态链接库,放在Python的DLLs路径即可。

嵌入Python解释器

       在C程序中嵌入Python解释器并不复杂,基本的流程如下:

       调用Py_Initialize()函数,初始化虚拟机。

       编写操作虚拟机的命令。

       调用Py_Finalize()函数释放虚拟机资源。

       Python虚拟机提供了丰富的API以供操作,基本上用Python脚本可以实现的功能,通过API都可以实现。当然通常不会完全使用API,而是以API和内嵌脚本结合使用,在Python文档中提供了一个简单的例子,演示了常用的模块和对象引入、执行可回调对象,变量提取等功能(展示代码)。

综合技术——扩展式嵌入

       我们可以将Python虚拟机嵌入C/C++程序的同时,通过扩展代码,将我们需要的内容引入Python虚拟机,这样,就可以在虚拟机中通过Python脚本访问C++环境中提供的扩展内容,在掌握了扩展和嵌入技术后,这个应用十分自然和简便,在Python文档中,有一个实例说明了这中应用方式。(展示代码)

Boost.Python

       Python虚拟机本身以标准C编写,它的API也均为C型式,直接应用在C++程序中略有不便。通常我们会使用一些第三方的程序库来实现,这里重点介绍BOOST.Python的使用。

       Boost是一个久负盛名的C++代码库,关于它的具体情况在网上有很多介绍,具体到BOOST.Python,这是BOOST开发组专门为C++/Python直接的互操作而开发的类库,也是Boost中唯一一个解释语言支持模块。Boost.Python除了提供Python C API的C++兼容封装,也使得整个扩展/嵌入过程更加方便。

BOOST的预编译

       BOOST中的部分模块需要预编译才能使用,Boost.Python也在此列。在Boost的文档中,有详细的编译方式说明,具体到我们使用的VC6/7.1,windows 2000+,Python2.4,编译过程可以简化为以下几步:

1、  生成Boost编译工具BJam。这个工具的源码在Boost目录的tools/build/jam_src 目录下,正常情况下,直接执行build.bat即可生成。执行完毕后,到bin.ntx86子目录找到bjam.exe文件,复制到Boost根目录即可。

2、  配置编译环境,编译Boost时,要提供编译器种类和路径,子模块还可能有自己的配置要求,如Python子模块要求提供Python的目录和版本号。

3、  执行Bjam。此时要向Bjam提供使用的编译器种类,以及附带的编译参数。

4、  以下是我编译Boost使用的bat文件,大家需要编译Boost的话,可以将其中的VC和Python路径改为本机路径,即可使用。

bjam_vc71.bat

set PYTHON_ROOT=D:/Python24

set vc-7_1=D:/Microsoft Visual Studio .NET 2003/Vc7

set ICU_PATH=D:/icu3.4

set VC71_ROOT=D:/Microsoft Visual Studio .NET 2003/Vc7

bjam -sTOOLS=vc-7_1 -sICU_PATH=D:/icu3.4 stage

bjam_vc60.bat

set PYTHON_ROOT=D:/Python24

set ICU_PATH=D:/icu3.4

set MSVC_ROOT=D:/Microsoft Visual Studio/VC98

bjam -sTOOLS=msvc -sICU_PATH=D:/icu3.4 stage

这里的ICU是一个国际化代码库,Boost使用这个第三方代码库为自己的正则表达式模块提供Unicode支持,如果只使用Python模块,可以去掉这方面的配置。

Stage参数指示编译工具将生成的lib文件统一放置于stage子目录。

Boost.Python的引用头文件是<boost/python.hpp>,命名空间是boost::python。

扩展Python系统

       首先,对于Python基于对象的体系结构,Boost提供了一组封装对象给予支持。这其中除了基本的PyObject(Boost中封装为Boost::Python::object) 对象,还包括了序列容器组。Boost.Python文档的“Obejct Wrapper”部分(/libs/python/doc/v2/ObjectWrapper.html#ObjectWrapper-concept)对此有详细讲解。如果我们的扩展代码中需要调用这些对象,可以直接引用。

       另一方面,对于函数和对象封装,Boost提供了一套更为友好的方式。例如,如果在函数声明的参数列表中出现可以与Python类型直接对应的char *、int、float等,不需要手动进行与PyOjbect*的转化,Boost可以识别这些类型。

       下面我们看一个简单的函数封装示例:

       首先,在VC中建立一个空的DLL项目,然后定义函数:

      

Cppcode.h

#include <string>

 

int Add(int, int);

 

int Sub(int, int);

 

std::string Concat(std::string, std::string);

 

 

Cppcode.cpp

#include "CppCode.h"

 

int Add(int x, int y)

{

     return x + y;

}

 

int Sub(int x, int y)

{

     return x - y;

}

 

std::string Concat(std::string x, std::string y)

{

     return x + y;

}

 

 

 

然后编写封装代码:

Wrapper.cpp

#include <boost/python.hpp>

#include "CppCode.h"

 

using namespace boost::python;

 

BOOST_PYTHON_MODULE(FunTest)

{

     def("Add", Add);

     def("Sub", Sub);

     def("Concat", Concat);

}

 

编译生成DLL文件(需要注意的是生成的文件名必须与BOOST_PYTHON_MOUDLE宏的参数一致),放在Python/DLLs目录下即可。(演示)

由于Python使用动态类型,对于Python代码,函数重载没有语法依据(但是可以定义默认参数值和动态参数列表)。但我们在C++代码中可能会需要重载多个函数定义,Boost.Python对此也有支持。(展示代码)

下面我们再看一个C++类型的封装代码:

Wrapper.cpp

///////////////////////////////////////////////////////////

//MultiBoolean类的Python封装,使用boost::python技术

//作者:刘鑫

///////////////////////////////////////////////////////////

 

//引用boost库

#include <boost/python.hpp>

//引用多值逻辑定义

#include "MultiBoolean.h"

//引用与或运算的Python封装接口

#include "pyMultiBoolean.h"

 

//引用相关的命名空间

 

using namespace boost::python;

 

using namespace MarchLibrary;

 

//模块定义

BOOST_PYTHON_MODULE(MarchLibrary)

{

     //类封装,这里用no_init表示没有可用的构造函数

     class_<MultiBoolean>("MultiBoolean", no_init)

          //可选的逻辑值接口

         .def_readonly("True", &MultiBoolean::True)

         .def_readonly("False", &MultiBoolean::False)

         .def_readonly("Unknown", &MultiBoolean::Unknown)

         .def_readonly("Undefine", &MultiBoolean::Undefine)

         .def_readonly("Nil", &MultiBoolean::Nil)

 

         //兼容C++版定义的字符串处理接口

         .def("ToString", &MultiBoolean::ToString)

         .def("FullName", &MultiBoolean::FullName)

         .def("Parse", &MultiBoolean::Parse)

 

         //逻辑值判定

         .def("IsTrue", &MultiBoolean::IsTrue)

         .def("IsFalse", &MultiBoolean::IsFalse)

         .def("IsUnknown", &MultiBoolean::IsUnknown)

         .def("IsUndefine", &MultiBoolean::IsUndefine)

         .def("IsNil", &MultiBoolean::IsNil)

 

         //运算符重载接口

         .def(!self)

         .def(self &= self)

         .def(self &= bool())

         .def(self |= self)

         .def(self |= bool())

         .def(self ^= self)

         .def(self ^= bool())

         .def(self == self)

         .def(self == bool())

         .def(bool() == self)

         .def(self != self)

         .def(self != bool())

         .def(bool() != self)

         .def(self & self)

         .def(self & bool())

         .def(bool() & self)

         .def(self | self)

         .def(self | bool())

          .def(bool() | self)

         .def(self ^ self)

         .def(self ^ bool())

         .def(bool() ^ self)

 

         //提供给Python解释器的标准字符串输出接口

         .def("__str__", &MultiBoolean::ToString)

         .def("__repr__", &MultiBoolean::FullName)

     ;

}

MultiBoolean本身是一个多值逻辑类型,它的实现比较长,就不在这里放出了。(直接在IDE展示)这里主要给大家演示下class封装的基本功能,包括方法、属性和运算符重载。

下面我们讨论下继承的封装。我们知道C语言没有虚函数的概念,而Python的方法默认都是虚方法。为了实现这一功能,Python API中运用了一些复杂的方法。在Boost中,这个过程被尽可能的封装起来,向自然的C++代码靠拢。

VirtualTest.h

#include <boost/python.hpp>

 

using namespace boost::python;

 

//Override

struct Base

{

     virtual ~Base(){};

     virtual char const* Hello()

     {

         return "Hello. I'm Base.";

     };

};

 

 

struct Derived : Base

{

     char const* Hello()

     {

         return "Hello. I'm Derived.";

     };

};

 

struct BaseWrapper : Base, wrapper<Base>

{

     char const* Hello()

    {

         if (override Hello = this->get_override("Hello"))

#if BOOST_WORKAROUND(BOOST_MSVC, <= 1300) // Workaround for vc6/vc7

              return call<char *>(Hello.ptr());

#else

            return Hello();

#endif

        return Base::Hello();

    }

 

     char const* default_Hello() { return this->Base::Hello(); }

};

 

Wrapper.cpp

#include <boost/python.hpp>

#include "ClassTest.h"

#include "VirtualTest.h"

#include <string>

 

using namespace boost::python;

 

BOOST_PYTHON_MODULE(ClassTest)

{

     class_<Foo>("Foo")

         .def("Add", &Foo::Add)

          .def("Sub", &Foo::Sub)

         .def("Concat", &Foo::Concat)

     ;

 

     class_<ConFoo>("ConFoo")

         .def(init<char *>())

         .def("GetValue", &ConFoo::GetValue)

         .def("SetValue", &ConFoo::SetValue)

     ;

 

     class_<BaseWrapper, boost::noncopyable>("Base")

         .def("Hello", &Base::Hello, &BaseWrapper::default_Hello)

     ;

 

     class_<Derived>("Derived")

         .def("Hello", &Derived::Hello)

     ;

}

 

 

这里我们要关注的是用于虚函数定义的辅助类BaseWrapper,以及BOOST_PYTHON_MODULE内部的封装代码。

以上两个示例也展示了构造函数的封装方法,包括禁用构造函数的用法。

嵌入Python解释器

       最简单的Boost嵌入与Python C API并无任何不同,例如以下的代码:

#include "boost/python.hpp"

 

int main(int argc, char *argv[])

{

     Py_Initialize();

 

     FILE * fp = fopen("test.py", "r");

 

     if (fp == NULL) {

         return 1;

     }

 

     PyRun_SimpleFile(fp, "test.py");

 

    Py_Finalize();

 

 

    return 0;

}

       从以上可以看出,Boost沿用了C API的嵌入流程。但是,Boost在具体的虚拟机功能调用方面提供了完备的封装,以下这个示例展示了模块和对象引用,以及类型转换方面的使用。

#include <boost/python.hpp>

 

using namespace boost::python;

 

int main()

{

     Py_Initialize();

 

     object main_module((

         handle<>(borrowed(PyImport_AddModule("__main__")))));

 

     object main_namespace = main_module.attr("__dict__");

 

     handle<> ignored((PyRun_String(

 

         "hello = file('hello.txt', 'w')/n"

         "hello.write('Hello world!')/n"

         "hello.close()"

 

         , Py_file_input

         , main_namespace.ptr()

         , main_namespace.ptr())

     ));

 

     Py_Finalize();

}

 

对于其他功能,例如方法调用、成员访问等,Boost也提供了相应的功能。下面我们看一下Boost文档中的示例。(展示文档)

综合技术——扩展式嵌入

和C API一样,在掌握了扩展和嵌入代码后,扩展式嵌入技术就成为一件水到渠成的事,下面这个简单的示例,利用前面提到的MultiBoolean,演示了最简单的扩展式嵌入。

#include <iostream>

#include <cstdlib>

#include <string>

#include <boost/python.hpp>

 

#include "main.h"

 

using namespace boost::python;

 

 

int main()

{

     std::string dictstr;

     Py_Initialize();

     try

     {

         initMarchLibrary();

 

         object main_module((

              handle<>(borrowed(PyImport_AddModule("__main__")))));

 

         object main_namespace = main_module.attr("__dict__");

 

         PyRun_SimpleString("import MarchLibrary");

         object result(( handle<>(

                   PyRun_String(

                            "str(dir(MarchLibrary))",

                            Py_eval_input,

                            main_namespace.ptr(),

                            main_namespace.ptr()))

              ));

 

         dictstr = extract<char *>(result);

         std::cout<<dictstr<<std::endl;

     }

     catch(error_already_set)

     {

         PyErr_Print();

     }

 

     std::system("Pause");

     Py_Finalize();

     return 0;

}

 

注意引入MarchLibrary库的init函数,它于C API中使用的相同。程序运行时,我们可以看到dir函数打印出了该模块的内部成员,如同它是一个标准的Python内置模块。

posted @ 2015-01-31 00:45  廖先生  阅读(3600)  评论(0编辑  收藏  举报