Python调用C加速计算
python遇到计算性能瓶颈尽量使用Numpy,因为Numpy会调用C的并行计算库,如果numpy不能实现你的需求,就只好自己写C代码了。
用C实现数组的按位相乘(当然这个功能用numpy就可以实现,这里只是个示例):
#include<stdlib.h> #include<omp.h> void dot(const float *arr, const float *brr, float *crr, int n){ int i; #pragma omp parallel for num_threads(8)//显式指定线程数 for (i=0;i<n;i++){//如果n比较小(比如数百),则用openmp的效果不明显 crr[i]=arr[i]*brr[i]; } return; }
值得一提的是,对于计算密集型任务,即使不用OpenMP,C语言的速度也比Python快一个数量级。
生成动态库:
//-fPIC:是指生成的动态库与位置无关 //-fopenmp:启用openmp多线程 gcc -O -c -fPIC -fopenmp -o dot.o dot.c gcc -shared -fopenmp -o libdot.so dot.o
用python调用C动态库:
# coding:utf-8 from ctypes import * import numpy as np import numpy.ctypeslib as npct lib = cdll.LoadLibrary("./libdot.so") # 注意是相对于执行python命令时的路径 '''申明dot函数的传入参数类型:ndpointer为numpy.ctypeslib扩展库中提供的函数,可将numpy数组转为指针形式被C函数识别, 其中ndim表示数组维数。 ''' lib.dot.argtypes = [ npct.ndpointer(dtype=np.float32, ndim=1), npct.ndpointer(dtype=np.float32, ndim=1), npct.ndpointer(dtype=np.float32, ndim=1), c_int ] def dot(arr, brr): crr = np.zeros(shape=arr.shape, dtype=np.float32) lib.dot(arr, brr, crr, len(arr)) return crr arr = np.array([1, 4, 8], dtype=np.float32) brr = np.array([3, 5, 1], dtype=np.float32) print dot(arr, brr) # [ 3. 20. 8.]
本文来自博客园,作者:高性能golang,转载请注明原文链接:https://www.cnblogs.com/zhangchaoyang/articles/11372494.html