Python调用C加速计算

python遇到计算性能瓶颈尽量使用Numpy,因为Numpy会调用C的并行计算库,如果numpy不能实现你的需求,就只好自己写C代码了。

用C实现数组的按位相乘(当然这个功能用numpy就可以实现,这里只是个示例):

#include<stdlib.h>
#include<omp.h>

void dot(const float *arr, const float *brr, float *crr, int n){
    int i;
    #pragma omp parallel for num_threads(8)//显式指定线程数
    for (i=0;i<n;i++){//如果n比较小(比如数百),则用openmp的效果不明显
        crr[i]=arr[i]*brr[i];
    }
    return;
}

值得一提的是,对于计算密集型任务,即使不用OpenMP,C语言的速度也比Python快一个数量级。

生成动态库:

//-fPIC:是指生成的动态库与位置无关

//-fopenmp:启用openmp多线程

gcc -O -c -fPIC -fopenmp -o dot.o dot.c

gcc -shared -fopenmp -o libdot.so dot.o

用python调用C动态库:

# coding:utf-8

from ctypes import *
import numpy as np
import numpy.ctypeslib as npct

lib = cdll.LoadLibrary("./libdot.so")  # 注意是相对于执行python命令时的路径

'''申明dot函数的传入参数类型:ndpointer为numpy.ctypeslib扩展库中提供的函数,可将numpy数组转为指针形式被C函数识别, 其中ndim表示数组维数。
'''
lib.dot.argtypes = [
    npct.ndpointer(dtype=np.float32, ndim=1),
    npct.ndpointer(dtype=np.float32, ndim=1),
    npct.ndpointer(dtype=np.float32, ndim=1),
    c_int
]


def dot(arr, brr):
    crr = np.zeros(shape=arr.shape, dtype=np.float32)
    lib.dot(arr, brr, crr, len(arr))
    return crr


arr = np.array([1, 4, 8], dtype=np.float32)
brr = np.array([3, 5, 1], dtype=np.float32)
print dot(arr, brr)  # [ 3. 20.  8.]

 

posted @ 2019-08-18 15:11  高性能golang  阅读(1351)  评论(0编辑  收藏  举报