python遇到计算性能瓶颈尽量使用Numpy,因为Numpy会调用C的并行计算库,如果numpy不能实现你的需求,就只好自己写C代码了。
用C实现数组的按位相乘(当然这个功能用numpy就可以实现,这里只是个示例):
#include<stdlib.h> #include<omp.h> void dot(const float *arr, const float *brr, float *crr, int n){ int i; #pragma omp parallel for num_threads(8)//显式指定线程数 for (i=0;i<n;i++){//如果n比较小(比如数百),则用openmp的效果不明显 crr[i]=arr[i]*brr[i]; } return; }
值得一提的是,对于计算密集型任务,即使不用OpenMP,C语言的速度也比Python快一个数量级。
生成动态库:
//-fPIC:是指生成的动态库与位置无关 //-fopenmp:启用openmp多线程 gcc -O -c -fPIC -fopenmp -o dot.o dot.c gcc -shared -fopenmp -o libdot.so dot.o
用python调用C动态库:
# coding:utf-8 from ctypes import * import numpy as np import numpy.ctypeslib as npct lib = cdll.LoadLibrary("./libdot.so") # 注意是相对于执行python命令时的路径 '''申明dot函数的传入参数类型:ndpointer为numpy.ctypeslib扩展库中提供的函数,可将numpy数组转为指针形式被C函数识别, 其中ndim表示数组维数。 ''' lib.dot.argtypes = [ npct.ndpointer(dtype=np.float32, ndim=1), npct.ndpointer(dtype=np.float32, ndim=1), npct.ndpointer(dtype=np.float32, ndim=1), c_int ] def dot(arr, brr): crr = np.zeros(shape=arr.shape, dtype=np.float32) lib.dot(arr, brr, crr, len(arr)) return crr arr = np.array([1, 4, 8], dtype=np.float32) brr = np.array([3, 5, 1], dtype=np.float32) print dot(arr, brr) # [ 3. 20. 8.]
本文来自博客园,作者:高性能golang,转载请注明原文链接:https://www.cnblogs.com/zhangchaoyang/articles/11372494.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 字符编码:从基础到乱码解决