摘要: SWIG的python接口使用demo 主要准备三个文件,example.h, example.i, example.c, example.i, %module example %{ #include "example.h" %} %include "example.h" //exampe.h in 阅读全文
posted @ 2024-11-10 00:19 zwlwf 阅读(2) 评论(0) 推荐(0) 编辑
摘要: #include <stdio.h> #include <cuda_runtime.h> // 128 x 128 -> __global__ void mm(float* a, float* b, float* c) { // 8 x 8个方块,每个方块16x16 extern __shared_ 阅读全文
posted @ 2024-10-20 20:09 zwlwf 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 编译x86的kernel export ARCH=x86_64 export CROSS_COMPILE=x86_64-linux-gnu- make defconfig make -j32 中间出现了libelf.h找不到, sudo apt-get install libelf-dev bc解决 阅读全文
posted @ 2024-10-13 23:20 zwlwf 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 下面的cuda代码为什么指定compute capability = 8.0 后在A100上跑结果不对? nvcc a.cu # 正确 nvcc a.cu -gencode arch=compute_80,code=sm_80 # 结果不正确 // a.cu #include <cuda_runti 阅读全文
posted @ 2024-09-20 22:12 zwlwf 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 这个问题一般都是pip install 下载的源不在国内,可以参考 https://zhuanlan.zhihu.com/p/129866307 指定清华源,让下载速度飞起来, pip install -r requirements.txt -i https://pypi.tuna.tsinghua 阅读全文
posted @ 2024-08-26 08:10 zwlwf 阅读(6) 评论(0) 推荐(0) 编辑
摘要: register_hook 参考资料: [Pytorch] Tensor底层机制 https://blog.csdn.net/smartcat2010/article/details/118882020 cudaLauchKernel传入参数的一个提问 https://cloud.tencent.c 阅读全文
posted @ 2024-08-26 08:06 zwlwf 阅读(10) 评论(0) 推荐(0) 编辑
摘要: LD_LIBRARY_PATH地址设置.非root用户 . ${HOME}/Ascend/ascend-toolkit/set_env.sh #若开发套件包Ascend-cann-toolkit在非昇腾设备上安装,则如下环境变量必须执行,用于设置动态链接库所在路径,否则无需执行 export LD_ 阅读全文
posted @ 2024-08-15 08:07 zwlwf 阅读(11) 评论(0) 推荐(0) 编辑
摘要: torch中的矩阵乘法 torch.matmul应该是打包的函数,/home/zwl/software/pytorch/torch/csrc/autograd/generated/python_torch_functions_0.cpp:4865 static PyObject * THPVaria 阅读全文
posted @ 2024-07-29 00:10 zwlwf 阅读(16) 评论(0) 推荐(0) 编辑
摘要: set -g mode-keys vi set -g mouse on # Use v to trigger selection bind-key -T copy-mode-vi v send-keys -X begin-selection # Use y to yank current selec 阅读全文
posted @ 2024-07-17 08:25 zwlwf 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 安装cuda-toolkit, 在没有gpu的情况下,不能安装其中的cuda driver, 不勾选,装cuda toolkit即可。 安装gpgpu-sim程序。gpgpu的仿真程序,目前仅仅支持cuda11。而cuda11最高支持的ubuntu为20.0。但在22.0的ubuntu上下载cuda 阅读全文
posted @ 2024-07-14 22:24 zwlwf 阅读(67) 评论(0) 推荐(0) 编辑