摘要: 下面的cuda代码为什么指定compute capability = 8.0 后在A100上跑结果不对? nvcc a.cu # 正确 nvcc a.cu -gencode arch=compute_80,code=sm_80 # 结果不正确 // a.cu #include <cuda_runti 阅读全文
posted @ 2024-09-20 22:12 zwlwf 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 这个问题一般都是pip install 下载的源不在国内,可以参考 https://zhuanlan.zhihu.com/p/129866307 指定清华源,让下载速度飞起来, pip install -r requirements.txt -i https://pypi.tuna.tsinghua 阅读全文
posted @ 2024-08-26 08:10 zwlwf 阅读(14) 评论(0) 推荐(0) 编辑
摘要: register_hook 参考资料: [Pytorch] Tensor底层机制 https://blog.csdn.net/smartcat2010/article/details/118882020 cudaLauchKernel传入参数的一个提问 https://cloud.tencent.c 阅读全文
posted @ 2024-08-26 08:06 zwlwf 阅读(21) 评论(0) 推荐(0) 编辑
摘要: LD_LIBRARY_PATH地址设置.非root用户 . ${HOME}/Ascend/ascend-toolkit/set_env.sh #若开发套件包Ascend-cann-toolkit在非昇腾设备上安装,则如下环境变量必须执行,用于设置动态链接库所在路径,否则无需执行 export LD_ 阅读全文
posted @ 2024-08-15 08:07 zwlwf 阅读(17) 评论(0) 推荐(0) 编辑
摘要: torch中的矩阵乘法 torch.matmul应该是打包的函数,/home/zwl/software/pytorch/torch/csrc/autograd/generated/python_torch_functions_0.cpp:4865 static PyObject * THPVaria 阅读全文
posted @ 2024-07-29 00:10 zwlwf 阅读(17) 评论(0) 推荐(0) 编辑
摘要: set -g mode-keys vi set -g mouse on # Use v to trigger selection bind-key -T copy-mode-vi v send-keys -X begin-selection # Use y to yank current selec 阅读全文
posted @ 2024-07-17 08:25 zwlwf 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 安装cuda-toolkit, 在没有gpu的情况下,不能安装其中的cuda driver, 不勾选,装cuda toolkit即可。 安装gpgpu-sim程序。gpgpu的仿真程序,目前仅仅支持cuda11。而cuda11最高支持的ubuntu为20.0。但在22.0的ubuntu上下载cuda 阅读全文
posted @ 2024-07-14 22:24 zwlwf 阅读(169) 评论(0) 推荐(0) 编辑
摘要: pytorch训练中的一些优化手段 https://blog.csdn.net/deephub/article/details/139622843 pytorch中python和底层C++ tensor对象关系 https://pytorch.org/cppdocs/notes/tensor_bas 阅读全文
posted @ 2024-07-02 23:53 zwlwf 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 主要参考 https://wiki.qemu.org/Documentation/Networking qemu网络分为后端和前端。 backends是在qemu里设置,如下面的-netdev user, 指定了user类型的backends, 并且讲本地的5555端口和guest上22绑定,如此可 阅读全文
posted @ 2024-06-28 08:20 zwlwf 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 算子工程中sim和cpu模式都运行在cpu上,两者有什么区别? 猜测sim的等效是在npu指令层面,cpu的等效仅仅在AsecendC的层面? 表现在sim可以完全等效得跑cce代码算子,而cpu只能跑AscendC的算子。 当cce代码保存为.cpp后缀的文件,采用ccec编译,需要指定-x cc 阅读全文
posted @ 2024-06-23 23:41 zwlwf 阅读(172) 评论(0) 推荐(0) 编辑