上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页
摘要: GPU的内核编程有时候让人十分头疼,尤其是调试的时候,因为用cuda语言编写GPU程序的时候它,没有友好的调试环境,断点调试根本无济于事,想要实现断点调试需要,两颗Nvida 公司的显卡,对于个人PC来说,很难实现。现在ArrayFire公司开源了一些库函数来辅助我们实现GPU编程。 ArrayFi 阅读全文
posted @ 2020-07-12 04:37 flyingswallow 阅读(880) 评论(0) 推荐(0) 编辑
摘要: 最近在学习Thrust库的时候,我发现Thrust可以自定义函数,所以笔者就想自己实现一个功能 通过自己写一个例程来加深对thrust的掌握。在向量的运算中我们会碰见各种范数,我打算以无穷 范数为例,实现这个功能。向量的无穷范数定义为:找出向量中绝对值最大的元素。 代码如下: #include "c 阅读全文
posted @ 2020-07-12 03:58 flyingswallow 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 内存寻址在汇编中非常重要,主要有一下几种: 1.基于寄存器寻址: 2.基于寄存器+偏置 3.基于寄存器+索引寄存器; 4.基于寄存器+scale*索引寄存器; 代码: #include <stdio.h> #include <tchar.h> extern "C" int NumFibVals_; 阅读全文
posted @ 2020-06-27 04:12 flyingswallow 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 在C/C++编程中,我们经常会用到局部变量,笔者想知道在汇编语言中是 如何使用局部变量的,根据《X86汇编语言》中的例子,才弄懂了汇编是如何 分配局部变量。用栈指针减去一个值(需要分配的内存大小)。 代码: #include <stdio.h> #include <tchar.h> extern " 阅读全文
posted @ 2020-06-27 02:53 flyingswallow 阅读(374) 评论(0) 推荐(0) 编辑
摘要: 最近想优化一下代码的运行速度,笔者就想着汇编的效率比较高,所以就看网上的一些书籍, 练习了一下汇编,乘除法的指令imul和idiv。 代码: #include <stdio.h> #include <tchar.h> extern "C" int IntegerMulDive_(int a, int 阅读全文
posted @ 2020-06-26 10:56 flyingswallow 阅读(492) 评论(0) 推荐(0) 编辑
摘要: CUDA List 实现: 尽管Thrust没有提供像C++中的List容器,但是Thrust却和C++兼容。 代码: #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #includ 阅读全文
posted @ 2020-06-24 10:54 flyingswallow 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 1.野指针: 前两篇博文定义的向量都是在device_vector和host_vector向量空间,如果我们定义一个 像int* raw_ptr的野指针,怎样实现数据间的传递呢?Thrust提供给我们一些函数帮助我们解决 这样的问题。thrust::raw_pointer_cast和thrust:: 阅读全文
posted @ 2020-06-24 10:30 flyingswallow 阅读(1017) 评论(0) 推荐(0) 编辑
摘要: 1.元素初始化: 通常初始都会用具体的值和向量,但是Thrust 提供了一些其他的初始化方法。 2.代码: #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include <thr 阅读全文
posted @ 2020-06-24 09:54 flyingswallow 阅读(357) 评论(0) 推荐(0) 编辑
摘要: 1.Thrust library : Thrust library 和C++中的STL 十分类似,如果学过和了解STL学起来应该会感觉轻松一些。 2. 学习的初衷: 笔者很多的项目都是和CUDA GPU 相关的,刚开始的时候笔者都是自己写CUDA kernels, 然而,有些东西完全可以站在巨人的肩 阅读全文
posted @ 2020-06-24 09:31 flyingswallow 阅读(428) 评论(0) 推荐(0) 编辑
摘要: windows下numpy的安装: 1.按“win”+R 打开DOS界面; 2.在DOS界面下输入指令:pip install numpy; 3.如果提示PermissionError: [WinError 5] 拒绝访问。则需要以管理员方式运行DOS界面; 4.在管理员模式下再次进入DOS界面,这 阅读全文
posted @ 2020-05-21 10:11 flyingswallow 阅读(351) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页