CUDA笔记(七)
今天集中时间找程序的问题。于是发现:
首先,程序里的kernel想要调试,必须用nsight。
于是一堆找。http://www.nvidia.com/object/nsight.html
http://blog.chinaunix.net/uid-20620288-id-4808400.html
貌似Nsight需要双机调试?晕中。
不过这篇文章提了,在需要监视的核函数里面打断点
http://wenku.baidu.com/link?url=eFI-HX4IaSurijpp_UcU_pLNHhvRaDHVcKkT0eN4zTwAbcJBNAODON69hVbmJKTtmGvVir4eWBgdE4ok09bndOmdwKMNFDjVgXNwPxeQz8_
吃晚饭前遇到一个大问题:nsight只能进入kernel一次。
目前只是绕过这个问题。
****
目前的问题是,我算法看懂了,但是不知道怎么实现。于是翻了一下魏老师给我曾经发的邮件,这才发现原来自己完全还没有深入到对CUDA的研究。仅仅写程序只是一小部分任务。
用gpgpu-sim去评估运行一个应用需要的时钟周期数。http://www.cnblogs.com/LitLeo/p/3521833.html
http://blog.sciencenet.cn/blog-1067211-726653.html
http://blog.sina.com.cn/s/blog_69e4088d0102v8gb.html
特别是在linux环境下安装的时候,居然还需要git
己所不欲勿施于人;练兵先练将