摘要:
尽管虚拟机装了CENTOS,但是总觉得要加一堆包不方便;但是今天遇到了问题。R想编辑CUDA的话,目前只能在Linux上,因为gputools目前只有tar.gz格式的。也就是说发布者用的Linux上的编译器,在windows上无法执行。 阅读全文
摘要:
最近因为极度忙,没有写总结。今天补一下总结。 今天完成关静最后给的大project这个作业来说,结合自己的研究方向是个让我纠结一周多的事。好在找到了对应的研究内容。 R的书目前还是很多的。R我一开始觉得比较好用,甚至还有RStudio以及可视化效果。但是最后这个作业居然有个包下载后居然提示要3.0之 阅读全文
摘要:
在新的环境上用CUTIL的时候,出现了问题。无法解析的外部符号__imp_cutCheckCmdLineFlag问题描述: kernel.cu.obj : error LNK2019: 无法解析的外部符号__imp__cutCheckCmdLineFlag@12,该符号在函数 _main 中被引用... 阅读全文
摘要:
这几天配置了新环境,而且流量不够了就没写。看到CSDN一个人写了些机器学习的笔记,于是引用一下http://blog.csdn.net/yc461515457/article/details/50498266http://geek.csdn.net/news/detail/50567http://w... 阅读全文
摘要:
CUDA提供了一种cudaEvent_t的类型,这种类型Event可以统计GPU上面某一个任务或者代码段的精确运行时间使用常量内存的光线跟踪器的性能比使用全局内存的性能提升了50%__constant__将把变量的访问限制为只读。在接受了这种限制后,可节约内存带宽的原因:(下面是贴了书上的内容)对常... 阅读全文
摘要:
CUDA编程实战书中的乘方和解决办法:对一个数组执行某种计算,然后产生一个更小的结果数组。由一个线程在共享内存上进行迭代并计算出总和值。而如果用并行,所花时间就与数组长度的对数成正比。代码的思想是,每个线程将cache[]中的两个值加和,然后结果保存回cache[]。由于每个线程都将两个值合并为一个... 阅读全文
摘要:
下午仔细研究了两个程序,然后搜了一下解决方法http://blog.sina.com.cn/s/blog_6de28fbd01011cru.htmlhttp://blog.csdn.net/chevroletss/article/details/48130953http://www.cnblogs.... 阅读全文
摘要:
找了不知道多少教程,终于找到靠谱的nsight的:http://blog.csdn.net/mysniper11/article/details/8003644还有两个视频的相关:http://blog.csdn.net/endlch/article/details/44538579同一个warp内... 阅读全文
摘要:
今天真正进入了攻坚期。不光是疲劳,主要是遇到的问题指数级上升,都是需要绕道的。以visual profile来说,刚刚发现自己还没使用过。http://bbs.csdn.net/topics/390901383CUDA从入门到精通(十):性能剖析和Visual Profilerhttp://m.bl... 阅读全文