随笔分类 -  高性能计算

摘要:最近试试深度学习能做点什么事情。MXNet是一个与Tensorflow类似的开源深度学习框架,在GPU显存利用率上效率高,比起Tensorflow显著节约显存,并且天生支持分布式深度学习,单机多卡、多机多卡支持丰富,拥有着良好的技术架构。目前是亚马逊AWS的官方深度学习框架。由于其团队以MXNet产 阅读全文
posted @ 2017-03-14 20:19 蓝鲸王子 阅读(3365) 评论(0) 推荐(0) 编辑
摘要:这个月6号开始,着手解决一个具有实际意义的计算任务。任务数据有9879896条,每条包含30个整数,任务是计算每两条数据之间的斯皮尔相关系数及其P值。原始数据只有500+MB,因此我并不认为这是个多么大的计算任务。随后稍加计算,我还是很惊呆的,要计算(9879896×9879895)÷2≈4.88亿 阅读全文
posted @ 2017-02-16 10:12 蓝鲸王子 阅读(9324) 评论(4) 推荐(3) 编辑
摘要:今天测试在核函数在GTX 950M上运行的情况,核函数中的pow竟然出不来结果。。。在网上查了一圈,说是要改成powf,结果确实就好了。 但是,奇怪的是,CUDA版本都是最新的8.0,之前在GT 720上、K80上运行的情况是pow函数都可以,到笔记本上就得换成powf(powf是CUDA的内置函数 阅读全文
posted @ 2017-02-14 15:56 蓝鲸王子 阅读(3028) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示