随笔分类 - 高性能计算

使用MXNet远程编写卷积神经网络用于多标签分类

摘要：最近试试深度学习能做点什么事情。MXNet是一个与Tensorflow类似的开源深度学习框架，在GPU显存利用率上效率高，比起Tensorflow显著节约显存，并且天生支持分布式深度学习，单机多卡、多机多卡支持丰富，拥有着良好的技术架构。目前是亚马逊AWS的官方深度学习框架。由于其团队以MXNet产阅读全文

posted @ 2017-03-14 20:19 蓝鲸王子阅读(3365) 评论(0) 推荐(0) 编辑

记一次CUDA编程任务

摘要：这个月6号开始，着手解决一个具有实际意义的计算任务。任务数据有9879896条，每条包含30个整数，任务是计算每两条数据之间的斯皮尔相关系数及其P值。原始数据只有500+MB，因此我并不认为这是个多么大的计算任务。随后稍加计算，我还是很惊呆的，要计算(9879896×9879895)÷2≈4.88亿阅读全文

posted @ 2017-02-16 10:12 蓝鲸王子阅读(9324) 评论(4) 推荐(3) 编辑

CUDA核函数调用基础数学API的一个奇葩情况

摘要：今天测试在核函数在GTX 950M上运行的情况，核函数中的pow竟然出不来结果。。。在网上查了一圈，说是要改成powf，结果确实就好了。但是，奇怪的是，CUDA版本都是最新的8.0，之前在GT 720上、K80上运行的情况是pow函数都可以，到笔记本上就得换成powf（powf是CUDA的内置函数阅读全文

posted @ 2017-02-14 15:56 蓝鲸王子阅读(3028) 评论(1) 推荐(0) 编辑

公告

昵称：蓝鲸王子
园龄： 8年6个月
粉丝： 118
关注： 5

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类 (105)

随笔档案 (95)

相册 (2)

壁纸(2)

随笔分类 - 高性能计算

公告

搜索

积分与排名

随笔分类 (105)

随笔档案 (95)

相册 (2)

阅读排行榜

评论排行榜

推荐排行榜

最新评论