爨爨爨好

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年12月11日

摘要: ▶ 数学函数 ● 舍入函数,考虑被舍入参数有双精度浮点和单精度浮点,舍入方式有区别,舍入结果有整形、长整形和长长整形,所以共有以下舍入函数。 ● 推荐单精度浮点使用函数 rint() 系列(单指令计算),而不用函数 round() 系列(8 指令计算)。其他几个用于单精度浮点的舍入函数也是单指令计算 阅读全文
posted @ 2017-12-11 00:32 爨爨爨好 阅读(446) 评论(0) 推荐(0) 编辑

摘要: ▶ 协作组,要求 cuda ≥ 9.0,一个简单的例子见 http://www.cnblogs.com/cuancuancuanhao/p/7881093.html ● 灵活调节需要进行通讯的线程组合(不一定是线程块或是线程束)的尺寸,在更多粒度上进行线程协作。 ● 协作组功能支持 CUDA 的各种 阅读全文
posted @ 2017-12-11 00:24 爨爨爨好 阅读(966) 评论(0) 推荐(0) 编辑