摘要: 1、命名 建议只包含字母和数字。 2、优化数据处理循环的策略 使用例如展开循环、设置work-group/计算unit以及work-item大小等方式优化kernel的数据处理效率。 (1)展开循环 如果没有loop-carried dependency且循环内容可以并行执行,则可unroll。 3 阅读全文
posted @ 2020-08-13 14:05 ZhuzhuDong 阅读(503) 评论(0) 推荐(0) 编辑