摘要: 对于许多kernels来说,工作组大小的调整会是一种简单有效的方法。这章将会介绍基于工作组大小的基础知识,比如如何获取工作组大小,为什么工作组大小非常重要,同时也会讨论关于最优工作组大小的选择和调整的一般方法。 6.1 获取最大的工作组尺寸 在运行完clBuildProgram后,使用下面的API函 阅读全文
posted @ 2019-06-21 10:11 xiajingwang 阅读(582) 评论(0) 推荐(0) 编辑
摘要: 这章提供了一个OpenCL应用程序优化的总体概述。更多的细节将会在接下来的章节中找到。 注意:OpenCL程序的优化是具有挑战性的。相比初始的程序开发工作,经常需要做更多的工作。 5.1 性能移植性 就像在2.4.2节中讨论的那样,在不同的架构之间,OpenCL一般都没有很好的性能移植性。针对某一个 阅读全文
posted @ 2019-06-21 10:01 xiajingwang 阅读(658) 评论(0) 推荐(0) 编辑
摘要: 这章将简要讨论一些开发Adreno OpenCL应用程序的基本要求,下面将会介绍如何调试和统计程序性能。 4.1 安卓平台上开发OpenCL程序 目前,Adreno GPU主要是在安卓操作系统和在部分Linux系统上支持OpenCL。为了开发带OpenCL的安卓app,开发者必须熟悉android软 阅读全文
posted @ 2019-06-21 09:56 xiajingwang 阅读(796) 评论(0) 推荐(0) 编辑