摘要: 这篇文档主要是介绍了关于在Adreno GPUs上优化OpenCL代码的详细方法。文档中提供的大量信息能够帮助开发者理解OpenCL基础和Adreno结构,还有最重要的,掌握OpenCL优化技能。 OpenCL优化经常是具有挑战性的而且需要大量的尝试和试错。因为每个供应商对同一个任务可能都有他自己的 阅读全文
posted @ 2019-07-02 15:07 xiajingwang 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 在这一章中,将会用一些例子来展示如何使用之前章节中讨论的技术来进行优化。除了一些小的简单代码片段的展示外,还有两个熟知的图像滤波处理,Epsilon滤波和Sobel滤波,将会使用之前章节中讨论的方法进行一步一步地优化。 9.1 应用程序的代码样本 9.1.1 提升算法 这个例子说明了如何简化代码来提 阅读全文
posted @ 2019-07-02 15:06 xiajingwang 阅读(923) 评论(0) 推荐(0) 编辑
摘要: 这章将会说明一些kernel优化的小技巧。 8.1 kernel合并或者拆分 一个复杂的应用程序可能包含很多步骤。对于OpenCL的移植性和优化,可能会问需要开发有多少个kernel。这个问题很难回答,因为这涉及到很多的因素。下面是一些准则: 内存和计算之间的平衡。 足够多的wave来隐藏延迟。 没 阅读全文
posted @ 2019-07-02 14:48 xiajingwang 阅读(1564) 评论(0) 推荐(0) 编辑
摘要: 内存优化是最重要也是最有效的OpenCL性能优化技术。大量的应用程序是内存限制而不是计算限制。所以,掌握内存优化的方法是OpenCL优化的基础。在这章中,将会回顾OpenCL的内存模型,然后是最优的实践方法。 7.1 在Adreno GPU中的OpenCL内存模型 OpenCL定义了四种内存类型—— 阅读全文
posted @ 2019-07-02 14:43 xiajingwang 阅读(1090) 评论(0) 推荐(0) 编辑