分别输入wyi和wye即可~ Read More
我的免费软件产品 Read More
对于Ubuntu或其近亲(Lubuntu、Kubuntu、Mint等)编写OpenCL程序也不会太难。由于本例用的是AMD APP SDK,因此需要AMD的GPU以及相关驱动。首先,去AMD官网下载GPU驱动——AMD Catalyst。如果你用的是APU并且还有一块独立显卡的话,通过AMD Catalyst Control Center可以选择使用哪个GPU。像我现在用的联想Z475笔记本,搭载了AMD APU A6-3420M以及一块AMD Radeon HD 7400M,但是相比较而言,还是APU自带的6620G的GPU性能更強一些,因此我这边设置的是采用AMD Radeon HD 6620G。 Read More
一天,营长在全营会上讲话说:“不想到将军的士兵不是好士兵”,那么营长讲这句话的意思是:
A:想当将军的士兵一定是好士兵 B: 除非想当将军,否则不是个好士兵
C:坏士兵是不想当将军的 D:坏士兵也是想当将军的
E:不想当将军的士兵,也可以是一个好士兵 Read More
C11标准中,一个非常重大的特性更新就是增加了Generic Selection这个特性。这个特性能使得C11支持轻量级的泛型编程,使得可以把一组具有不同类型而却有相同功能的函数抽象为一个接口。
对于_Generic的使用可参见俺这篇博文——http://www.cnblogs.com/zenny-chen/archive/2012/09/20/2695381.html Read More
OS X的执行程序一般分为两种。一种是控制台程序,一种是带有GUI的OS X应用程序。
控制台程序往往就一个文件构成executable,而GUI应用通常是一个包(即文件夹),里面除了executable之外还有其它资源。 Read More
由于OpenCL是为各类处理器设备而打造的开发标准的计算语言。因此跟CUDA不太一样的是,其对设备特征查询的项更上层,而没有提供一些更为底层的特征查询。比如,你用OpenCL的设备查询API只能获取最大work group size,但无法获取到最小线程并行粒度。 Read More
在多线程应用中的资源优化依赖于处理器拓扑层级内相关联的Cache拓扑以及执行资源。在第7章中讨论了处理器拓扑以及标识处理器拓扑的一种软件算法。
在带有共享总线的平台中,总线系统被在SMT层以及在处理器拓扑的处理器核心层的多个代理所共享。因而多线程应用程序设计应该起始于管理对多个处理器代理可用的总线带宽的方法,这些处理器代理以一种合理的方式共享同一个总线连接。这可以通过提升独立应用程序线程的数据位置性或允许两个线程利用一个共享的L2 Cache(在这样的共享Cache中是可用的)来达成。 Read More
自从Apple从08年正式将自己的OpenCL提交到Khronos Group开放标准组织后,先后获得AMD、nVidia、Intel等大公司的支持。OpenCL能充分发挥GPU数据密集型大规模计算的能力,从而使得很多多媒体应用乃至科学计算能获得大幅度的性能提升。
这里将主要介绍如何在Windows 7中使用AMD APP SDK中的OpenCL。 Read More
Visual C++中使用内联纯汇编及其它 Read More