摘要:
首先到QT网站上下载qt安装文件Qt_SDK_Win_offline_v1_1_3_en.exe(1.4G)安装我的目录是C:\ProgramData\Qt然后下载一个qt-win-opensource-4.7.4-mingw(300M左右)assistant.exe(我在ubuntu上用惯了,其实qtcreate里面也有这东西,不过没有这个来的爽快...)安装目录C:\ProgramData\Qt\然后我又下载了一个mingw(到sourceforge上下载安装目录C:\ProgramData\Qt\mingw\mingw 这个也许不要,不过安装都已经安装了,不知道是不是必要的.....)这 阅读全文
摘要:
http://blog.csdn.net/smsmn/article/details/6336060其实这两天一直不知道什么叫bank conflict冲突,这两天因为要看那个矩阵转置优化的问题,里面有讲到这些问题,但是没办法,为了要看懂那个bank conflict冲突,我不得不去找资料,说句实话我现在不是完全弄明白,但是应该说有点眉目了,现在我就把网上找的整理一下,放在这边,等哪天完全弄明白了我就在修改里面的错误。 Tesla 的每个 SM 拥有 16KB 共享存储器,用于同一个线程块内的线程间通信。为了使一个 half-warp 内的线程能够在一个内核周期中并行访问,共享存储器被组织成 阅读全文
摘要:
http://www.cocoachina.com/bbs/read.php?tid-31196.htmlOpenCL是由Apple公司起草设计的用于大规模并行计算的计算编程语言,并于2008年6月提交给KHRONOS开放标准组织,并在当年的12月由该组织release了第一版。OpenCL即:Open Computing Language下面将简单地为大家介绍OpenCL的特征以及一些基本概念和术语。OpenCL的设计要求:一、使用系统中所有计算资源:1、将CPU、GPU以及其它处理器进行统一编程2、同时支持数据以及任务并行计算模型二、基于高效C的并行编程模型:抽象了底层硬件的细节三、在嵌入 阅读全文
摘要:
http://www.cocoachina.com/bbs/read.php?tid-31352.html首先,感谢各位,感谢CocoaChina对OpenCL的关注。看到首页上一个大大的OpenCL图标,在下着实激动不已,呵呵。另外,再次感谢Apple能够搞出OpenCL来方便地利用GPU等加速处理器来解决高兴能计算领域的问题。在《概述》章节中,我把OpenCL中遇到的一些基本概念以提纲的形式罗列了出来,目的在于给各位以一个框架性的介绍,然后各位可以在网上搜索到相关的更具体的介绍。就目前对于Mac而言,要获悉,或者说要对OpenCL的工作机制有更清晰的认识,那么有必要先对GPU在高性能计算上 阅读全文
摘要:
这一讲我们将介绍更多的概念。 我们的示例程序是通过OpenCL来实现一个正方形的颜色渐变着色。 这里,我们将牵涉到变量存储属性,另外还引入了向量数据,向量数据是如何操作的,向量数据与标量数据是如何交叉操作的。 我先在首页贴上OpenCL的内核代码,然后附上完整的工程。// Render a square// left-top: red(1, 0, 0)// left-bottom: green(0, 1, 0)// right-top: blue(0, 0, 1)// right-bottom:black(0, 0, 0)__constant float4 left_top ... 阅读全文
摘要:
http://www.cocoachina.com/bbs/read.php?tid=33105&keyword=opencl以下代码就是本人针对之前的OpenCL教程,结合各位能掌握的程度列出的一个示例代码。这份代码由本人亲手炮制。 先贴代码,然后讲解。这里再附上完整的工程。这份代码,当然仍然只能在Snow Leopard下才能运行,因为Leopard上没有OpenCL驱动。/* * hello.c * OpenCL_init * * Created by Zenny Chen on 9/1/10. * Copyright 2010 GreenGames Studio. A... 阅读全文
摘要:
http://www.cocoachina.com/bbs/read.php?tid=37608我们前几章介绍了OpenCL的一些基本概念以及一些基本的用法。我们之前的例子都是线程独立计算的,相互之间没有任何通信。而这样的计算模型也是GPU最最喜欢的,能完全发挥GPU众核并行计算的优势。 今天我们将介绍OpenCL多线程同步技巧。我们下面的例子将是以一个简单的求和算法来描述如何同步一个工作组内的线程以及工作组之间如何同步。 我们之前介绍过变量的地址属性。用__global修饰的变量存放在显示存储器中,特点是容量很大,但访问速度很慢,并且所有工作项都能访问;而用__local修饰的变量存放在共享 阅读全文
摘要:
http://blog.csdn.net/zenny_chen/article/details/6159746在OpenCL中,用__local(或local)修饰的变量会被存放在一个计算单元(Compute Unit)的共享存储器区域中。对于nVidia的GPU,一个CU可以被映射为物理上的一块SM(Stream Multiprocessor);而对于AMD-ATi的GPU可以被映射为物理上的一块SIMD。不管是SM也好,SIMD也罢,它们都有一个在本计算单元中被所有线程(OpenCL中称为Work Item)所共享的共享存储器。因此,在一个计算单元内,可以通过local shared me 阅读全文
摘要:
多核编程学习笔记之同步(二)——采用Win32 线程API分布式 2010-04-10 00:25:15 阅读44 评论0 字号:大中小订阅I. 总结积累1.1 C/C++调用外部程序描述:运行指定的应用程序,这个函数是专用来兼容16位windows的。应用程序应该使用CreateProces函数。原型:UINT WINAPI WinExec( __in LPCSTR lpCmdLine, __in UINT uCmdShow );参数:lpCmdLine:将要运行的应用程序的命令行(文件名称加上可选参数)。如果在lpCmdLine参数中的可执行文件的名字没有包含目录的路径。系统将按顺序搜索. 阅读全文
摘要:
http://blog.csdn.net/woshiqianlong125/article/details/6159692多核编程学习笔记之同步(一)——采用Win32线程API实现分布式 2010-03-17 09:50:35 阅读66 评论0 字号:大中小订阅I. 务虚1.1 总体介绍 在Windows平台下可以通过Windows的线程库来实现多核编程,可以利用Win32API或MFC以及.Net Framework提供的接口来实现。实现方式的多样化给Windows编程带来了很大的灵活性,但也使得多线程编程变得复杂。对于多线程的程序可以使用Visual Studio调试工具进行调试,也可. 阅读全文