01 2015 档案

摘要:1. ReductionReduction是一种广泛使用的计算模型,特别是在并行计算领域。简单地来说,Reduction就是一系列的划分(Partition)和汇总(Summarize)操作的集合:对输入数据分块,对每一个分块汇总,然后再将汇总后的数据视为新的输入数据,重复分块和汇总,直到得到最终结... 阅读全文
posted @ 2015-01-30 11:42 Magnum Programm Life 阅读(1455) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2015-01-29 17:07 Magnum Programm Life 阅读(3) 评论(0) 推荐(0) 编辑
摘要:分析tile并行算法的优化情况:一维卷积的复用情况分析比如8个元素的一维卷积tile优化.M的大小是5,计算8个元素的卷积需要载入 8+5-1 =12, 如果不使用tile,每个元素都需要载入 8*5 =40, 所以全局内存访问带宽减少 40/12 =3.3. 正常我们算40 = 8*5的方式来看,... 阅读全文
posted @ 2015-01-28 14:02 Magnum Programm Life 阅读(1715) 评论(0) 推荐(0) 编辑
摘要:一维卷积Convolution卷积也是很常用的一种计算模式。卷积计算方法如下:对输出数据中的每一个元素,它的值是输入数据中相同位置上的元素与该元素周边元素的值的加权和。卷积中有一个被称为卷积核(Kernel)或卷积码(Mask)的数据段,指定了周边元素的权值。为了避免混淆,以后都称为卷积码。计算如下... 阅读全文
posted @ 2015-01-27 10:18 Magnum Programm Life 阅读(2424) 评论(0) 推荐(0) 编辑
摘要:全局存储带宽(DRAM)全局内存是动态随机访问的方式访问内存.我们希望访问DRAM的时候非常快,实际情况是DRAM中出来的数据非常非常慢,这就好比,理想状态是泄洪,水倾巢而出,气势宏伟,实际取水却像是用吸管在喝饮料,速度非常慢.通常来看,我们会通过优化算法减少DRAM的访问次数.由上图可以看出,用户... 阅读全文
posted @ 2015-01-26 19:25 Magnum Programm Life 阅读(3367) 评论(2) 推荐(1) 编辑
摘要:CPU 矩阵乘法能相乘的两个矩阵,必须满足一个矩阵的行数和第二个矩阵的列数相同.A(N*P) * B(P*M) = C(N*M). 其中P是行数,N是列数, 从宽高的角度来说,即 A的宽度和B的高度是相同的.C矩阵 = ha * wb.其中C(i,j) = A矩阵中的i行和B矩阵中的j列进行点乘得到... 阅读全文
posted @ 2015-01-23 18:41 Magnum Programm Life 阅读(10043) 评论(0) 推荐(0) 编辑
摘要:字体下载安装字体即可 阅读全文
posted @ 2015-01-22 15:11 Magnum Programm Life 阅读(301) 评论(0) 推荐(0) 编辑
摘要:在CUDA基本概念介绍有简单介绍CUDA memory。这里详细介绍:每一个线程拥有自己的私有存储器,每一个线程块拥有一块共享存储器(Shared memory);最后,grid中所有的线程都可以访问同一块全局存储器(global memory)。除此之外,还有两种可以被所有线程访问的只读存储器:常... 阅读全文
posted @ 2015-01-19 23:14 Magnum Programm Life 阅读(6317) 评论(1) 推荐(1) 编辑
摘要:在HOST端我们会分配block的dimension, grid的dimension。但是对应到实际的硬件是如何执行这些硬件的呢?如下图:lanuch kernel 执行一个grid。一个Grid有8个block,可以有两个硬件执行单元,一个执行一个block,需要执行4次,或者像右边有4个执行单元... 阅读全文
posted @ 2015-01-19 16:01 Magnum Programm Life 阅读(2464) 评论(1) 推荐(1) 编辑
该文被密码保护。
posted @ 2015-01-16 17:30 Magnum Programm Life 阅读(28) 评论(0) 推荐(0) 编辑
摘要:ANDROID Porting系列二、配置一个新产品详细说明下面的步骤描述了如何配置新的移动设备和产品的makefile运行android。1.目录//vendor/创建一个公司目录 mkdir vendor/2.创建一个目录下的公司与您在步骤1中创建产品目录. mkdir vendor//prod... 阅读全文
posted @ 2015-01-15 14:26 Magnum Programm Life 阅读(620) 评论(0) 推荐(0) 编辑
摘要:译自:http://source.android.com/porting/build_system.htmlAndroid使用一个自定义生成系统生成工具,二进制文件和文档。本文档提供了一个建立Android的编译系统的概述。Android的编译系统需要最新版本的GNU make,(请注意,Andro... 阅读全文
posted @ 2015-01-15 14:25 Magnum Programm Life 阅读(615) 评论(0) 推荐(0) 编辑
摘要:Android定义的路径全局变量ifeq (,$(strip $(OUT_DIR))) OUT_DIR := $(TOPDIR)out endif DEBUG_OUT_DIR := $(OUT_DIR)/debug # Move the host or target under the debu... 阅读全文
posted @ 2015-01-15 14:21 Magnum Programm Life 阅读(1104) 评论(0) 推荐(0) 编辑
摘要:1.Programming_Massively_Parallel_Processors.pdf2.CUDA_C_Programming_Guide.pdf3.CUDA范例精解通用GPU编程.pdf4.GPU高性能编程CUDA实战中文.pdf5.CUDA深入浅出.pdf 阅读全文
posted @ 2015-01-15 12:03 Magnum Programm Life 阅读(1387) 评论(0) 推荐(0) 编辑
摘要:如图 阅读全文
posted @ 2015-01-15 12:02 Magnum Programm Life 阅读(1029) 评论(0) 推荐(0) 编辑
摘要:CUDA计算模型CUDA中计算分为两部分,串行部分在Host上执行,即CPU,而并行部分在Device上执行,即GPU。相比传统的C语言,CUDA增加了一些扩展,包括了库和关键字。CUDA代码提交给NVCC编译器,该编译器将代码分为Host代码和Device代码两部分。Host代码即为原本的C语言,... 阅读全文
posted @ 2015-01-14 23:07 Magnum Programm Life 阅读(2983) 评论(0) 推荐(2) 编辑
摘要:CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。CPU需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂。而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净... 阅读全文
posted @ 2015-01-14 11:50 Magnum Programm Life 阅读(27878) 评论(6) 推荐(17) 编辑
该文被密码保护。
posted @ 2015-01-13 15:55 Magnum Programm Life 阅读(24) 评论(0) 推荐(0) 编辑
摘要:DDR内存现在渐渐成为内存市场中新的宠儿,因其合理的性价比从其诞生以来一直受到人们热烈的期望,希望这一新的内存产品全面提升系统的处理速度和带宽,就连对Rambus抱有无限希望的Intel公司也向外界宣布将以最快的速度生产支持DDR内存的新一代P4系统。不难看出,DDR真的是大势所趋。 DDR是Dou... 阅读全文
posted @ 2015-01-13 11:51 Magnum Programm Life 阅读(1595) 评论(0) 推荐(0) 编辑
摘要:本文翻译自英文:Myriad2图像处理器是一个永远在线的移动视觉处理器系统。它提供了非常强处理能力和及其高效了内存带宽以满足计算机视觉和计算成像应用的需求。 Myriad2同时也满足移动设备的非常低的功率要求,比如智能手机,平板电脑和可穿戴设备。。Myriad2 为下一代图像处理器和镜头提供可编程的... 阅读全文
posted @ 2015-01-04 12:07 Magnum Programm Life 阅读(2225) 评论(0) 推荐(0) 编辑
摘要:转载自:http://www.igao7.com/news/201406/pelican.html相信各位都看过诺基亚要与Pelican 合作,联手研发 16 颗阵列式镜头的超强拍照手机的新闻了吧。小编也对这个镜头很感兴趣,现在就由小编来介绍一下这颗摄像头的强大之处。Pelican Imaging ... 阅读全文
posted @ 2015-01-04 11:46 Magnum Programm Life 阅读(2034) 评论(0) 推荐(0) 编辑