Magnum Programm Life

2015年3月24日

摘要： C++ AMP是专为设计支持C++的异构并行模型.全程是:AcceleratorMassive Parallelism下面是一个Vector C++ AMP的代码,通过这段代码来解释C++ AMP的语法:#include using namespace concurrency;void vecAdd... 阅读全文

posted @ 2015-03-24 17:33 Magnum Programm Life 阅读(2090) 评论(0) 推荐(0) 编辑

2015年3月23日

字节序

摘要：字节序，顾名思义字节的顺序，再多说两句就是大于一个字节类型的数据在内存中的存放顺序(一个字节的数据当然就无需谈顺序的问题了)。其实大部分人在实际的开发中都很少会直接和字节序打交道。唯有在跨平台以及网络程序中字节序才是一个应该被考虑的问题。在所有的介绍字节序的文章中都会提到字节序分为两类：Big-En... 阅读全文

posted @ 2015-03-23 17:12 Magnum Programm Life 阅读(210) 评论(0) 推荐(0) 编辑

2015年3月18日

CUDA 进阶学习

摘要： CUDA基本概念CUDA网格限制1.2CPU和GPU的设计区别2.1CUDA-Thread2.2CUDA-Memory(存储)和bank-conflict2.3CUDA矩阵乘法3.1 全局存储带宽与合并访问　-- Global Memory(DRAM) bandwidth and memory co... 阅读全文

posted @ 2015-03-18 10:51 Magnum Programm Life 阅读(3510) 评论(0) 推荐(1) 编辑

2015年3月17日

7.OpenACC

摘要： OpenACC:openacc 可以用于fortran, c 和 c++程序,可以运行在CPU或者GPU设备.openacc的代码就是在原有的C语言基础上进行修改,通过添加:compiler directives 编译器指令(pragmas): #pragma 来标示.cuda 中有__syncth... 阅读全文

posted @ 2015-03-17 11:35 Magnum Programm Life 阅读(1706) 评论(2) 推荐(0) 编辑

octopress Endless Error With Gem Dependencies

摘要：因为重装系统的缘故,需要重新搭建octopress环境,在执行到:bundle install会出现一些这样的错误:An error occurred while installing timers (4.0.1), and Bundler cannot continue.An error occu... 阅读全文

posted @ 2015-03-17 11:04 Magnum Programm Life 阅读(443) 评论(0) 推荐(0) 编辑

2015年3月6日

5.2 CUDA Histogram直方图

摘要：什么是HistogrammingHistogramming是一种从大的数据集中提取典型特征和模式的方式.在统计学中，直方图（英语：Histogram）是一种对数据分布情况的图形表示，是一种二维统计图表，它的两个坐标分别是统计样本和该样本对应的某个属性的度量。图像直方图（英语：Image Histog... 阅读全文

posted @ 2015-03-06 11:13 Magnum Programm Life 阅读(3868) 评论(0) 推荐(1) 编辑

Movidius CIF DMA总结

该文被密码保护。阅读全文

posted @ 2015-03-06 10:56 Magnum Programm Life 阅读(13) 评论(0) 推荐(0) 编辑

2015年3月4日

6.2 CUDA streams

摘要： stream是什么nivdia给出的解释是:A sequence of operations that execute in issue-order on the GPU. 可以理解成在GPU上执行的操作序列.比如下面的这些动作.cudaMemcpy()kernel launchdevice syn... 阅读全文

posted @ 2015-03-04 14:28 Magnum Programm Life 阅读(4463) 评论(0) 推荐(1) 编辑

2015年2月28日

6.1 CUDA: pinned memory固定存储

摘要： CPU和GPU内存交互在CUDA编程中,内存拷贝是非常费时的一个动作.从上图我们可以看出:1. CPU和GPU之间的总线bus是PCIe,是双向传输的.2. CPU和GPU之间的数据拷贝使用DMA机制来实现,非常容易理解,为了更快的传输速度.虚拟内存(virtual memory)我们都知道，虽然在... 阅读全文

posted @ 2015-02-28 11:58 Magnum Programm Life 阅读(12654) 评论(0) 推荐(3) 编辑

2015年2月10日

5.1 CUDA atomic原子操作

摘要：和许多多线程并行问题一样，CUDA也存在互斥访问的问题，即当一个线程改变变量Ｘ,而另外一个线程在读取变量Ｘ的值，执行原子操作类似于有一个自旋锁，只有等Ｘ的变量在改变完成之后，才能执行读操作，这样可以保证每一次读取的都是最新的值.在kernel 程序中，做统计累加，都需要使用原子操作：atomicAd... 阅读全文

posted @ 2015-02-10 11:59 Magnum Programm Life 阅读(24593) 评论(1) 推荐(0) 编辑

Magnum Programm Life

公告