上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 59 下一页
摘要: ps:这是英伟达二面面的一道相关CUDA的题目。《NVIDIA CUDA编程指南》第57页开始 在合并访问这里,不要跟shared memory的bank conflict搞混淆了,这里很... 阅读全文
posted @ 2016-10-15 11:31 ZhangPYi 阅读(233) 评论(0) 推荐(0) 编辑
摘要: __syncthreads()是cuda的内建函数,用于块内线程通信.__syncthreads() is you garden variety thread barrier. Any thread re... 阅读全文
posted @ 2016-10-14 10:18 ZhangPYi 阅读(177) 评论(0) 推荐(0) 编辑
摘要: __syncthreads()是cuda的内建函数,用于块内线程通信.__syncthreads() is you garden variety thread barrier. Any thread re... 阅读全文
posted @ 2016-10-14 10:18 ZhangPYi 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 掌握部分硬件知识,有助于程序员编写更好的CUDA程序,提升CUDA程序性能,本文目的是理清sp,sm,thread,block,grid,warp之间的关系。由于作者能力有限,难免有疏漏,恳请读者批评指正... 阅读全文
posted @ 2016-10-13 23:33 ZhangPYi 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 掌握部分硬件知识,有助于程序员编写更好的CUDA程序,提升CUDA程序性能,本文目的是理清sp,sm,thread,block,grid,warp之间的关系。由于作者能力有限,难免有疏漏,恳请读者批评指正... 阅读全文
posted @ 2016-10-13 23:33 ZhangPYi 阅读(593) 评论(0) 推荐(1) 编辑
摘要: #pragma宏命令主要是改变编译器的编译行为,其他的参数网上资料比较多,我只想简单说下#pragma unroll的用法,因为网上的资料比较少,而且说的比较笼统,请看下面的一段代码int main(){... 阅读全文
posted @ 2016-10-13 23:18 ZhangPYi 阅读(2526) 评论(0) 推荐(0) 编辑
摘要: #pragma宏命令主要是改变编译器的编译行为,其他的参数网上资料比较多,我只想简单说下#pragma unroll的用法,因为网上的资料比较少,而且说的比较笼统,请看下面的一段代码int main(){... 阅读全文
posted @ 2016-10-13 23:18 ZhangPYi 阅读(602) 评论(0) 推荐(0) 编辑
摘要: Warp逻辑上,所有thread是并行的,但是,从硬件的角度来说,实际上并不是所有的thread能够在同一时刻执行,接下来我们将解释有关warp的一些本质。Warps and Thread Blocksw... 阅读全文
posted @ 2016-10-13 22:42 ZhangPYi 阅读(341) 评论(0) 推荐(1) 编辑
摘要: Warp逻辑上,所有thread是并行的,但是,从硬件的角度来说,实际上并不是所有的thread能够在同一时刻执行,接下来我们将解释有关warp的一些本质。Warps and Thread Blocksw... 阅读全文
posted @ 2016-10-13 22:42 ZhangPYi 阅读(490) 评论(0) 推荐(0) 编辑
摘要: 1.在用vs运行cuda的一些例子时,在编译阶段会报出很多警告: warning C4819 ...... 解决这个警告的方法是打开出现warning的文件,Ctrl+A全选,然后在文件菜单... 阅读全文
posted @ 2016-10-13 22:22 ZhangPYi 阅读(216) 评论(0) 推荐(0) 编辑
摘要: 1.在用vs运行cuda的一些例子时,在编译阶段会报出很多警告: warning C4819 ...... 解决这个警告的方法是打开出现warning的文件,Ctrl+A全选,然后在文件菜单... 阅读全文
posted @ 2016-10-13 22:22 ZhangPYi 阅读(499) 评论(0) 推荐(0) 编辑
摘要: GPU 的硬体架构 这里我们会简单介绍,NVIDIA 目前支援CUDA 的GPU,其在执行CUDA 程式的部份(基本上就是其shader 单元)的架构。这里的资料是综合NVIDIA 所公布的资讯,以及NV... 阅读全文
posted @ 2016-10-13 22:19 ZhangPYi 阅读(154) 评论(0) 推荐(0) 编辑
摘要: GPU 的硬体架构 这里我们会简单介绍,NVIDIA 目前支援CUDA 的GPU,其在执行CUDA 程式的部份(基本上就是其shader 单元)的架构。这里的资料是综合NVIDIA 所公布的资讯,以及NV... 阅读全文
posted @ 2016-10-13 22:19 ZhangPYi 阅读(543) 评论(0) 推荐(0) 编辑
摘要: GPGPU OpenCL/CUDA 高性能编程的10大注意事项1.展开循环 如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。 循环展开... 阅读全文
posted @ 2016-10-13 21:27 ZhangPYi 阅读(176) 评论(0) 推荐(0) 编辑
摘要: GPGPU OpenCL/CUDA 高性能编程的10大注意事项1.展开循环 如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。 循环展开... 阅读全文
posted @ 2016-10-13 21:27 ZhangPYi 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 关于共享内存(shared memory)和存储体(bank)的事实和疑惑主要是在研究访问共享内存会产生bank conflict时,自己产生的疑惑。对于这点疑惑,网上都没有相关描述,不管是国内还是国外的... 阅读全文
posted @ 2016-10-13 21:20 ZhangPYi 阅读(584) 评论(0) 推荐(0) 编辑
摘要: 关于共享内存(shared memory)和存储体(bank)的事实和疑惑主要是在研究访问共享内存会产生bank conflict时,自己产生的疑惑。对于这点疑惑,网上都没有相关描述,不管是国内还是国外的... 阅读全文
posted @ 2016-10-13 21:20 ZhangPYi 阅读(193) 评论(0) 推荐(0) 编辑
摘要: CUDA SHARED MEMORYshared memory在之前的博文有些介绍,这部分会专门讲解其内容。在global Memory部分,数据对齐和连续是很重要的话题,当使用L1的时候,对齐问题可以忽... 阅读全文
posted @ 2016-10-13 21:19 ZhangPYi 阅读(431) 评论(0) 推荐(0) 编辑
摘要: CUDA SHARED MEMORYshared memory在之前的博文有些介绍,这部分会专门讲解其内容。在global Memory部分,数据对齐和连续是很重要的话题,当使用L1的时候,对齐问题可以忽... 阅读全文
posted @ 2016-10-13 21:19 ZhangPYi 阅读(854) 评论(0) 推荐(0) 编辑
摘要: http://hi.baidu.com/pengkuny/item/c8070b388d75d481b611db7a以前以为 shared memory 是一个万能的 L1 cache,速度很快,只要数据... 阅读全文
posted @ 2016-10-13 21:18 ZhangPYi 阅读(187) 评论(0) 推荐(0) 编辑
摘要: http://hi.baidu.com/pengkuny/item/c8070b388d75d481b611db7a以前以为 shared memory 是一个万能的 L1 cache,速度很快,只要数据... 阅读全文
posted @ 2016-10-13 21:18 ZhangPYi 阅读(457) 评论(0) 推荐(0) 编辑
摘要: 举报 说到显卡,就不免令人想到英伟达和AMD两家面向个人消费级和企业级最大的显示芯片生产企业,英伟达和AMD,今天小编为大家简单的介绍一下英伟达的显卡选购方面的攻略,为一些想要购买显卡的用户提供一些参考... 阅读全文
posted @ 2016-10-13 16:07 ZhangPYi 阅读(340) 评论(0) 推荐(0) 编辑
摘要: 举报 说到显卡,就不免令人想到英伟达和AMD两家面向个人消费级和企业级最大的显示芯片生产企业,英伟达和AMD,今天小编为大家简单的介绍一下英伟达的显卡选购方面的攻略,为一些想要购买显卡的用户提供一些参考... 阅读全文
posted @ 2016-10-13 16:07 ZhangPYi 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 64 位的优点:64 位的应用程序可以直接访问 4EB 的内存和文件大小最大达到4 EB(2 的 63 次幂);可以访问大型数据库。本文介绍的是64位下C语言开发程序注意事项。1. 32 位和 64 位C... 阅读全文
posted @ 2016-10-13 15:13 ZhangPYi 阅读(559) 评论(0) 推荐(0) 编辑
摘要: 64 位的优点:64 位的应用程序可以直接访问 4EB 的内存和文件大小最大达到4 EB(2 的 63 次幂);可以访问大型数据库。本文介绍的是64位下C语言开发程序注意事项。1. 32 位和 64 位C... 阅读全文
posted @ 2016-10-13 15:13 ZhangPYi 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 随着GPU的可编程性不断增强,GPU的应用能力已经远远超出了图形渲染任务,利用GPU完成通用计算的研究逐渐活跃起来,将GPU用于图形渲染以外领域的计算成为GPGPU(General Purpose co... 阅读全文
posted @ 2016-10-13 11:07 ZhangPYi 阅读(489) 评论(0) 推荐(0) 编辑
摘要: 随着GPU的可编程性不断增强,GPU的应用能力已经远远超出了图形渲染任务,利用GPU完成通用计算的研究逐渐活跃起来,将GPU用于图形渲染以外领域的计算成为GPGPU(General Purpose co... 阅读全文
posted @ 2016-10-13 11:07 ZhangPYi 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 1 GPU是什么 如图1所示,这台PC机与普通PC机不同的是这里插了7张显卡,左下角是显卡,在中间的就是GPU芯片。显卡的处理器称为图形处理器(GPU),它是显卡的“心脏”,与CPU类似,只不过... 阅读全文
posted @ 2016-10-13 11:06 ZhangPYi 阅读(409) 评论(0) 推荐(0) 编辑
摘要: 1 GPU是什么 如图1所示,这台PC机与普通PC机不同的是这里插了7张显卡,左下角是显卡,在中间的就是GPU芯片。显卡的处理器称为图形处理器(GPU),它是显卡的“心脏”,与CPU类似,只不过... 阅读全文
posted @ 2016-10-13 11:06 ZhangPYi 阅读(192) 评论(0) 推荐(0) 编辑
摘要: ATI显卡ATI显卡即AMD显卡。俗称A卡。搭载AMD公司出品的显示芯片。与NVIDIA齐名,同为世界两大显示芯片厂商。不同的是AMD不是只有显卡,而且还出品CPU(处理器),其AMD处理器与Intel齐... 阅读全文
posted @ 2016-10-13 11:05 ZhangPYi 阅读(396) 评论(0) 推荐(0) 编辑
摘要: ATI显卡ATI显卡即AMD显卡。俗称A卡。搭载AMD公司出品的显示芯片。与NVIDIA齐名,同为世界两大显示芯片厂商。不同的是AMD不是只有显卡,而且还出品CPU(处理器),其AMD处理器与Intel齐... 阅读全文
posted @ 2016-10-13 11:05 ZhangPYi 阅读(797) 评论(0) 推荐(0) 编辑
摘要: 前面扯了很多,不过大多都是在讲CUDA 在软体层面的东西;接下来,虽然Heresy 自己也不熟,不过还是来研究一下硬体的部分吧~毕竟要最佳化的时候,好像还是要大概知道一下相关的东西的。这部分主要参考资料是... 阅读全文
posted @ 2016-10-13 10:50 ZhangPYi 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 前面扯了很多,不过大多都是在讲CUDA 在软体层面的东西;接下来,虽然Heresy 自己也不熟,不过还是来研究一下硬体的部分吧~毕竟要最佳化的时候,好像还是要大概知道一下相关的东西的。这部分主要参考资料是... 阅读全文
posted @ 2016-10-13 10:50 ZhangPYi 阅读(605) 评论(0) 推荐(0) 编辑
摘要: CUDA并行存储模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。CPU负责逻辑性强的事务处理和串行计算,GPU专注于执行高度线程化的并行处理任... 阅读全文
posted @ 2016-10-13 10:43 ZhangPYi 阅读(197) 评论(0) 推荐(0) 编辑
摘要: CUDA并行存储模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。CPU负责逻辑性强的事务处理和串行计算,GPU专注于执行高度线程化的并行处理任... 阅读全文
posted @ 2016-10-13 10:43 ZhangPYi 阅读(440) 评论(0) 推荐(0) 编辑
摘要: GPU的硬件结构,也不是具体的硬件结构,就是与CUDA相关的几个概念:thread,block,grid,warp,sp,sm。sp: 最基本的处理单元,streaming processor 最后具体... 阅读全文
posted @ 2016-10-13 10:40 ZhangPYi 阅读(191) 评论(0) 推荐(0) 编辑
摘要: GPU的硬件结构,也不是具体的硬件结构,就是与CUDA相关的几个概念:thread,block,grid,warp,sp,sm。sp: 最基本的处理单元,streaming processor 最后具体... 阅读全文
posted @ 2016-10-13 10:40 ZhangPYi 阅读(1143) 评论(0) 推荐(0) 编辑
摘要: 转载自:http://bbs.zol.com.cn/diybbs/d34441_76103.html4K这个概念也在最近几年开始流行了起来,无论是4K显示器、4K电视盒子,还是4K游戏对硬件的要求也越来越... 阅读全文
posted @ 2016-10-12 23:16 ZhangPYi 阅读(3028) 评论(0) 推荐(0) 编辑
摘要: 转载自:http://bbs.zol.com.cn/diybbs/d34441_76103.html4K这个概念也在最近几年开始流行了起来,无论是4K显示器、4K电视盒子,还是4K游戏对硬件的要求也越来越... 阅读全文
posted @ 2016-10-12 23:16 ZhangPYi 阅读(923) 评论(0) 推荐(0) 编辑
摘要: 在显卡技术日益成熟的今天,一些概念我们都不是很清楚了,那么显卡硬件解码功能是什么意思呢?高清硬解和软件有什么不同呢?显卡配置需不需要考虑硬件解码呢?电脑爱好者为您分析。什么是硬件解码?显卡硬件解码是将原来... 阅读全文
posted @ 2016-10-12 23:14 ZhangPYi 阅读(478) 评论(0) 推荐(0) 编辑
上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 59 下一页