CUDA - 随笔分类 - 仙守

nvidia[单卡内部的调度原理]

摘要：本人虽然研二开始接触cuda，但是终究未从事cuda开发，故而皆为零零散散的知识，虽然看了好几本cuda编程的书籍以及官网的文档（肯定没看全啊，我也不是专门从事cuda开发），市面上几乎都是关于如何cuda编程的书籍，而这些书籍中也看过不少《CUDA C编程权威指南》，《CUDA专家手册》，《CUD 阅读全文

posted @ 2020-09-10 13:55 仙守阅读(1943) 评论(0) 推荐(1) 编辑

nvidia[GPU架构发展对比]

摘要：### 1 引言方便检索 ### 2 名词解释 **FLOPS**：“每秒浮点运算次数”，“每秒峰值速度”，是“每秒所执行的浮点运算次数”（floating-point operations per second）的缩写。所谓的“浮点运算”，实际上包括了所有涉及小数的运算。这类运算在某类应用软件中阅读全文

posted @ 2020-03-17 11:40 仙守阅读(2488) 评论(0) 推荐(1) 编辑

混合编程[python+cpp+cuda]

摘要：很多时候，我们是基于python进行模型的设计和运行，可是基于python本身的速度问题，使得原生态python代码无法满足生产需求，不过我们可以借助其他编程语言来缓解python开发的性能瓶颈。这里简单介绍个例子，以此完成如何先基于cuda编写瓶颈函数，然后在将接口通过cpp进行封装，最后以库的形阅读全文

posted @ 2019-04-19 13:20 仙守阅读(6058) 评论(1) 推荐(0) 编辑

CUDA2.4-原理之性能优化及浮点运算

摘要：本部分来自于《大规模并行处理器编程实战》第六章、第七章。打算不再看这本书了，准备看《programming massively parallel processors 2nd》，即它的第二版，第一版是09年的，第二版是13年的，虽说第二版可是里面涉及的是cuda4.0 和5.0，然而现在2015年7... 阅读全文

posted @ 2015-07-09 19:59 仙守阅读(1630) 评论(0) 推荐(0) 编辑

简介

摘要：引言 2015年05月25日。之前在csdn写博客，可是csdn经常进不去，所以转战博客园，就用了一键博客搬家功能,其中诺有版面问题，请来这边：http://blog.csdn.net/shouhuxianjian

【 自 然 语 言 处 理 】

$\color{red}{【自然语言处理】}$ 0 引言 NLP之引言 1 词向量阅读全文

posted @ 2015-05-25 22:55 仙守阅读(2029) 评论(0) 推荐(1) 编辑

CUDA2.3-原理之任意长度的矢量求和与用事件来测量性能

摘要：__global__ void add( int *a, int *b, int *c) { int tid = threadIdx.x + blockIdx.x *blockDim.x; while (tid c[tid] = a[tid] + b[tid];//your operat... 阅读全文

posted @ 2015-03-04 10:43 仙守阅读(601) 评论(0) 推荐(0) 编辑

CUDA2.2-原理之存储器访问

摘要：和CPU模式中的内存-cache-寄存器模式一样，GPU也是通过设置全局存储器，局部存储器，寄存器的方式来加速，很多时候我们需要自定义处理数据布局才能真正提高在GPU上的运算速度。首先，从是否可编程角度，GPU可分为： 1）可编程的存储：寄存器，共享存储，局部存储，常量存储，纹理存储，全局存储；阅读全文

posted @ 2015-02-04 10:36 仙守阅读(2421) 评论(0) 推荐(1) 编辑

CUDA2.1-原理之索引与warp

摘要：本小节来自《大规模并行处理器编程实战》第四节，该书是很好的从内部原理结构上来讲述了CUDA的，对于理解CUDA很有帮助，借以博客的形式去繁取间，肯定会加入自己个人理解，所以有错误之处还望指正。一、块索引与线程索引 CUDA是细粒度的，数据并行的轻量级线程，在启动一个CUDA的一个Kernel函数的阅读全文

posted @ 2015-01-27 12:19 仙守阅读(3347) 评论(0) 推荐(0) 编辑

CUDA1.1-函数类型限定符与变量类型限定符

摘要：这部分来自于《CUDA_C_Programming_Guide.pdf》，看完《GPU高性能变成CUDA实战》的第四章，觉得这本书还是很好的，是一种循序渐进式的书，值得看，而不是工具书那种，适合入门，看完这章，觉得应该先简单的列下函数类型限定符，顺带列下变量类型限定符。知识是“积少成多”的。ps；极... 阅读全文

posted @ 2015-01-05 19:21 仙守阅读(2694) 评论(0) 推荐(0) 编辑

CUDA1-hello world

摘要：电脑配置:windows7 sp1 64bit + CUDA6.5 + GeForce GTX780 Ti显卡中的GPU因为多核可以处理很多相同的操作,相比较来说cpu就像个健全的手,什么活都能干,而gpu就是个非健全的手，只能干特定的事情，但是架不住手多，随便几百上千的。关于从cpu过渡到GPU推... 阅读全文

posted @ 2014-12-20 19:36 仙守阅读(856) 评论(0) 推荐(0) 编辑

仙守

最美的不是下雨天,是曾与你躲过雨的屋檐!

随笔分类 - CUDA

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类 (265)

随笔档案 (240)

阅读排行榜

评论排行榜

推荐排行榜

最新评论