09 2019 档案

摘要:这道题是又一次在和学弟吃饭的路上听学弟讲的,感觉挺不错的^_^,这样仿佛经常听学弟讲题能收获不少呀,可能明年笔试有望了,哈哈~ Problem: 平面上给了有n个人,位置由(x,y)元组给定,平面上还有m扇门,位置由(x,y)给定。现在约定每扇门只能进一个人,且人只能向左和下移动(向x-1和y-1移 阅读全文
posted @ 2019-09-30 19:57 茶飘香~ 阅读(217) 评论(0) 推荐(0) 编辑
摘要:这道题是在与学弟吃饭的路上听学弟讲的,感觉挺有意思的,需要不少的思维(可能我长时间没有刷题了,有点笨了~) 特此记录一下: Problem: 有n个(x,y)元组,求从中取出k个元组,使得这k个元组的x之和乘以其中最小的y值的值最大 ( sum(x)*min(y) in k个元组 ) Solutio 阅读全文
posted @ 2019-09-30 18:25 茶飘香~ 阅读(339) 评论(0) 推荐(0) 编辑
摘要:CUDA 与 OpenGL 的互操作一般是使用CUDA生成数据,然后在OpenGL中渲染数据对应的图形。这两者的结合有两种方式: 1、使用OpenGL中的PBO(像素缓冲区对象)。CUDA生成像素数据,OpenGL直接渲染即可。 2、使用OpenGL中的FBO(顶点缓冲区对象)。CUDA生成顶点数据 阅读全文
posted @ 2019-09-16 22:00 茶飘香~ 阅读(2134) 评论(0) 推荐(0) 编辑
摘要:1、直接在新建工程的时候选择CUDA,这样的工程既能编译C++也能编译CU 2、在已有的C++工程上添加CUDA编译环境 右键工程-->生成依赖项-->生成自定义-->勾选CUDA 9.0 这时右键工程属性,发现多了两个关于CUDA的属性 点击CUDA C/C++下的Common,将默认的32-bi 阅读全文
posted @ 2019-09-12 21:27 茶飘香~ 阅读(1874) 评论(0) 推荐(1) 编辑
摘要:求矩阵每行的和? 可以把每行放入一个不同线程块,这样行与行之间进行粗粒度的并行。而对于每行,其对应的线程块中分配n个线程(对应行宽),使用共享存储器,让每个线程从显存中读取一个数至shared memory中,然后使用规约算法计算和。 代码如下: 阅读全文
posted @ 2019-09-11 14:53 茶飘香~ 阅读(1112) 评论(0) 推荐(0) 编辑
摘要:CUDA可以认为是一个由软件和硬件构成的并行计算系统,其依赖于GPU的并行计算单元,CUDA有类C的API,方便程序编写。其依赖于CPU和GPU的异构体系,通过在CPU上串行执行环境初始化、内存分配、数据传输,然后在GPU上执行并行计算。 内存分配 1、一维 参数1:显存中开辟的空间的指针(术语:G 阅读全文
posted @ 2019-09-11 14:38 茶飘香~ 阅读(2070) 评论(0) 推荐(0) 编辑
摘要:示例: 阅读全文
posted @ 2019-09-07 15:39 茶飘香~ 阅读(304) 评论(0) 推荐(0) 编辑
摘要:实例化渲染适用于使用同一个模型渲染多次的情景,比如草地,一堆岩石等。 1、先看一个渲染方形100次的例子: 其顶点着色器会有少许适应实例化渲染的变化 可以看到着色器中传入了100个偏移向量。顶点着色器中内置了一个变量gl_InstanceID,此变量表示当前绘制的实例编号(从0开始)。那么我们可以用 阅读全文
posted @ 2019-09-06 15:09 茶飘香~ 阅读(1169) 评论(0) 推荐(0) 编辑
摘要:一般我们只使用了顶点和片段着色器,这也是基本和必须的两个着色器,而几何着色器是一个可选的着色器,其位于顶点和片段着色器之间。 几何着色器接收来自顶点着色器的一个片元的一组顶点,然后可以对其进行变换,可以输出新的不同类型的片元,也可以增加顶点数,其功能非常强大。 一般写法如下: 可以看到首先定义了输入 阅读全文
posted @ 2019-09-04 15:29 茶飘香~ 阅读(1973) 评论(0) 推荐(0) 编辑
摘要:Uniform Buffer 是一个很有用的缓存,可以将大量的需要传递至多个着色器的矩阵、向量数据等存储在uniform buffer中。这是一个公共的缓存,所以当多个着色器需要传递相同的数据时,可以使用uniform buffer,减少代码量,应该也可以较少CUP传递至GPU的数据量。 大体思路是 阅读全文
posted @ 2019-09-02 16:28 茶飘香~ 阅读(3393) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示