CUDA 纹理的使用

纹理绑定有两种,一个是绑定到线性内存就是用cudaMalloc();cudaMemcpy();开辟的内存空间,另一种是绑定到cudaMallocArray, cudaMemcpyToArray开辟到的二维数组或者三维数组。

先说比较简单的就是绑定到cudamalloc开辟到的内存空间。

首先是纹理声明:关于纹理的声明和绑定都要在cu文件进行,在其他文件进行会比较麻烦。

首先是开辟显存和赋值给显存。

首先是纹理声明:

1、texture<float, 1, cudaReadModeElementType> texRef;

2、为显存开辟空间,并初始化

cudaMalloc((void **)&rain_table,256*4*3); 

cudaMemcpy(rain_table ,table, 256*4*3,cudaMemcpyHostToDevice);

3、纹理绑定:

cudaBindTexture(0,texRef,rain_table );

4、_在global_ kernel函数使用纹理:

vterm = tex1Dfetch(texRef, 3*index);

5、解除纹理:

 cudaUnbindTexture(texRef);

 cudaFree(table)

 以上是一维纹理的使用,接着介绍二维纹理数组的使用:

 纹理声明为二维纹理:

注:在1.x和3.x的卡使用纹理回比全局变量的要好,但2.x刚好相反,因为2.X有更大的L1缓存,所以2.x的卡建议不使用纹理,除非测出的速度要比使用全局变量的要快。 

1、texture<float, 2, cudaReadModeElementType> texRef;

 2、开辟显存:

 cudaChannelFormatDesc channelDesc = cudaCreateChannelDesc(32, 0, 0, 0,cudaChannelFormatKindFloat); 
 cudaArray* cuArray;
 cudaMallocArray(&cuArray, &channelDesc, 3, 256); //为cuArray开辟空间
 cudaMemcpyToArray(cuArray, 0, 0, table,256*3*4,     cudaMemcpyHostToDevice);   

 3、纹理绑定

cudaBindTextureToArray(texRef, cuArray, channelDesc);

 4、使用

 vterm = tex2D(texRef,  0,index);

 5、解除绑定

 cudaBindTextureToArray(texRef,cuArray,channelDesc);

posted @   rainbow70626  阅读(536)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 终于写完轮子一部分:tcp代理 了,记录一下
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
点击右上角即可分享
微信分享提示