会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
RedNoseBo
博客园
首页
新随笔
联系
管理
订阅
随笔- 74 文章- 0 评论- 0 阅读-
12337
01 2023 档案
CUDA C++ / 错误处理
摘要:错误处理 接收错误信息 定义一个cudaError_t类型的变量来接收错误信息 cudaError_t err; 获取错误信息的字符串 cudaGetErrorString(err); 使用方法: cout<<cudaGetErrorString(err)<<endl; 获取核函数执行后最后一次错误
阅读全文
posted @
2023-01-31 22:18
Laplace蒜子
阅读(225)
评论(0)
推荐(0)
编辑
CUDA C++ / 性能分析工具
摘要:nsys分析应用程序 命令行 nsys profile --stats=true ./CUDA程序 说明:生成的报告文件不会覆盖原来的报告文件,生成名称为report1,report2... 内容 CUDA API统计信息 CUDA核函数的统计信息 CUDA内存操作统计信息(时间和大小)
阅读全文
posted @
2023-01-31 20:11
Laplace蒜子
阅读(212)
评论(0)
推荐(0)
编辑
CUDA C++ / 内存管理以及优化
摘要:内存 1 内存读写速度 线程寄存器读写:1个时钟周期延迟 线程本地内存读写:非常慢 块的共享内存读写:1个时钟周期延迟,但是可能冲突 网格全局内存读写:500个时钟周期延迟,联合访问时会有隐含延迟。 网格的常量内存和纹理内存读取:500个时钟周期延迟。但是有缓存 2 内存模型 2.1 寄存器 修饰符
阅读全文
posted @
2023-01-30 17:35
Laplace蒜子
阅读(1518)
评论(0)
推荐(0)
编辑
CUDA C++ / 基础编程
摘要:核函数 作用 调用核函数的时候,代码会被N个CUDA线程执行N次。 修饰符 __global__ 返回值 函数名(){ ...执行代码 } 调用 函数名<<<BlockNumber,ThreadNumber>>>(); BlockNumber是块的个数。 ThreadNumber是每一个块中的线程个
阅读全文
posted @
2023-01-20 22:07
Laplace蒜子
阅读(173)
评论(0)
推荐(0)
编辑
CUDAC++ / GPU结构基础
摘要:CPU基本架构与GPU基本架构 Shared Memory(SM):共享内存,不是缓存 Special Function Units (SFU):特殊功能单元,超越运算(sin,cos)和插值。 MT Issue:Multithreading issuing unit,多线程发布单元,调度指令 I
阅读全文
posted @
2023-01-20 21:28
Laplace蒜子
阅读(275)
评论(0)
推荐(0)
编辑
CUDA C++ / 第一个CUDA程序
摘要:测试代码 编写“Test.cu”文件 #include"iostream" #include"stdio.h" using namespace std; __global__ void TestFunction(){ printf("The Thread'Id is %d\n",threadIdx.
阅读全文
posted @
2023-01-20 20:51
Laplace蒜子
阅读(111)
评论(0)
推荐(0)
编辑
CUDA C++ / Ubuntu环境下安装CUDA
摘要:查看Nvidia显卡驱动信息 nvidia-smi 下载对应版本的CUDA https://developer.nvidia.com/cuda-toolkit-archive 执行安装文件 sudo sh cuda_版本信息_linux.run (若driver已经安装过,去掉Driver选项)输入
阅读全文
posted @
2023-01-20 20:43
Laplace蒜子
阅读(149)
评论(0)
推荐(0)
编辑
公告
昵称:
Laplace蒜子
园龄:
2年9个月
粉丝:
1
关注:
0
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
更多链接
随笔分类
51单片只因(2)
CUDA C++(8)
Python(3)
Redis(4)
SpringBoot(1)
SpringCloud(4)
大数据(6)
多核编程的艺术(1)
高级计算机系统结构(7)
高性能计算(2)
模式识别与机器学习(9)
深度学习(12)
数据分析(1)
硕士英语写作(1)
图像处理(8)
云计算(1)
自然语言处理(3)
随笔档案
2023年11月(5)
2023年10月(1)
2023年9月(5)
2023年8月(2)
2023年7月(4)
2023年6月(3)
2023年5月(6)
2023年4月(3)
2023年3月(11)
2023年2月(17)
2023年1月(7)
2022年10月(1)
2022年8月(1)
2022年7月(2)
2022年6月(2)
2022年5月(4)
阅读排行榜
1. CUDA C++ / 内存管理以及优化(1518)
2. ALBEF-图文对比学习(815)
3. 动量编码器(620)
4. 半监督学习(608)
5. 无监督学习——聚类(516)
点击右上角即可分享