摘要: # 服务器环境 NVIDIA GeForce RTX 3080 Ti ![image](https://img2023.cnblogs.com/blog/3190344/202305/3190344-20230526120533060-988692598.png) * 单张卡有80个SM,每个SM内 阅读全文
posted @ 2023-05-29 10:42 人生逆旅,我亦行人 阅读(73) 评论(0) 推荐(0) 编辑
摘要: #说明 由于实验室项目原因,需要跑一个Gmres算法,之前弄过kokkos,就想在kokkos-kernels里跑现有的GMRES算法库 在此记录自己的安装的过程,以及自己踩过的一些坑。 # 1. 准备工作 从Kokkos官网下载Kokkos 以及 Kokkos-kernels: https://g 阅读全文
posted @ 2023-05-26 12:03 人生逆旅,我亦行人 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 在介绍智能指针之前,先来看原始指针的一些不便之处: - 它的声明不能指示所指到底是单个对象还是数组。 - 它的声明没有告诉你用完后是否应该销毁它,即指针是否拥有所指之物。 - 如果你决定你应该销毁指针所指对象,没人告诉你该用`delete`还是其他析构机制(比如将指针传给专门的销毁函数)。 - 如果 阅读全文
posted @ 2023-05-17 15:05 人生逆旅,我亦行人 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 用过什么 C++ 11 的语法特性 auto & decltype C++ 11引入 auto 和 decltype 关键字,使得他们可以在编译器就推导出变量或者表达式的类型,方便开发者编码也简化了代码 auto : 让编译器在编译期就推导出变量的类型,可以通过 = 右边的类型推导出变量的类型 st 阅读全文
posted @ 2023-05-15 16:21 人生逆旅,我亦行人 阅读(31) 评论(0) 推荐(0) 编辑
摘要: 第六章 CUDA内存处理 6.1 高速缓存 G80 与 GT200 系列没有与CPU中高速缓存等价的存储器。在Fermi架构的GPU实现中,第一次引入了不基于程序员托管的数据缓存这个概念。这个架构的GPU中每个SM有一个一级缓存,这个一级缓存既是基于程序员托管的又是基于硬件托管的。在所有的SM之间有 阅读全文
posted @ 2023-05-09 10:28 人生逆旅,我亦行人 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 第五章 写完本篇,做一个小总结,写在前面(限于笔者水平有限,仅提出自己的思考,以供参考): 推荐理解的逻辑是:硬件 --> 软件 --> 编程 --> 解决实际问题 GPU从硬件上,有若干个SM,每个SM有若干个SP,SP是实际运行GPU线程的硬件,一个线程对应一个SP。由SM的数量和每个SM拥有S 阅读全文
posted @ 2023-05-08 17:55 人生逆旅,我亦行人 阅读(783) 评论(1) 推荐(0) 编辑
摘要: 1. 深拷贝和浅拷贝 浅拷贝(shallowCopy): 对于基本数据类型和简单对象,他们之间的拷贝非常简单,就是按位复制内存,这种默认的拷贝行为就是浅拷贝,这和memcpy()函数的调用效果类似。 深拷贝(deepCopy): 深拷贝会将原有对象的所有成员变量拷贝给新对象,对于指针等数据还会为新对 阅读全文
posted @ 2023-05-06 15:10 人生逆旅,我亦行人 阅读(1481) 评论(0) 推荐(0) 编辑