摘要: CMU15418-Assignment2-解析 这个作业有三个部分, 都是 CUDA 编程. 前两个比较简单, 最后一个比较难. 本文的运行环境: RTX 3090 CUDA 12.2 作业描述, 原版代码链接, 我完成的代码链接. Part 1: SAXPY 用 CUDA 实现一个在 GPU 上运 阅读全文
posted @ 2024-04-04 15:20 谋杀肚腩 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 本篇介绍 cuda samples 中的 mergeSort. 大体上来讲, mergeSort 分为两个阶段. 对含有 SHARED_SIZE_LIMIT (即 1024) 个元素的数组进行排序. 合并多个有序数组. 其中第一个阶段调用一次函数 mergeSortShared 结束. 而第二个阶段 阅读全文
posted @ 2023-12-08 16:04 谋杀肚腩 阅读(63) 评论(2) 推荐(0) 编辑
摘要: 之前一次面试出了这样一道题, 求一个大数, 例如 65535, 的阶乘. 求阶乘很简单, 但是如果数字很大的话就比较难办了. 这里受到力扣大数类题目总是对 `1e9+7` 取余的启发, 用一个数组存储一个大数, 数组的每一项都是 `int64`, 并且小于 `1e9`. 举个例子, 如果要用数组 ` 阅读全文
posted @ 2023-08-19 23:57 谋杀肚腩 阅读(35) 评论(0) 推荐(0) 编辑
摘要: 我在照着*STL 源码刨析*写 STL 的时候出现了一个编译错误. 当时的情况是我要用一个派生类的指针给一个基类指针的引用赋值, 类似于: ``` cpp class Base {}; class Derived : public Base {}; Derived *d = new Derived( 阅读全文
posted @ 2023-07-03 13:09 谋杀肚腩 阅读(18) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示