摘要:
CMU15418-Assignment2-解析 这个作业有三个部分, 都是 CUDA 编程. 前两个比较简单, 最后一个比较难. 本文的运行环境: RTX 3090 CUDA 12.2 作业描述, 原版代码链接, 我完成的代码链接. Part 1: SAXPY 用 CUDA 实现一个在 GPU 上运 阅读全文
摘要:
本篇介绍 cuda samples 中的 mergeSort. 大体上来讲, mergeSort 分为两个阶段. 对含有 SHARED_SIZE_LIMIT (即 1024) 个元素的数组进行排序. 合并多个有序数组. 其中第一个阶段调用一次函数 mergeSortShared 结束. 而第二个阶段 阅读全文
摘要:
之前一次面试出了这样一道题, 求一个大数, 例如 65535, 的阶乘. 求阶乘很简单, 但是如果数字很大的话就比较难办了. 这里受到力扣大数类题目总是对 `1e9+7` 取余的启发, 用一个数组存储一个大数, 数组的每一项都是 `int64`, 并且小于 `1e9`. 举个例子, 如果要用数组 ` 阅读全文