摘要: 作业描述及代码参见:cs149gpt Warm-Up:访问张量 张量/数组都是按行存储的,四维数组可以看作元素为三维数组的数组,元素大小即为三维数组内元素总数,以此类推。 第 1 部分:简单(但不太高效)的注意力机制实现 主要实现两个矩阵乘法和一个 softmax 运算。 第 2 部分:块矩阵乘法和 阅读全文
posted @ 2024-10-14 21:21 BienBoy 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 作业描述及代码参见:CS149-asst3 实验环境:WSL2;GeForce MX350;Cuda 12.6 第一部分:CUDA 热身练习 1:SAXPY 实验结果: 相比基于 CPU 的实现,性能明显下降。这是由于 SAXPY 属于 I/O 密集型任务,计算量较小,主要的时间耗费在数据的转移。 阅读全文
posted @ 2024-10-14 21:18 BienBoy 阅读(209) 评论(1) 推荐(1) 编辑
摘要: 作业描述及代码参见:CS149-asst2 Part A Step 1 只需要实现一个简单的任务系统,在run()的开始生成工作线程,并在run()返回之前从主线程合并这些线程。任务的分配方式采用动态分配,即每个线程每次取一个任务完成,能者多劳。 每个线程的核心实现为: while (true) { 阅读全文
posted @ 2024-10-14 21:15 BienBoy 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 作业描述及代码参见:CS149-asst1 程序 1 生成 view 1 时加速比与线程数的关系如下: 线程数 加速比 2 2.04 3 1.69 4 2.54 5 2.57 6 3.26 7 3.55 8 4.11 生成 view 2 时加速比与线程数的关系如下: 线程数 加速比 2 1.75 3 阅读全文
posted @ 2024-10-14 21:06 BienBoy 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 1. 预备知识 1.1 参考椭球 地球表面是一个凸凹不平的表面,而对于地球测量而言,地表是一个无法用数学公式表达的曲面,这样的曲面不能作为测量和制图的基准面。假想一个扁率极小的椭圆,绕地球体短轴旋转所形成的规则椭球体称之为地球椭球体。 地球椭球体与地球形体非常接近,是一个形状规则的数学表面,在其上可 阅读全文
posted @ 2024-07-12 22:33 BienBoy 阅读(555) 评论(0) 推荐(2) 编辑
摘要: 本文将介绍 Windows 下,使用 CLion 和 WSL 配置 MPI 运行及调试环境的方法。 0. 前提 阅读本文前,请确保: Windows 下已启用 WSL2,并安装了任一 Linux 发行版 1. WSL环境配置 (1) 配置编译环境 sudo apt-get update sudo a 阅读全文
posted @ 2024-03-27 11:58 BienBoy 阅读(950) 评论(0) 推荐(0) 编辑