11 2024 档案
摘要:Gemini: 大规模DNN芯片阵列加速器的布局和架构 摘要 chiplet概要目标 Chiplet(芯片阵列)技术允许在单一加速器上集成不断增加的晶体管的数量,在前摩尔定律时代获得了更高的效果,体现了在快速AI迭代进步中需要的大量算力。 但是,这样也引进了更高昂的大包开销,以及大量的d2d(芯片裸
阅读全文
摘要:Lec 09 process 本内容版权归上海交通大学并行与分布式系统研究所所有 使用者可以将全部或部分本内容免费用于非商业用途 使用者在使用全部或部分本内容时请注明来源 资料来自上海交通大学并行与分布式系统研究所+材料名字 对于不遵守此声明或者其他违法使用本内容者,将依法保留追究权 本内容的发布采
阅读全文
摘要:HPCC: High Precision Congestion Control 论文阅读 摘要部分和简介 CC(拥塞控制, 以下都用CC表示)的目标:低延迟,高带宽,网络稳定。但是现有的CC算法在大规模高速RDMA网络上实现这些目标具有潜在限制。 提出HPCC,利用网络内遥测(INT, in-Net
阅读全文
摘要:Chap1,2 Hello Concurrency与线程管理 参考书目:《C++ Concurrency in action》- By Anthony Willians, Second Edition 读书笔记 Contents 定义并发,多线程 使用并发,多线程 简单的C++多线程 1.1 什么是
阅读全文
摘要:lab 2: Memory Manage 前言 新的环境好像不支持arm架构了,总是会在make build触发错误(提示镜像仅适配(linux/amd)平台QAQ)......运行make build会出现exec chbuild not found. 我们于是只能使用utm平台+qemu模拟am
阅读全文
摘要:lec 07 操作系统管理页表映射 0 Contents 1 操作系统设置页表映射 何时设置页表映射? 操作系统自己使用的页表 -- 在启动时填写 -- 映射全部物理内存 虚拟地址 = 物理地址 + 固定偏移(直接映射,Direct Mapping) 思考:为什么需要直接映射? 应用进程的页表 --
阅读全文
摘要:Lec 08 物理内存管理 0 Contents OS的职责:管理和分配物理内存资源 引入虚拟内存后,物理内存分配体现在以下四个方面: 1.用户态应用出发延迟映射,此时内核需要分配物理内存页,映射到对应的虚拟页。 2.内核自己申请内存并且使用。用于内核自身的数据结构,通过kmalloc()完成。 3
阅读全文
摘要:Lec 06 系统初始化 Contents 1.启动过程和系统初始化 1.从上电到等待输入 2. 计算机上电到内核启动 上电后,开始执行BIOS ROM中的代码(早期设备) -- 自检(POST: Power-On Self Test) -- 找到第一个可启动设备(如第一块磁盘) -- 将可启动设备
阅读全文
摘要:Lec 05 内存地址翻译 (参考来源:上海交通大学并行与分布式系统研究所+操作系统课程ppt) Creative Commons Attribution 4.0 License Contents 1. 内存管理 1.1 物理内存 常说的“内存条”就是指物理内存 数据从磁盘中加载到物理内存后,才能被
阅读全文
摘要:Lec 04 系统调用 (参考来源:上海交通大学并行与分布式系统研究所+操作系统课程ppt) Creative Commons Attribution 4.0 License Contents 4.1 系统调用 硬件提供了一对指令svc/eret指令在用户态/内核态间切换 系统调用 (1) 用户与操
阅读全文
摘要:Lec 03 系统指令集架构 (参考来源:上海交通大学并行与分布式系统研究所+操作系统课程ppt) Creative Commons Attribution 4.0 License Contents 3.1 回顾:特权级的必要性 一台计算机上同时运行多个应用程序,如何保证不同应用间的隔离? 如果所有
阅读全文
摘要:Lecture 02: ARM 汇编基础 Contents 为什么学习ARM/ISA汇编 从C到汇编 理解arm汇编 理解机器执行 1 为什么学习汇编和指令集架构? 1.令人困惑的应用表现 2.指令集架构ISA(Instruction Set Architecture) CPU向软件(应用程序和操作
阅读全文
摘要:Lab1: BOOT!!! (参考来源:上海交通大学并行与分布式系统研究所+操作系统实验) Creative Commons Attribution 4.0 License 1. Prerequisite 国内大部分的镜像都坏掉了,我们只能自己部署一个加速的镜像。 首先fork这个项目,记得给一颗星
阅读全文
摘要:Lab 0: 爆弾!!! 这是OS操作系统的前序实验。。。 (p.s. 怎么一上来就让人这么累。。。) 1. 准备实验环境 基于Ubuntu 22.04.2 ARM64. 首先,我们将我们的学号填入到student-number.txt中。 其次,在linux上安装所需要的东西。如果没有gcc,g+
阅读全文
摘要:Leetcode 做题记录 题单:从0开始的leetcode生活 链表 哈希表 栈和队列 树 动态规划 未开始 杂题部分
阅读全文
摘要:杂题部分 1.3131. 找出与数组相加的整数 I 思路:快排+直接找差值 void quickSort(int *arr,int low,int high) { if(high<=low) return; int i=low; int j=high; int pivot=arr[low]; whi
阅读全文
摘要:栈和队列 232.用栈实现队列 双栈的想法。需要在出栈时转移栈中元素到另一个栈,入栈时转移栈中元素到初始的栈。 class MyQueue { public: stack<int> instack,outstack; MyQueue() { } void push(int x) { while(!o
阅读全文
摘要:哈希表 705.设计哈希集合(模版,开链表) 题解 这是开链表(链表形结构)。 typedef struct LinkedList { struct LinkedList *next; int key; // value,key-value 对。 } ListNode; typedef struct
阅读全文
摘要:
链表部分 1.(链表)707. 设计链表(模版,通过了valgrind测试) 实现单向链表,即每个节点仅存储本身的值和后继节点。除此之外,我们还需要一个哨兵(sentinel)节点作为头节点,和一个 size 参数保存有效节点数。如下图所示。 初始化时,只需创建头节点 head 和 size 即可。
阅读全文
