摘要: 机器学习编译课程主要由华盛顿大学计算机系博士生 -- 陈天奇博士讲授,在读博期间,先后带领团队打造了模块化深度学习系统NNVM(2016年)和深度学习编译器TVM(2017年),共同组成了深度学习到各种硬件的完整优化工具链。 英文课程主页 https://mlc.ai/summer22/ 中文课程主 阅读全文
posted @ 2022-06-18 23:07 牛犁heart 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 按照 CPU 功能升级迭代的顺序,CPU 的工作模式有实模式、保护模式、长模式,这几种工作模式下 CPU 执行程序的方式截然不同,下面我们一起来探讨这几种工作模式。 从一段死循环的代码说起 int main() { int* addr = (int*)0; cli(); //关中断 while(1) 阅读全文
posted @ 2022-06-18 09:56 牛犁heart 阅读(1259) 评论(0) 推荐(0) 编辑
摘要: 本节来讲讲 ARM 的 AArch64 体系结构,扩展一下视野。 看看什么是 AArch64 体系,然后分析一下 AArch64 体系有什么特点,最后了解一下 AArch64 体系下运行程序的基础,包括 AArch64 体系下的寄存器、运行模式、异常与中断处理,以及 AArch64 体系的地址空间与 阅读全文
posted @ 2022-06-18 08:37 牛犁heart 阅读(7385) 评论(0) 推荐(0) 编辑
摘要: 本届来看看操作系统下面的硬件层面,重点研究一下 CPU 的原理和它的加速套路。 CPU的原理初探 从操作系统的位置来看,它除了能够向上封装,为软件调用提供 API(也就是系统调用),向下又对硬件资源进行了调度和抽象。我们通常更为关注系统调用,但为了更好地设计实现一个 OS,我们当然也要对硬件足够了解 阅读全文
posted @ 2022-06-18 07:55 牛犁heart 阅读(1061) 评论(0) 推荐(0) 编辑