摘要: 参考资料: [MLIR] CodeGen Pipeline总结 - 知乎 (zhihu.com) 本文主要以 tensorflow 为例,介绍了其接入 MLIR 后的 CodeGen 过程,以及简要分析了一些现在常用的 CodeGen pipeline。本文是本人在结合博客(Codegen Dial 阅读全文
posted @ 2023-04-23 22:30 多一些不为什么的坚持 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 参考资料: [MLIR] 转换流程详解(以Toy接入为例) - 知乎 (zhihu.com) 在本文中我们使用 toy 语言接入 MLIR,最终转化为 LLVM IR (或目标代码)为例,来讲解 MLIR 的转换流程。具体的流程如下: .toy 源文件 → AST → MLIRGen(遍历AST生成 阅读全文
posted @ 2023-04-23 20:55 多一些不为什么的坚持 阅读(559) 评论(0) 推荐(0) 编辑
摘要: 参考资料: [MLIR] Dialect及Operation详解 - 知乎 (zhihu.com) 2. Dialect 及Operation 2.1Dialect 2.1.1Dialect 是什么? 从源程序到目标程序,要经过一系列的抽象以及分析,通过 Lowering Pass 来实现从一个IR 阅读全文
posted @ 2023-04-23 17:04 多一些不为什么的坚持 阅读(529) 评论(0) 推荐(0) 编辑
摘要: 参考资料: 606-控制冒险的处理 - 第六讲 流水线处理器 | Coursera 阅读全文
posted @ 2023-04-16 22:40 多一些不为什么的坚持 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 7.1.1 存储系统的层次结构 满足对三个指标的要求: 容量大 速度快 价格低 采用多级存储技术,构成多级存储结构层次 多级存储技术是一种计算机存储系统的组织方式,将计算机存储系统划分为多个层次,每个层次的存储介质速度和容量不同,以便在不同的应用场景下提供最优的性能和存储空间。多级存储技术的核心思想 阅读全文
posted @ 2023-04-13 22:19 多一些不为什么的坚持 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 参考资料: (2条消息) 总线结构_「已注销」的博客-CSDN博客 总线结构通常分为单总线和多总线结构两种 单总线结构 将CPU、主存、I/O设备都挂在系统总线上,允许它们之间直接交换信息 优点:结构简单,便于扩充 缺点:所有的信息传送都经过一条总线,形成计算机系统的瓶颈,影响效率 主要应用范围:小 阅读全文
posted @ 2023-04-06 22:48 多一些不为什么的坚持 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 参考资料: 【浅析】CPU中的指令周期、CPU周期和时钟周期 - 知乎 (zhihu.com) 一.指令周期 指令周期:是指计算机从取指到指令执行完毕的时间 计算机执行指令的过程可以分为以下三个步骤: Fetch(取指),也就是从 PC 寄存器里找到对应的指令地址,根据指令地址从内存里把具体的指令, 阅读全文
posted @ 2023-03-28 20:59 多一些不为什么的坚持 阅读(520) 评论(0) 推荐(0) 编辑
摘要: 参考资料: C++类的定义和对象的创建详解 (biancheng.net) 类和对象是 C++ 的重要特性,它们使得 C++ 成为面向对象的编程语言,可以用来开发中大型项目,本节重点讲解类和对象的语法,如果你对它们的概念还不了解,请先阅读《C++类和对象到底是什么意思》。 类是创建对象的模板,一个类 阅读全文
posted @ 2023-03-28 00:06 多一些不为什么的坚持 阅读(478) 评论(0) 推荐(0) 编辑
摘要: 参考资料: 计算机组成原理:结构冒险和数据冒险_結构冒險_OceanStar的学习笔记的博客-CSDN博客 阅读全文
posted @ 2023-03-27 19:05 多一些不为什么的坚持 阅读(68) 评论(0) 推荐(0) 编辑
摘要: 参考资料: 深入浅出CPU流水线工作原理 - 公众号文章汇总 | 宅学部落 (zhaixue.cc) 阅读全文
posted @ 2023-03-25 23:18 多一些不为什么的坚持 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 首先我们介绍直接初始化:编译器使用普通的函数匹配来选择与我们提供的参数最匹配的构造函数。文字描述可能会让你们云里雾里,那我们直接看代码: //先设计这样的一个类 class A{ public: A(){ cout << "A()" << endl; } A(int a){ cout << "A(i 阅读全文
posted @ 2023-03-25 22:03 多一些不为什么的坚持 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 标量打断流水(Scalar Operand Interlock)是指在流水线中,两条指令之间存在数据依赖关系,且第一条指令的执行结果需要在下一条指令中使用,但第一条指令尚未完成时,下一条指令已经进入流水线并开始执行,这种情况称为标量打断流水。 在发生标量打断流水时,为了避免数据错误,需要采取一定的措 阅读全文
posted @ 2023-03-25 02:14 多一些不为什么的坚持 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 参考资料: C++11 shared_ptr智能指针(超级详细) (biancheng.net) c++ 智能指针用法详解 - tenos - 博客园 (cnblogs.com) 第 5 章 智能指针与内存管理 现代 C++ 教程: 高速上手 C++ 11/14/17/20 - Modern C++ 阅读全文
posted @ 2023-03-24 00:54 多一些不为什么的坚持 阅读(484) 评论(0) 推荐(0) 编辑
摘要: 参考资料: C++ 中的 this 指针 | 菜鸟教程 (runoob.com) C++ this指针(直戳本质) (biancheng.net) C++ this指针详解(精辟) (biancheng.net) 在 C++ 中,每一个对象都能通过 this 指针来访问自己的地址。this 指针是所 阅读全文
posted @ 2023-03-23 23:45 多一些不为什么的坚持 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 1、基本介绍 2、什么是内存对齐? C/C++内存对齐详解 - 知乎 (zhihu.com) 3、Tensor的内存布局 参考资料: 推理引擎内存布局方式【推理引擎】Kernel优化第06篇_哔哩哔哩_bilibili 阅读全文
posted @ 2023-03-23 00:02 多一些不为什么的坚持 阅读(43) 评论(0) 推荐(0) 编辑