摘要:
强烈推荐 《香山源代码剖析》作为入门 Chisel 的教材 —— 2024 / 10 / 12 一年多前接触 Chisel 望 Scala 晦涩不堪的语法而却步。这一年多 Chisel 经过几次大版本更新,特别是切换后端后[1]生成 HDL 代码可读性提升一大截;更有小道消息最新 VCS 新增支持 阅读全文
摘要:
CIM 发展这么多年,RRAM CIM 和 SRAM CIM 各自精彩。前几天 TSMC+新竹清华的张孟凡老师团队在 Science 上发表 RRAM + SRAM CIM 的 Fusion CIM 工作[1]。 Review Digital SRAM CIM 相较其他主流 AI 加速器范式区别不大 阅读全文
摘要:
❗️此坑还没填完 最近 Chisel 改用 CIRCT 的 firtool 作为 FIRRTL 的编译后端,不仅生成 Verilog 可读性上升一大截,速度也快上不少[1]。据说新版本 VCS 也支持 Chisel 了。UC Berkey 技能树点得真是猛 来圣地巡游学习一下著名的 RocketCh 阅读全文
摘要:
❗️此坑还没填完 TODO: GS 组成 point cloud render flow optimize 仓库结构 仓库由 C++/CUDA 和 Python 组成,CUDA 包括 diff-rasterization ,Python 包括 optimize 。CUDA 部分依赖 glm ,只用了 阅读全文
摘要:
忙碌世界外的花园 费曼学习法说,将学习表述给他人效率最高。然伯牙子期难觅,与同门、导师交流,总希望将内容一遍又一遍打磨,而不过多占用他人时间。可我是个急性子,取得小小进展的喜悦多么想表达出来。博客就是我的小小栖息地。 大三上沉迷折腾博客,偶然瞥见数字花园[1]的概念。博客于我就是大花园,我是园丁,博 阅读全文
摘要:
硬件决定上限,软件实现上限。即使是顶尖的硬件也需要匹配优秀的软件栈才能发挥最大功效。如今 Machine Learning Compiler 主要有 Apache TVM 和 MLIR(Multi Level IR) 两种范式。让我们来研究一下 TVM 如何支持新的 backend。 Apache 阅读全文
摘要:
Transistor-level 的 Analogy SRAM CIM 回顾 阅读全文
摘要:
Memristor 阵营目前主要四哥们:ReRAM、FeRAM、PCM、MRAM。 存储器件 横向对比其他存储器件,数据如下图: Memristor 商用成本高 根据2021年的数据[1], PCM 在四哥们里最接近商用,但在价格、能量、容量上主流 NAND 固态碾压四兄弟。21 年人民币对美元汇率 阅读全文
摘要:
这半年,从零开始了科研生活,每天在论文和代码海里摸爬滚打。说自己迈入了科研的大门,那是远远不够格的,现在只是一个门外汉伸长了脖颈想往大门里面巴望。 虽然目前仍是硕果一个没有,但我认为科研是不分大小的。用异于一般的学习思维的考量事物,便可称作科研。于此复盘半年的科研生活和思路,自勉之。 科研生活大致可 阅读全文