随笔档案「2021年5月」 - kongchung

Architecture All Access：A Tour of Innovation 第一部分 CPU

摘要：我从Intel的微信的公众号了解到这个系列，这上面的有汉化的字幕；第一部分：https://mp.weixin.qq.com/s/27dwNmoc5GNgiIq1-jNMpQ 第二部分：https://mp.weixin.qq.com/s/RZIUgxLc8EHyyVIorkGY2Q 在Intel 阅读全文

posted @ 2021-05-30 21:27 kongchung 阅读(228) 评论(0) 推荐(0)

Understanding Tensorcore Computing Performance of Ampere

摘要：看到下面的白皮书的两段话： https://images.nvidia.com/aem-dam/en-zz/Solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf Using FP16/FP32 mixed-precision 阅读全文

posted @ 2021-05-23 07:13 kongchung 阅读(699) 评论(0) 推荐(0)

Turing Award 2018-深度学习之父

摘要：Yoshua Bengio，蒙特利尔大学教授； Geoffrey Hinton，多伦多大学教授，Google的VP； Yann LeCun，纽约大学教授，Facebook的VP； for conceptual and engineering breakthroughs that have made 阅读全文

posted @ 2021-05-13 21:41 kongchung 阅读(187) 评论(0) 推荐(0)

WW03-20210112-10.24-环-虎跑后山-乾龙路-杨梅岭村-虎跑冷泉-虎跑后山

摘要：阅读全文

posted @ 2021-05-08 23:15 kongchung 阅读(40) 评论(0) 推荐(0)

WW02-20210106-09.60-环-动物园-玉皇山-九曜山-动物园

摘要：阅读全文

posted @ 2021-05-08 22:54 kongchung 阅读(26) 评论(0) 推荐(0)

WW01-20201230-09.07-环-大坞底村-安顶村-大田当-安顶村-大坞底村

摘要：阅读全文

posted @ 2021-05-08 22:52 kongchung 阅读(30) 评论(0) 推荐(0)

寒武纪思元290芯片和MLU290-M5卡

摘要：引言：寒武纪的首个训练芯片：思元290 TSMC 7nm工艺，MLUv2架构；有64个MLU Core，内存使用HBM2的内存，互联方面支持MLU-Link的互联技术；使用思元290做卡是MLU290，本次发布的是MLU290-M5形态的，是Mazzine形态的卡；芯片计算性能：使用MLU 阅读全文

posted @ 2021-05-08 21:56 kongchung 阅读(1527) 评论(0) 推荐(0)

NUMA Domian和NUMA Distance

摘要：1. 交织是什么交织内存主要的目的是通过将内存地址分布在不同的地方进行读写以弥补内存和处理器的速度差；（内存慢）这样的话，从不同的地方进行连续的内存读写，不会在一个地方长时间等待，以提高内存的读写的吞吐；因为不管是控制器，还是通道或者是内存的Bank在连续的读或者写之间，都存在最小的等待时间；阅读全文

posted @ 2021-05-08 17:18 kongchung 阅读(2959) 评论(0) 推荐(0)

Understanding Habana Labs's GPU

摘要：推理卡的Codename是GOYA 计算： 3类计算引擎，TPC,GEMM,DMA，第一个进行向量计算，是主要的引擎，第二个进行矩阵运算，第三个是DMA；最高支持FP32的计算；采用TSMC 16 nm制程；应该是标卡的形态；FHFL-2S，TDP200W；内存： 2 Channel DDR 阅读全文

posted @ 2021-05-08 16:56 kongchung 阅读(241) 评论(0) 推荐(0)

AMD Instinct MI100-首个FP64性能超10TFLOPS的计算卡

摘要：基础参数硬件架构：CDNA 软件栈：ROCm，Radeon Open Compute Platform 互联端口：3条Infinity Fabric 2.0 Host端口：X16 PCIe Gen 4/3 形态：Full High Full Length Dual Slot 制程：7nm 制造商：阅读全文

posted @ 2021-05-08 15:52 kongchung 阅读(589) 评论(0) 推荐(0)

从Infinity Fabric到Infinity Architecture

摘要：1st Gen Infinity Fabric Infinity Fabric简称为IF，是AMD用在第一代的EPYC处理器上的互联的技术。从通信平面看，IF被分为两个部分：第一个是Scalable Data Fabric，也就是数据平面；主要是实现数据流的连通；第二个是Scalable Co 阅读全文

posted @ 2021-05-08 15:49 kongchung 阅读(3121) 评论(0) 推荐(0)

Turing Award 2020-奠定了编译器设计的基础

摘要：获奖理由：for fundamental algorithms and theory underlying programming language implementation and for synthesizing（合成） these results and those of others i 阅读全文

posted @ 2021-05-08 15:31 kongchung 阅读(119) 评论(0) 推荐(0)

05 2021 档案

公告