05 2021 档案

摘要:我从Intel的微信的公众号了解到这个系列,这上面的有汉化的字幕; 第一部分:https://mp.weixin.qq.com/s/27dwNmoc5GNgiIq1-jNMpQ 第二部分:https://mp.weixin.qq.com/s/RZIUgxLc8EHyyVIorkGY2Q 在Intel 阅读全文
posted @ 2021-05-30 21:27 kongchung 阅读(163) 评论(0) 推荐(0) 编辑
摘要:看到下面的白皮书的两段话: https://images.nvidia.com/aem-dam/en-zz/Solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf Using FP16/FP32 mixed-precision 阅读全文
posted @ 2021-05-23 07:13 kongchung 阅读(369) 评论(0) 推荐(0) 编辑
摘要:Yoshua Bengio,蒙特利尔大学教授; Geoffrey Hinton,多伦多大学教授,Google的VP; Yann LeCun,纽约大学教授,Facebook的VP; for conceptual and engineering breakthroughs that have made 阅读全文
posted @ 2021-05-13 21:41 kongchung 阅读(89) 评论(0) 推荐(0) 编辑
摘要:引言: 寒武纪的首个训练芯片:思元290 TSMC 7nm工艺,MLUv2架构; 有64个MLU Core,内存使用HBM2的内存,互联方面支持MLU-Link的互联技术; 使用思元290做卡是MLU290,本次发布的是MLU290-M5形态的,是Mazzine形态的卡; 芯片计算性能: 使用MLU 阅读全文
posted @ 2021-05-08 21:56 kongchung 阅读(947) 评论(0) 推荐(0) 编辑
摘要:1. 交织是什么 交织内存主要的目的是通过将内存地址分布在不同的地方进行读写以弥补内存和处理器的速度差;(内存慢) 这样的话,从不同的地方进行连续的内存读写,不会在一个地方长时间等待,以提高内存的读写的吞吐; 因为不管是控制器,还是通道或者是内存的Bank在连续的读或者写之间,都存在最小的等待时间; 阅读全文
posted @ 2021-05-08 17:18 kongchung 阅读(2188) 评论(0) 推荐(0) 编辑
摘要:推理卡的Codename是GOYA 计算: 3类计算引擎,TPC,GEMM,DMA,第一个进行向量计算,是主要的引擎,第二个进行矩阵运算,第三个是DMA; 最高支持FP32的计算; 采用TSMC 16 nm制程; 应该是标卡的形态;FHFL-2S,TDP200W; 内存: 2 Channel DDR 阅读全文
posted @ 2021-05-08 16:56 kongchung 阅读(168) 评论(0) 推荐(0) 编辑
摘要:基础参数 硬件架构:CDNA 软件栈:ROCm,Radeon Open Compute Platform 互联端口:3条Infinity Fabric 2.0 Host端口:X16 PCIe Gen 4/3 形态:Full High Full Length Dual Slot 制程:7nm 制造商: 阅读全文
posted @ 2021-05-08 15:52 kongchung 阅读(393) 评论(0) 推荐(0) 编辑
摘要:1st Gen Infinity Fabric Infinity Fabric简称为IF,是AMD用在第一代的EPYC处理器上的互联的技术。 从通信平面看,IF被分为两个部分: 第一个是Scalable Data Fabric,也就是数据平面;主要是实现数据流的连通; 第二个是Scalable Co 阅读全文
posted @ 2021-05-08 15:49 kongchung 阅读(1825) 评论(0) 推荐(0) 编辑
摘要:获奖理由:for fundamental algorithms and theory underlying programming language implementation and for synthesizing(合成) these results and those of others i 阅读全文
posted @ 2021-05-08 15:31 kongchung 阅读(63) 评论(0) 推荐(0) 编辑