AI训练与推理芯片
AI训练与推理芯片
- 训练芯片
1.1.云燧T20
基于邃思2.0芯片打造的面向数据中心的第二代人工智能训练加速卡,具有模型覆盖面广、性能强、软件生态开放等特点,可支持多种人工智能训练场景。同时具备灵活的可扩展性,提供业界领先的人工智能算力集群方案。
高密的计算芯片
57.5mm × 57.5mm超大封装尺寸提供高密的澎湃人工智能算力。
强劲的单精算力
最高达40TFLOPS(FP32)、160TFLOPS(TF32)的单精度算力。
先进的堆叠存储
基于HBM2E存储方案,最高可支持64GB容量,1.8TB/s带宽。
灵活的算力扩展
300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案。
邃思2.0芯片基于人工智能领域专用处理器架构设计,提供强劲的全精度人工智能算力、先进的存储方案、灵活的可扩展性,广泛支持视觉、语音语义、强化学习等各技术方向的模型训练。
GCU-CARA 2.0架构
具有完全自主知识产权的通用计算架构,集成领先的计算引擎、数据引擎和互联引擎,提供高密的全精度人工智能算力,广泛支持各类型深度学习模型训练。
先进存储
搭载业界领先的HBM2E存储方案,具备超大存储容量和访存带宽,最高达到64GB和1.8TB/s,高效支持超大规模模型训练。
高速互联
燧原智能互联(GCU-LARE)是专为人工智能训练集群研发的互联技术,提供300GB/s互联带宽,支持数千张云燧加速卡互联,具备优异的线性加速比。
性能表现
参数
1.2.云燧T21
基于OCP(开放计算项目)OAM(开放加速模组)标准设计、兼容OCP OAI标准(开放加速器基础设施)的高性能人工智能训练加速模组,基于邃思2.0芯片打造的,面向数据中心,可广泛应用于互联网、金融、教育、医疗、工业以及政务等行业。
高密的计算芯片
57.5mm × 57.5mm超大封装尺寸提供高密的澎湃人工智能算力。
强劲的单精算力
最高达40TFLOPS(FP32)、160TFLOPS(TF32)的单精度算力。
先进的堆叠存储
基于HBM2E存储方案,最高可支持64GB容量,1.8TB/s带宽。
灵活的算力扩展
300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案。
邃思2.0芯片基于人工智能领域专用处理器架构设计,提供强劲的全精度人工智能算力、先进的存储方案、灵活的可扩展性,广泛支持视觉、语音语义、强化学习等各技术方向的模型训练。
生态开放
基于OCP OAM标准(开放加速模组)
兼容OCP OAI标准(开放加速器基础设施)
提供更高效的服务器和数据中心设计。
高速互联
燧原智能互联(GCU-LARE)是专为人工智能训练集群研发的互联技术,提供300GB/s互联带宽,支持数千张云燧加速卡互联,具备优异的线性加速比。
GCU-CARA 2.0架构
具有完全自主知识产权的通用计算架构,集成领先的计算引擎、数据引擎和互联引擎,提供高密的全精度人工智能算力,广泛支持各类型深度学习模型训练。
性能表现
参数
2. 推理芯片
云燧i10是一款面向云端数据中心的高性能人工智能推理加速卡,可广泛应用于计算机视觉、自然语言处理、语音识别与合成、知识图谱等多类型云端推理场景。
性能表现
参数
3. 软件平台
特性
计算及编程平台
产品应用
CLOUDBLAZER T20
云燧T20是基于邃思2.0芯片打造的面向数据中心的第二代人工智能训练加速卡,具有模型覆盖面广、性能强、软件生态开放等特点,可支持多种人工智能训练场景。同时具备灵活的可扩展性,提供业界领先的人工智能算力集群方案。
CLOUDBLAZER T21
云燧T21是基于OCP(开放计算项目)OAM(开放加速模组)标准设计、兼容OCP OAI标准(开放加速器基础设施)的高性能人工智能训练加速模组,基于邃思2.0芯片打造的,面向数据中心,可广泛应用于互联网、金融、教育、医疗、工业以及政务等行业。
参考链接:https://www.enflame-tech.com/