AI训练与推理芯片

训练芯片

1.1.云燧T20

基于邃思2.0芯片打造的面向数据中心的第二代人工智能训练加速卡，具有模型覆盖面广、性能强、软件生态开放等特点，可支持多种人工智能训练场景。同时具备灵活的可扩展性，提供业界领先的人工智能算力集群方案。

高密的计算芯片

57.5mm × 57.5mm超大封装尺寸提供高密的澎湃人工智能算力。

强劲的单精算力

最高达40TFLOPS（FP32）、160TFLOPS（TF32）的单精度算力。

先进的堆叠存储

基于HBM2E存储方案，最高可支持64GB容量，1.8TB/s带宽。

灵活的算力扩展

300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案。

邃思2.0芯片基于人工智能领域专用处理器架构设计，提供强劲的全精度人工智能算力、先进的存储方案、灵活的可扩展性，广泛支持视觉、语音语义、强化学习等各技术方向的模型训练。

GCU-CARA 2.0架构

具有完全自主知识产权的通用计算架构，集成领先的计算引擎、数据引擎和互联引擎，提供高密的全精度人工智能算力，广泛支持各类型深度学习模型训练。

先进存储

搭载业界领先的HBM2E存储方案，具备超大存储容量和访存带宽，最高达到64GB和1.8TB/s，高效支持超大规模模型训练。

高速互联

燧原智能互联（GCU-LARE）是专为人工智能训练集群研发的互联技术，提供300GB/s互联带宽，支持数千张云燧加速卡互联，具备优异的线性加速比。

性能表现

参数

1.2.云燧T21

基于OCP（开放计算项目）OAM（开放加速模组）标准设计、兼容OCP OAI标准（开放加速器基础设施）的高性能人工智能训练加速模组，基于邃思2.0芯片打造的，面向数据中心，可广泛应用于互联网、金融、教育、医疗、工业以及政务等行业。

高密的计算芯片

57.5mm × 57.5mm超大封装尺寸提供高密的澎湃人工智能算力。

强劲的单精算力

最高达40TFLOPS（FP32）、160TFLOPS（TF32）的单精度算力。

先进的堆叠存储

基于HBM2E存储方案，最高可支持64GB容量，1.8TB/s带宽。

灵活的算力扩展

300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案。

生态开放

基于OCP OAM标准（开放加速模组）

兼容OCP OAI标准（开放加速器基础设施）

提供更高效的服务器和数据中心设计。

高速互联

燧原智能互联（GCU-LARE）是专为人工智能训练集群研发的互联技术，提供300GB/s互联带宽，支持数千张云燧加速卡互联，具备优异的线性加速比。

GCU-CARA 2.0架构

性能表现

参数

2. 推理芯片

云燧i10是一款面向云端数据中心的高性能人工智能推理加速卡，可广泛应用于计算机视觉、自然语言处理、语音识别与合成、知识图谱等多类型云端推理场景。

性能表现

参数

3. 软件平台

特性

计算及编程平台

产品应用

CLOUDBLAZER T20

云燧T20是基于邃思2.0芯片打造的面向数据中心的第二代人工智能训练加速卡，具有模型覆盖面广、性能强、软件生态开放等特点，可支持多种人工智能训练场景。同时具备灵活的可扩展性，提供业界领先的人工智能算力集群方案。

CLOUDBLAZER T21

云燧T21是基于OCP（开放计算项目）OAM（开放加速模组）标准设计、兼容OCP OAI标准（开放加速器基础设施）的高性能人工智能训练加速模组，基于邃思2.0芯片打造的，面向数据中心，可广泛应用于互联网、金融、教育、医疗、工业以及政务等行业。

参考链接：https://www.enflame-tech.com/

posted @ 2021-08-05 06:12 吴建明wujianming 阅读(1623) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

公告

昵称：吴建明wujianming
园龄： 7年5个月
粉丝： 532
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

吴建明

AI训练与推理芯片

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论