华夏芯产品技术概述

GPTX1 CPU

概述：

GPTX1 CPU是华夏芯完全自主知识产权、自主架构的面向嵌入式的高能效CPU核。此CPU核依托Unity指令集，针对先进半导体工艺对微架构和流水线进行了深度优化，能够在相同工艺下达到更高的主频和更高的能效，应用于网络、通讯、数字电视、存储等广泛领域。

GPTX1是华夏芯统一处理器平台（Unity Platform）的第一代产品，具有灵活、可配置的特点。

GPTX2 CPU

概述：

GPTX2 CPU是华夏芯完全自主知识产权的多核处理器IP，支持从单核到四个GPTX2 CPU内核的处理器集群。GPTX2 CPU内核是基于Unity架构的64位超标量处理器，拥有高度优化的3发射流水线，支持混合分支预测和乱序猜测执行。非一致的寄存器堆使超标量流水线能运行到更高的主频，在编译器技术的辅助下，可以对处理器的许多功能部件起到加速的作用。

GPTX2架构基于先进工艺设计，提供卓越的性能和能效比，适合于辅助驾驶系统（ADAS）、机器人、AR/VR、智能监控、边缘计算等嵌入式领域的高性能并行计算应用。

软件开发平台：

GPT软件开发平台由编译系统、模拟器、调试工具、图形化集成开发环境、Linux/RTOS操作系统、基础库和针对应用优化的高级库组成，为用户提供完整的嵌入式软件开发方案。

GSNN

概述：

GSNN主要用于智能手机、智能监控、智能摄像头、智能音箱、智能烟雾探测器、智能ISP、智能物联网、边缘计算等嵌入式人工智能设备中神经网络、图像信号处理和并行DSP算法的计算加速。

GSNN微架构

主要特点:

● 以程序控制下的异构引擎驱动
● 针对高维度张量进行计算加速
● 擅长多任务、多数据并行计算
● 易于编程，创建深度学习生态
● 高性能、低功耗、低成本设计
● 针对DNN,CNN神经网络进行优化
● 针对矩阵和向量计算进行优化

主要加速领域 (华夏芯支持用户定制图像处理和神经网络加速算法库)

系统运营：前后台协同开发与发布神经网络软件

华夏芯第二代AI加速器IP： WNN

概述：

WNN是华夏芯第二代AI加速器IP，除了能够直接加速卷积神经网络，还能够直接运行常见的网络框架，如TensorFlow、Caffe、PyTorch，DarkNet等，支持用户定制化的网络和计算类型
功能特点：

● 数据类型

○ 16位浮点

○ 8位定点

○ 8位/4位整数

● 网络压缩

○ 稀疏矩阵

○ 剪枝

○ 权值共享

● 张量计算

○ Point wise

○ Depth wise

○ 4 dimensions

● 网络层

○ Conv

○ Full connection

○ Pooling

○ Activation

深度学习框架加速

ISP

概述：

支持传统的黑电平校正、坏点校正、帧率变换、去马赛克颜色插值、2D降噪、3D降噪、宽动态HDR、去雾、3A（自动曝光AE、自动白平衡AWB和自动对焦AF）、透镜阴影校正、颜色空间转换、色彩校正、tone mapping、对比度调整、亮度和色度调整、锐度调整、gamma校正、图像缩放、图像切割、测试模板生成和3D景深图实时生成等功能。

针对AI运用，在图像特征数据统计、场景匹配优化、自动图像调优和图像处理算子等方面做了增强。对ISP前端和AI处理器的配合，做了合理的功能划分、处理协同，配合GPT的AI处理器，在视频图像处理AI运用上，可获得很好的的性能、功耗和成本优势。

IP具有灵活的高可定制性，即可满足超低成本运用，也以3D降噪、去雾、宽动态和AI前端图像处理算子等高级功能满足用户更高的图像前处理需求。

其他ISP：

GPT先进的双模RGB-IR sensor双光融合ISP具备图像细节增强、引导滤波、4X4 RGB-IR去马赛克内插、伪彩渲染、图像融合等功能。降低了传统的红外成像方案成本，为基于反射原理的近红外、短波红外成像以及基于热辐射的中波、长波热成像都提供了相应的解决方案。

GPT的可见光RGB和红外双模ISP为安防、face ID、活体检测、图像增强、透雾、火警检测和图像降噪等运用带来高性能、低成本方案，如可用单RGB-IR sensor替代传统的RGB+Mono双摄方案，有效避开了双sensor带来的对模组生产工艺、ISP图像配准、自动对焦、光学防抖等产生的一系列问题。

软件开发平台：

Tuning软件和ISP基础SDK开发包为用户提供完整的ISP软件开发方案。

● 快速部署用户应用到WNN平台，加速过程与GPU相似，对用户基本透明
● 支持动态网络

深度学习网络加速

● 脱离深度学习框架，程序效率（速度和内存占用）更高
● 支持静态网络推理的优化（压缩、剪枝等）

华夏芯第一代AI加速器IP ： GNN

概述：

GNN是华夏芯新一代AI加速器IP，编译器为每个网络构建自定义FPGA位流

功能特点：

● FPGA利用率高，性能优，功耗低

○ 适用于数据中心（超大规模负载的实时AI处理)和嵌入式应用

● 单管道，较低延迟

○ 适用于需要实时性能的应用

○ 视频流对象检测与识别

GNN开发流程

● 在python中定义神经网络：当前，从执行TensorFlow模型中提取；开发中，直接从TensorFlow和Caffe定义生成

● 将Python描述转换为可合成代码

● GNN生成用户滤波器

● 生成可综合HDL、生成xdc文件

● 使用Vivado 生成bit流

SoC芯片平台> GP 3600

GP 3600系列芯片的概况介绍：

基于自主开发的低功耗异构多核DSP芯片，采用先进CMOS工艺量产，支持多指令、硬件多线程、多矢量并行计算，拥有良好的一体化编程和调优环境，便于通过软件定义方式快速实现客户定制化需求，面向智能物联网（AIoT）、嵌入式人工智能（Embedded AI）和软件无线电（LPSDR）等应用领域的芯片级特色平台。

超低功耗端侧物联网暨人工智能主芯片平台与解决方案

芯片系列：GP 3600，GP 3700等

以软件定义方式快速定制超低功耗下的物联网、智能物联网和人工智能方面的典型应用；

以单一芯片方式快速实现目标识别、人脸识别、语音识别、二维码、NB/LORA IoT等产品集成；

主要优势：平台战略、快速定制、在线升级、超低功耗﹑超低成本、高集成度﹑便于维护；

典型应用：工业物联网、智能抄表﹑智能门禁﹑智能消防、智能显示屏、智能音箱、智能会议系统﹑智能家电﹑智能家居、软件无线电、专网通讯等。

SoC芯片平台> GP 8300

概述：

GP8300是面向视觉分析和AI加速计算的高性能SOC，用28nm工艺设计，集成了华夏芯自主Unity架构的4核64位超标量CPU和2核AI专用处理器，适用于辅助驾驶（ADAS）、智能监控、机器人、边缘计算等应用。

GP8300 视觉分析SOC技术规格：

应用场景：

FPGA板卡> 可编程AI加速卡

概述：

这款可编程AI加速器卡具备 FPGA 加速的强大性能和多功能性，可部署华夏芯AI加速器IP（WNN/GNN,直接加速卷积神经网络，直接运行常见的网络框架），为应用和加速器函数开发人员提供了完整的开发工具SDK，节省开发时间，支持在多个平台上重复使用代码。凭借PCIe插槽外形、低功耗和被动式散热器，可以部署在各种服务器上。采用Xilinx® Ultrascale® VU7P /VU9P FPGA 的多功能可编程加速卡，适用于许多细分领域，如大数据分析、人工智能、基因组学、视频转码、网络安全和金融交易等。

应用场景

：

数据中心

基因组学

网络安全

智慧金融

FPGA板卡> 编解码加速卡

概述：

对于H.265/HEVC/VP9编解码处理，FPGA编解码加速卡方案有着完善的功能和preset配置，支持最多的有利于提高画质和降低bitrate的功能，适合各个场景下编解码配置。同时具有灵活部署，易于升级的特点，可根据需求，随时更换成其他协议的编解码功能。非常容易的在同一块FPGA上pipeline部署编解码相关的上下游应用。成本方面，可以显著降低带宽成本、存储成本。

应用场景：

图片转码

视频文件编解码

直播视频编解码

FPGA板卡> 智能网卡

概述：

华夏芯智能网卡提供网络、存储、安全等方面的加速，这些功能从服务器CPU卸载到智能网卡上，能够提升应用程序和虚拟化性能，确保为应用提供最大的处理能力。与此同时，网卡提供异构互联支持，支持不同类型的服务器，也支持不同的运行模式，包括VM、Container或者Bare Metal等，使得服务器部署更灵活，使用更方便。

目的：卸载计算/存储外的功能到网卡上，使得服务器更加专注于计算，更加高效。

● 算法：提供智能分析，智能识别等功能；

● 网络：提供网络转发功能加速，例如QoS，NAT，OVS等；

● 存储：提供存储管理功能加速，例如Dedupe，NVMe等；

● 安全：提供安全辅助功能，包括加解密、深度报文检测等。

好处：

● 低成本：节省服务器CPU资源用于计算，降低TCO；

● 低时延：FPGA网卡处理报文转发，高并发，低时延；

● 易扩展：基于网卡的支持，服务器规模可扩展性更好；

● 异构支持：智能网卡兼容支持不同类型的服务器，不同运行模式；

● 缩短TTM：利用现成的智能网卡，缩短业务TTM时间。

使用场景：

● 云计算：卸载网络及存储管理功能，提高服务器计算速度。

● CDN：卸载网络，数据智能化分析处理。

● 数据检索：提高数据检索性能，包括特征提取、算法匹配、结果分析等；

● 数据挖掘：提高数据深度学习能力，尤其在边缘侧完成算法分析，可以有效缩短时延，减少交互带宽。

● 安防：提供安全辅助功能，包括加解密、深度报文检测等。

● 图像视频分析：基于FPGA实现AI算法，提高处理速度。包括图像视频编解码、人脸识别等。

● 存储管理：分布式存储管理，以及协议转换，支持RoCE、iWARP、NVMe over Fabric, etc.

参考文献链接

http://www.hxgpt.com/index.html

posted @ 2024-05-01 03:58 吴建明wujianming 阅读(55) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· GPU与DSA架构分析

· NPU架构分析与应用

· 转载：【AI系统】NPU 基础

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

历史上的今天：
2023-05-01 AI芯片与SystemVerilog参数化
2022-05-01 马斯克收购推特，完成全新商业帝国拼图
2020-05-01 自动泊车相关的技术
2020-05-01 Darknet_Yolov3模型搭建
2020-05-01 深度学习调参技巧
2020-05-01 芯片内亿万的晶体管制程工艺
2020-05-01 H.265视频编码与技术全析（下）

公告

昵称：吴建明wujianming
园龄： 7年5个月
粉丝： 532
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

吴建明

华夏芯产品技术概述

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论