华夏芯产品技术概述
华夏芯产品技术概述
GPTX1 CPU
概述:
GPTX1 CPU是华夏芯完全自主知识产权、自主架构的面向嵌入式的高能效CPU核。此CPU核依托Unity指令集,针对先进半导体工艺对微架构和流水线进行了深度优化,能够在相同工艺下达到更高的主频和更高的能效,应用于网络、通讯、数字电视、存储等广泛领域。
GPTX1是华夏芯统一处理器平台(Unity Platform)的第一代产品,具有灵活、可配置的特点。
GPTX2 CPU
概述:
GPTX2 CPU是华夏芯完全自主知识产权的多核处理器IP,支持从单核到四个GPTX2 CPU内核的处理器集群。GPTX2 CPU内核是基于Unity架构的64位超标量处理器,拥有高度优化的3发射流水线,支持混合分支预测和乱序猜测执行。非一致的寄存器堆使超标量流水线能运行到更高的主频,在编译器技术的辅助下,可以对处理器的许多功能部件起到加速的作用。
GPTX2架构基于先进工艺设计,提供卓越的性能和能效比,适合于辅助驾驶系统(ADAS)、机器人、AR/VR、智能监控、边缘计算等嵌入式领域的高性能并行计算应用。
软件开发平台:
GPT软件开发平台由编译系统、模拟器、调试工具、图形化集成开发环境、Linux/RTOS操作系统、基础库和针对应用优化的高级库组成,为用户提供完整的嵌入式软件开发方案。
GSNN
概述:
GSNN主要用于智能手机、智能监控、智能摄像头、智能音箱、智能烟雾探测器、智能ISP、智能物联网、边缘计算等嵌入式人工智能设备中神经网络、图像信号处理和并行DSP算法的计算加速。
GSNN微架构
主要特点:
● 以程序控制下的异构引擎驱动
● 针对高维度张量进行计算加速
● 擅长多任务、多数据并行计算
● 易于编程,创建深度学习生态
● 高性能、低功耗、低成本设计
● 针对DNN,CNN神经网络进行优化
● 针对矩阵和向量计算进行优化
主要加速领域 (华夏芯支持用户定制图像处理和神经网络加速算法库)
系统运营:前后台协同开发与发布神经网络软件
华夏芯第二代AI加速器IP: WNN
概述:
WNN是华夏芯第二代AI加速器IP,除了能够直接加速卷积神经网络,还能够直接运行常见的网络框架,如TensorFlow、Caffe、PyTorch,DarkNet等,支持用户定制化的网络和计算类型
功能特点:
● 数据类型
○ 16位浮点
○ 8位定点
○ 8位/4位整数
● 网络压缩
○ 稀疏矩阵
○ 剪枝
○ 权值共享
● 张量计算
○ Point wise
○ Depth wise
○ 4 dimensions
● 网络层
○ Conv
○ Full connection
○ Pooling
○ Activation
深度学习框架加速
ISP
概述:
支持传统的黑电平校正、坏点校正、帧率变换、去马赛克颜色插值、2D降噪、3D降噪、宽动态HDR、去雾、3A(自动曝光AE、自动白平衡AWB和自动对焦AF)、透镜阴影校正、颜色空间转换、色彩校正、tone mapping、对比度调整、亮度和色度调整、锐度调整、gamma校正、图像缩放、图像切割、测试模板生成和3D景深图实时生成等功能。
针对AI运用,在图像特征数据统计、场景匹配优化、自动图像调优和图像处理算子等方面做了增强。对ISP前端和AI处理器的配合,做了合理的功能划分、处理协同,配合GPT的AI处理器,在视频图像处理AI运用上,可获得很好的的性能、功耗和成本优势。
IP具有灵活的高可定制性,即可满足超低成本运用,也以3D降噪、去雾、宽动态和AI前端图像处理算子等高级功能满足用户更高的图像前处理需求。
其他ISP:
GPT先进的双模RGB-IR sensor双光融合ISP具备图像细节增强、引导滤波、4X4 RGB-IR去马赛克内插、伪彩渲染、图像融合等功能。降低了传统的红外成像方案成本,为基于反射原理的近红外、短波红外成像以及基于热辐射的中波、长波热成像都提供了相应的解决方案。
GPT的可见光RGB和红外双模ISP为安防、face ID、活体检测、图像增强、透雾、火警检测和图像降噪等运用带来高性能、低成本方案,如可用单RGB-IR sensor替代传统的RGB+Mono双摄方案,有效避开了双sensor带来的对模组生产工艺、ISP图像配准、自动对焦、光学防抖等产生的一系列问题。
软件开发平台:
Tuning软件和ISP基础SDK开发包为用户提供完整的ISP软件开发方案。
● 快速部署用户应用到WNN平台,加速过程与GPU相似,对用户基本透明
● 支持动态网络
深度学习网络加速
● 脱离深度学习框架,程序效率(速度和内存占用)更高
● 支持静态网络推理的优化(压缩、剪枝等)
华夏芯第一代AI加速器IP : GNN
概述:
GNN是华夏芯新一代AI加速器IP,编译器为每个网络构建自定义FPGA位流
功能特点:
● FPGA利用率高,性能优,功耗低
○ 适用于数据中心(超大规模负载的实时AI处理)和嵌入式应用
● 单管道,较低延迟
○ 适用于需要实时性能的应用
○ 视频流对象检测与识别
GNN开发流程
● 在python中定义神经网络:当前,从执行TensorFlow模型中提取;开发中,直接从TensorFlow和Caffe定义生成
● 将Python描述转换为可合成代码
● GNN生成用户滤波器
● 生成可综合HDL、生成xdc文件
● 使用Vivado 生成bit流
SoC芯片平台> GP 3600
GP 3600系列芯片的概况介绍:
基于自主开发的低功耗异构多核DSP芯片,采用先进CMOS工艺量产,支持多指令、硬件多线程、多矢量并行计算,拥有良好的一体化编程和调优环境,便于通过软件定义方式快速实现客户定制化需求,面向智能物联网(AIoT)、嵌入式人工智能(Embedded AI)和软件无线电(LPSDR)等应用领域的芯片级特色平台。
超低功耗端侧物联网暨人工智能主芯片平台与解决方案
芯片系列:GP 3600,GP 3700等
以软件定义方式快速定制超低功耗下的物联网、智能物联网和人工智能方面的典型应用;
以单一芯片方式快速实现目标识别、人脸识别、语音识别、二维码、NB/LORA IoT等产品集成;
主要优势:平台战略、快速定制、在线升级、超低功耗﹑超低成本、高集成度﹑便于维护;
典型应用:工业物联网、智能抄表﹑智能门禁﹑智能消防、智能显示屏、智能音箱、智能会议系统﹑智能家电﹑智能家居、软件无线电、专网通讯等。
SoC芯片平台> GP 8300
概述:
GP8300是面向视觉分析和AI加速计算的高性能SOC,用28nm工艺设计,集成了华夏芯自主Unity架构的4核64位超标量CPU和2核AI专用处理器,适用于辅助驾驶(ADAS)、智能监控、机器人、边缘计算等应用。
GP8300 视觉分析SOC技术规格:
应用场景:
FPGA板卡> 可编程AI加速卡
概述:
这款可编程AI加速器卡具备 FPGA 加速的强大性能和多功能性,可部署华夏芯AI加速器IP(WNN/GNN,直接加速卷积神经网络,直接运行常见的网络框架),为应用和加速器函数开发人员提供了完整的开发工具SDK,节省开发时间,支持在多个平台上重复使用代码。凭借PCIe插槽外形、低功耗和被动式散热器,可以部署在各种服务器上。采用Xilinx® Ultrascale® VU7P /VU9P FPGA 的多功能可编程加速卡,适用于许多细分领域,如大数据分析、人工智能、基因组学、视频转码、网络安全和金融交易等。
应用场景
:
数据中心
基因组学
网络安全
智慧金融
FPGA板卡> 编解码加速卡
概述:
对于H.265/HEVC/VP9编解码处理,FPGA编解码加速卡方案有着完善的功能和preset配置,支持最多的有利于提高画质和降低bitrate的功能,适合各个场景下编解码配置。同时具有灵活部署,易于升级的特点,可根据需求,随时更换成其他协议的编解码功能。非常容易的在同一块FPGA上pipeline部署编解码相关的上下游应用。成本方面,可以显著降低带宽成本、存储成本。
应用场景:
图片转码
视频文件编解码
直播视频编解码
FPGA板卡> 智能网卡
概述:
华夏芯智能网卡提供网络、存储、安全等方面的加速,这些功能从服务器CPU卸载到智能网卡上,能够提升应用程序和虚拟化性能,确保为应用提供最大的处理能力。与此同时,网卡提供异构互联支持,支持不同类型的服务器,也支持不同的运行模式,包括VM、Container或者Bare Metal等,使得服务器部署更灵活,使用更方便。
目的:卸载计算/存储外的功能到网卡上,使得服务器更加专注于计算,更加高效。
● 算法:提供智能分析,智能识别等功能;
● 网络:提供网络转发功能加速,例如QoS,NAT,OVS等;
● 存储:提供存储管理功能加速,例如Dedupe,NVMe等;
● 安全:提供安全辅助功能,包括加解密、深度报文检测等。
好处:
● 低成本:节省服务器CPU资源用于计算,降低TCO;
● 低时延:FPGA网卡处理报文转发,高并发,低时延;
● 易扩展:基于网卡的支持,服务器规模可扩展性更好;
● 异构支持:智能网卡兼容支持不同类型的服务器,不同运行模式;
● 缩短TTM:利用现成的智能网卡,缩短业务TTM时间。
使用场景:
● 云计算:卸载网络及存储管理功能,提高服务器计算速度。
● CDN:卸载网络,数据智能化分析处理。
● 数据检索:提高数据检索性能,包括特征提取、算法匹配、结果分析等;
● 数据挖掘:提高数据深度学习能力,尤其在边缘侧完成算法分析,可以有效缩短时延,减少交互带宽。
● 安防:提供安全辅助功能,包括加解密、深度报文检测等。
● 图像视频分析:基于FPGA实现AI算法,提高处理速度。包括图像视频编解码、人脸识别等。
● 存储管理:分布式存储管理,以及协议转换,支持RoCE、iWARP、NVMe over Fabric, etc.
参考文献链接
http://www.hxgpt.com/index.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2023-05-01 AI芯片与SystemVerilog参数化
2022-05-01 马斯克收购推特,完成全新商业帝国拼图
2020-05-01 自动泊车相关的技术
2020-05-01 Darknet_Yolov3模型搭建
2020-05-01 深度学习调参技巧
2020-05-01 芯片内亿万的晶体管制程工艺
2020-05-01 H.265视频编码与技术全析(下)