07 2021 档案
摘要:黑芝麻智能技术 参考链接: https://bst.ai/chip.html
阅读全文
摘要:景嘉微GPU与显卡 图形处理器(GPU)芯片-JM7200 分享: JM7200采用28nm CMOS工艺,支持4K超高清显示,支持4路独立显示输出,支持十屏同时输出,提供多种丰富的外设接口,可高效完成2D、3D图形加速;支持H.264、VC-1、VP8、MPEG2和MPEG4等格式高清视频硬件解码
阅读全文
摘要:华为云服务功能总览 虚拟私有云 虚拟私有云(Virtual Private Cloud,以下简称VPC),为云服务器、云容器、云数据库等资源构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云上资源的安全性,简化用户的网络部署。 您可以在VPC中定义安全组、VPN、IP地址段、带宽等网络特性。用
阅读全文
摘要:国民技术芯片相关产业研发 国民技术股份有限公司——塑造网络社会信息安全DNA,以原始创新技术满足人们安全便捷的网络生活需求。2000年公司成立,是承担国家“909”超大规模集成电路专项工程的集成电路设计企业之一。2010年4月在深圳创业板上市,股票代码300077,是中国上市公司协会副会长单位。我国
阅读全文
摘要:工艺技术:14nm与28nm工艺 中芯国际,用成熟可靠的工艺技术实现日趋精细复杂的芯片设计,从而让产品在具备更高性能和更低功耗的同时,实现芯片尺寸的优化。 为了满足全球客户的不同需求,提供0.35微米到14纳米制程工艺设计和制造服务,包括逻辑电路、混合信号/CMOS射频电路、高压电路、系统级芯片、闪
阅读全文
摘要:地平线 征程® 3 新一代高性能车规级 AI 芯片 征程3 是地平线基于自研的BPU2.0 架构,针对高级别辅助驾驶场景推出的新一代高效能车规级 AI 芯片,已通过 AEC-Q100 认证。征程3 不仅支持基于深度学习的图像检测、分类、像素级分割等功能;也支持对 H.264 和 H.265 视频格式
阅读全文
摘要:C-V2X现场解析 1. 什么是C-V2X? 5G时代万物将互联,人与人、人与物、物与物可以通过无线网络进行连接,C-V2X车联网技术也逐渐成为了主流。 C-V2X means Cellular Vehicle-to-Everything,是基于蜂窝网络的车用无线通信技术。V2X早期主要是基于DSR
阅读全文
摘要:Clang:LLVM 的 C 语言家族前端 Clang 项目为LLVM 项目的 C 语言家族(C、C++、Objective C/C++、OpenCL、CUDA 和 RenderScript)中,提供了语言前端和工具基础结构。提供了 GCC 兼容的编译器驱动程序 ( clang ) 和 MSVC 兼
阅读全文
摘要:OpenCL™(开放计算语言)概述 异构系统并行编程的开准 OpenCL™(开放计算语言)是一种开放的、免版税的标准,用于对超级计算机、云服务器、个人计算机、移动设备和嵌入式平台中的,各种加速器进行跨平台并行编程。OpenCL 极大地提高了众多市场类别中,广泛应用程序的速度和响应能力,包括专业创意工
阅读全文
摘要:HBM显存与GPU 彻底改变显存技术 低功耗存储芯片,具有超宽通信数据通路和革命性的创新堆叠方案。 信息图:推出高带宽显存 HBM采用垂直堆叠方式和高速信息传输,以创新的小尺寸为用户带来了真正让人振奋的性能。这种内存在显卡中的应用只是个开始,超低功耗和节约空间的特点将掀起业界创新热潮。 创新的 HB
阅读全文
摘要:芯片产品介绍 云端训练芯片 7纳米GPGPU高端自研云端训练芯片 基于全自研通用计算GPGPU芯片,天数智芯的硬件产品聚焦于云端训练及推理,通过丰富全面的自研指令集释放强大的可编程性与应用通用性,提供业界领先的AI算力密度与能效比。 天数智芯片云端训练芯片,聚焦高性能和通用性、灵活性,为人工智能和相
阅读全文
摘要:稀疏矩阵理论与实践 1.稀疏矩阵的优化 l 多线程。使用openmp或者mpi l numanode awareness 特性。把稀疏矩阵的存储均匀地分配到两颗处理器各自的本地内存中,最大程度的利用内存带宽 l 利用硬件cache特性,对矩阵进行分块或矩阵的循环进行限制 l 利用pipeline,多
阅读全文
摘要:EUV极紫外光刻技术 (1)极紫外光 波长为 13.5nm 的极紫外 (EUV) 光刻系统的最新发展,以取代 193i 光刻。为了应对多图案成本上升的趋势,EUV 系统在曝光吞吐量(每小时晶圆数),曝光强度和系统正常运行时间方面已达到生产状态。 如上图所示,业界正在积极开展研发工作,以发布第二代 E
阅读全文
摘要:国内AI与芯片企业列表 72家科技龙头最全名单 一、全球第一 1、 立讯精密,AirPods全球组件供应商龙头 2、 海康威视,连续7年全球视频监控设备第一 3、 京东方,面板全球第一 4、 汇顶科技,指纹芯片全球第一 5、 闻泰科技,全球最大手机代工企业 6、 歌尔股份,电声器件世界第一 7、 亿
阅读全文
摘要:中国软件外包现状对比 软件外包这事情搞了 10 年以上了,觉得有发言权。 2010 年还是学生的时候 5000 块帮学院做了网站,2012 年毕业做自由职业,接小单从几千到一两万的居多,后来和好哥们儿搞工作室接开发的活也差不多。 2012-2014 年创业了做了一个产品,中间为了养活团队,也陆续有做
阅读全文
摘要:GPU指令集技术分析 本文将两篇文章整理了一下。 参考文章链接如下: https://zhuanlan.zhihu.com/p/391238629 https://zhuanlan.zhihu.com/p/166180054 一.GPGPU- 指令执行设计 本节主要内容: GPGPU指令执行简介 G
阅读全文
摘要:寒武纪智能系统参数 思元290 MLU290-M5智能加速卡 MLU290-M5 MLU290-M5智能加速卡搭载寒武纪首颗训练芯片思元290,采用台积电7nm先进制程工艺,采用MLUv02扩展架构,集成了高达460亿的晶体管。MLU290-M5智能加速卡采用开放加速模块OAM设计,具备64个MLU
阅读全文
摘要:TVM量化路线图roadmap INT8量化方案 本文介绍了量化过程的原理概述,提出了在TVM中实现量化过程的建议。 l 介绍量子化的背景知识 l INT8量化-后端代码生成 l 这个线程只 量子开发 基于搜索的自动量化 提出了一种新的量化框架,将硬件和训练方法结合起来。 借鉴已有的一些量化框架的思
阅读全文
摘要:EUV光刻机市场与技术 EUV光刻机市场 EUV光刻机已经成为芯片制造的支柱,台积电和三星等晶圆厂这几年不断追逐5nm和3nm等先进工艺,本身就是EUV光刻机采购大户,再加上现在这几大晶圆厂纷纷扩产建厂,无疑又加大了对EUV光刻机的需求。 除了晶圆厂等逻辑厂商之外,存储厂商也逐渐来到光刻机采用阶段,
阅读全文
摘要:低数值精度推理和训练 介绍 如今,大多数商业深度学习应用程序使用 32 位浮点精度 ( ) 来处理训练和推理工作负载。各种研究人员已经证明,深度学习训练和推理都可以以较低的数值精度进行,使用 16 位乘法器进行训练,使用 8 位乘法器进行推理,精度损失最小甚至没有。使用这些较低的数值精度(使用累积到
阅读全文
摘要:FinFET与芯片制程 芯片制造商已经在基于 10nm 和/或 7nm finFET 准备他们的下一代技术了,但我们仍然还不清楚 finFET 还能坚持多长时间、用于高端设备的 10nm 和 7nm 节点还能延展多久以及接下来会如何。 在 5nm、3nm 以及更小节点,半导体行业还面临着巨大的不确定
阅读全文
摘要:LLVM Backend技术 LLVM编译器介绍 LLVM 是一个编译器基础设施的设计与实现,具有独特的多阶段优化系统。广泛支持过程间和配置文件驱动的优化,同时对于商业编译器系统也十分高效。 LLVM 虚拟指令集把系统作为一个整体关联到一起,使用高级的类型信息,来做低级的系统表象,支持链接时和链接后
阅读全文
摘要:安霸Ambarella CV系列芯片 关于Ambarella(安霸半导体) Ambarella 的产品广泛应用于人类和计算机视觉领域,包括视频安防、高级驾驶辅助系统(ADAS)、电子后视镜、行车记录仪、驾驶员及舱内智能监控、汽车无人驾驶和机器人应用等。Ambarella 的低功耗处理器可用于智能摄像
阅读全文
摘要:3D卷积,代码实现 三维卷积:理解+用例-发现 在图像卷积神经网络内核中,包含3D卷积及其在3D MNIST数据集上的实现。 什么是卷积? 从数学上讲,卷积是一种积分函数,表示一个函数g在另一个函数f上移动时的重叠量。 直觉地说,卷积就像一个混合器,将一个函数与另一个函数混合在一起,在保留信息的同时
阅读全文
摘要:TVM darknet yolov3算子优化与量化代码的配置方法 使用以下接口函数 l tvm.relay.optimize l quantize.quantize 实际代码: # convert nnvm to relay print("convert nnvm symbols into rela
阅读全文
摘要:英特尔 QLC 3D NAND 数据存储 NAND是什么 由于SSD固态硬盘的普及,NAND这个词逐渐进入用户们的视线。许多厂商都在产品宣传中提到3D NAND颗粒等词汇,对于普通用户来讲,完全不知道这个词是什么意思,只是有一种不明觉厉的感觉,今天我们就来了解一下什么是NAND。 要了解NAND,首
阅读全文
摘要:Graph Representation 图神经网络 图表示学习(representation learning)——图神经网络框架,主要涉及PyG、DGL、Euler、NeuGraph和AliGraph五个框架。除了NeuGraph没有开源外,其它框架都已开源。 PyG DGL Euler Neu
阅读全文
摘要:TensorFlow算子融合 TensorFlow的特点: 真正的可移植性 引入各种计算设备的支持,包括CPU,GPU,以及能够很好的运行在各种系统的移动端 多语言支持 支持C++,python,R语言等 高度的灵活性和效率 边学习边体验 支持 由谷歌提供支持,谷歌希望其可以成为机器学习研究和开发人
阅读全文
摘要:HBM2E Flashbolt--提升人工智能的算力 加速、扩展和确保超级计算和人工智能技术 超级计算和基于人工智能的技术的进步需要最高口径的内存,以满足行业对带宽、容量和效率的需求。HBM2E Flashbolt 可以提升人工智能的算力,通过扩展的容量处理更多的大数据,并提供高带宽。 高性能计算的
阅读全文
摘要:SoC(System on chip)与NoC(network-on-chip) NoC是相对于SoC的新一代片上互连技术,要深入了解NoC必须深刻认识SoC,故本文组织结构为: l SoC架构 l SoC的局限性 l SoC设计流程 l NoC架构 l NOC架构优势 l NoC 和 SoC 的区
阅读全文
摘要:有了NPU,还要DSP吗? 其实都是针对某种算法进行加速的处理器,不过NPU针对的是那些神经元算法,DSP针对的是信号处理算法,二者各有侧重 NPU采用普林斯顿结构。 DSP采用哈弗结构。 各自有自己的指令系统。 DSP是专注数字信号处理的,即使DSP处理器其实也是分了很多针对不同类型的信号的不同型
阅读全文
摘要:视频软编码与硬编码 视频硬编码和软编码的区别 在Android系统下视频编码有硬编和软编两种方式。顾名思义,硬编是通过手机提供的硬件模块进行编码;软编就是通过软件程序进行编码。硬编的好处是编码快,不占用CPU资源。缺点是Android机型比较多,坑也比较多。软编正好与硬编相反,优点是无论什么机型都一
阅读全文
摘要:ResNet50结构 ResNet简介 随着网络的加深,出现了训练集准确率下降的现象,可以确定这不是由于Overfit过拟合造成的(过拟合的情况训练集应该准确率很高);针对这个问题提出了一种全新的网络,称为深度残差网络,允许网络尽可能的加深,其中引入了全新的结构如图。 残差指的是什么? 其中ResN
阅读全文
摘要:GCC编译器 GCC(GNU Compiler Collection,GNU编译器套装),一套由GNU开发的编程语言编译器。一套GNU编译器套装以GPL及LGPL许可证所发行的自由软件,也是GNU计划的关键部分,亦是自由的类Unix及苹果电脑Mac OS X操作系统的标准编译器。GCC原名为GNU
阅读全文
摘要:llvm常见问题 (FAQ) License 可以修改 LLVM 源代码并重新分发修改后的源代码吗? 可以修改 LLVM 源代码并重新分发基于二进制文件或其它工具,而无需重新分发源代码吗? 源代码 LLVM 是用什么语言编写的? LLVM 源代码的可移植性如何? 使用什么 API,将值存储到 LLV
阅读全文
摘要:交叉编译工具链 配置 主机操作系统 Win10企业版 虚拟机软件 Vmware@workstation 10.0.4 build 2249910 虚拟机操作系统 Win7 32bit 旗舰版 Ubuntu 14.04 LTS(GNU/Linux 3.13.0-24-generic i686) 控制台
阅读全文
摘要:QNX Hypervisor管理程序 借助 QNX® 管理程序,可以将具有不同操作系统,不同可靠性和安全要求的多个嵌入式系统,整合到单个片上系统 (SoC) 中。可以轻松地将未修改的代码移动到最新的硬件上,只需在适当配置的hypervisor 管理程序虚拟机中运行。 可以使用 Android 和 L
阅读全文
摘要:DSP与CEVA芯片 dsp芯片的特点 通常来说dsp芯片的程序和数据是分开存放的,内部存在快速的RAM,可以通过数据总线同时访问指令和数据。Dsp芯片支持无开销循环及跳转的硬件,能够并行执行多个操作,像取指、译码等,可以重复操作,具有稳定性好、精度高、大规模集成性等多个优点。不过功率消耗大,成本高
阅读全文