11 2023 档案
摘要:图形内存,可编程逻辑阵列,计算分析 内存 1 静态内存(SRAM) SRAM是指静态随机存取存储器,基本SRAM单元包含两个交叉耦合的反相器,如下图所示。相比之下,基本SR触发器或D触发器包含交叉耦合的NAND门。设计如下所示。 SRAM单元的核心包含4个晶体管(每个反相器中有2个),这种交叉耦合布
阅读全文
摘要:图形API和GPU光线追踪分析 阐述目前市面上的几种流行图形API对光线追踪支持的现状和技术。 1 DirectX RayTracing(DXR) DirectX RayTracing(DXR)是DirectX 12引入的用以支持硬件光线追踪的图形API特性集。在最高级别,DXR为DirectX 1
阅读全文
摘要:图形光栅化综合实现分析 当前阶段,光栅化仍然比光线追踪“快”,而光线追踪可以比光栅化更好地处理某些效果,如反射、软阴影、全局照明等。目前通常采用混合射线追踪,例如仅反射使用光线追踪而光栅化其他所有内容(包括主光线)。主流的GPU已基本支持光栅化、计算、光线追踪甚至深度学习等管线混合计算: 确定游戏开
阅读全文
摘要:图形渲染光线追踪技术分析 在几何光学中,可以忽略光线的波动性而直接简化成直线,从而研究光线的物理特性。同样地,在计算机图形学,也可以利用这一特点,以简化光照着色过程。 此外,人类的眼睛接收到的光照信息是有限的像素,大多数人的眼睛在5亿像素左右。人类接收到的图像信息可以分拆成5亿个像素,也就是说,可以
阅读全文
摘要:体素化、有向距离场、光线追踪阴影分析 体素化 对于任意连续的函数f(x,y,z),隐式地将体积定义为f(x,y,z)>0,表面是f(x,y,z)=0的水平集。 只需要一个连续的函数,任意的代数函数、有向距离场(CSG树,在网格三线性采样)、密度函数(在网格三线性采样)。 使用密度(Density)要
阅读全文
摘要:图形渲染隐式函数与采样方式 隐式函数 球体追踪是光线追踪的诸多形式的其中一种,是隐式函数的理想选择,不是光栅化或体素的替代品。很低效,但是很简单,并且非常灵活。球体追踪只需要4步: 构建视图。 只需要两个三角形和UV坐标。相关的代码如下: vec2 screen_coordinates = gl_F
阅读全文
摘要:Linux图形驱动与图形调度分析 Linux图形驱动 Linux图形堆栈在过去几年中经历了许多演变。本节的目的是详细说明这段历史,并给出多年来所做更改背后的理由。今天,设计仍然深深植根于这段历史,本节将解释这段历史,以更好地推动Linux图形堆栈的当前设计。下面简述Linux图形驱动架构涉及的各个模
阅读全文
摘要:RISC-V微控制器与嵌入式系统 Gigadevice GD32VW553 RISC-V微控制器支持WiFi 6和蓝牙5.2 LE Gigadevice GD32VW553是一款适用于物联网应用的新型160MHz RISC-V微控制器,支持WiFi 6(802.11ax)和蓝牙5.2低能耗(LE),
阅读全文
摘要:图形驱动应用分析 1 视频与合成 在运行GFX/视频播放用例(应用程序的视频流类型)时,查看影响英特尔体系结构下UI体验的特定稳定性问题,行为是冻结一个UI,然后是一个黑屏,然后是系统重新启动(当然是在一段随机的时间间隔之后)。 如果3D客户端应用程序“挂起”GPU,则GPU进程可能会被终止,然后G
阅读全文
摘要:显存架构,虚拟与物理内存 一款显卡的结构见下图,包含了GPU(执行所有计算)、视频输出(连接到屏幕)、显存(存储纹理或通用数据)、电源管理(降低电压,调节电流)、主机交互总线(与CPU的通信)等部件: 如今,所有计算机的结构都是类似的:一个中央处理器和许多外围设备。为了交换数据,这些外围设备通过总线
阅读全文
摘要:图形渲染驱动分析 显示驱动程序是允许操作系统与图形硬件一起工作的软件。图形硬件控制显示器,可以是计算机中的扩充卡,也可以内置在计算机的主电路板中(如笔记本电脑),也可以驻留在计算机外部(如Matrox remote graphics units)。每种型号的图形硬件都是不同的,需要一个显示驱动程序来
阅读全文
摘要:RISC-V指令列表分析 本附录列出了 RV32/64I 的所有指令、所有扩展(RVM、RVA、RVF、RVD、 RVC 和 RVV)以及所有伪指令。每个条目都包括指令名称、操作数、寄存器传输级定义、 指令格式类型、中文描述、压缩版本(如果存在),以及一张带有操作码的指令布局图。我 们认为这些摘要对
阅读全文
摘要:RV32-64特权架构分析 10.1 导言 到目前为止,主要关注 RISC-V 对通用计算的支持:我们引入的所有指令都在用 户模式(应用程序的代码在此模式下运行)下可用。本章介绍两种新的权限模式:运行最 可信的代码的机器模式(machine mode),以及为 Linux,FreeBSD 和 Win
阅读全文
摘要:RV64-64位地址指令分析 9.1 导言 图 9.1 至 9.4 是 RV32G 指令集的 64 位版本 RV64G 指令集的图示。由图可见,要切换 到 64 位 ISA,ISA 只添加了少数指令。指令集只添加了 32 位指令对应的字(word),双字 (doubleword)和长整数(long)
阅读全文
摘要:RV32F 和 RV32D单精度和双精度浮点数,乘法和除法指令分析 RV32F 和 RV32D:单精度和双精度浮点数 5.1 导言 尽管 RV32F 和 RV32D 是分开的,单独的可选指令集扩展,他们通常是包括在一起的。 为简洁起见,我们在一章中介绍了几乎所有的单精度和双精度(32 位和 64 位
阅读全文
摘要:RISC-V 汇编语言分析 3.1 导言 图 3.1 表明了从 C 程序翻译成为可以在计算机上执行的机器语言程序的四个经典步骤。 这一章的内容包括了后三个步骤,不过要从汇编语言在 RISC-V 函数调用规范中的作用 开始说起。 图 3.1 从 C 源代码翻译为可运行程序的步骤。这是从逻辑上进行的划分
阅读全文
摘要:RV32I 基本整数指令集分析 RV32I 被设计成足以构建一个编译器目标机,并支持现代操作系统环境。 这个 ISA 也被设计成在最小实现时减少所需的硬件。RV32I 包括了 47 条单独的 指令,虽然某个简单的实现可以使用一条 SYSTEM 硬件指令将 8 条ECALL/EBREAK/CSRR*,
阅读全文
摘要:RISC-V 指令集基本概念 介绍 RISC-V(读音“risk-five”)是一个新的指令集体系结构(ISA),它最初用于支持计算机 体系结构研究和教学,但现在 希望它也成为一个对于工业实现来说标准、免费、开放的 体系结构。 定义 RISC-V 的目的包括: 一个完全开放的 ISA,能够自由地提供
阅读全文
摘要:拓扑微分几何深度学习技术 数学与AI:AI的拓扑几何基础 本次讲座邀请了纽约州立大学石溪分校计算机系帝国创新教授顾险峰老师。 顾险峰: 1994年于清华大学获得计算机科学学士学位,2002年于哈佛大学获得计算机科学博士学位,师从国际著名微分几何大师丘成桐先生。顾博士目前为纽约州立大学石溪分校计算机系
阅读全文
摘要:基于线性余弦变换的实时多边形明暗处理 动机 使用区域灯光进行着色可以为CG渲染添加大量真实感。然而,它需要求解球面方程,这使得实时渲染具有挑战性。在这个项目中,开发了一种新的球形分布,能够实时使用多边形灯光对基于物理的材料进行着色。 为什么多边形明暗处理很复杂? 使用多边形灯光进行着色需要在灯光覆盖
阅读全文
摘要:三角形的生命-NVIDIA的逻辑管道 自从突破性的费米架构发布近5年以来,也许是时候刷新其下的主要图形架构了。费米是第一个实现完全可扩展图形引擎的NVIDIA GPU,其核心架构可以在开普勒和麦克斯韦中找到。 本文关注GPU如何工作的图形,尽管一些原理(如着色器程序代码的执行方式)对于计算是相同的。
阅读全文
摘要:高级计算机体系结构 芯片堆叠DRAM(3D-DRAM) •叠片DRAM: •顶层存储数据 •底层逻辑层存储各种控制、访问和接口电路 •魔法:堆叠表示高 密度,所以高的b/w插入器集成不那么昂贵。 •当前产品: •混合存储立方体(微米) •高带宽内存(三星、AMD和海力士) •权衡: •延迟与DRAM
阅读全文
摘要:主存储器和DRAM SRAM与DRAM •SRAM=静态RAM –只要有电源,数据就会保留 •DRAM=动态RAM –如果什么都不做,就会丢失数据 •SRAM:6T/位 –采用普通高速CMOS技术构建 •DRAM:1T每比特(+1个电容器) –采用针对密度优化的特殊DRAM工艺构建 硬件结构 DRA
阅读全文
摘要:基于Mel谱图和卷积神经网络的音频识别 摘要——近年来,由于其许多潜在的应用,自动声音识别受到了越来越多的研究兴趣。其中包括视频/音频内容的自动标记和机器人的实时声音检测。虽然图像分类是一个研究较多的话题,但声音识别还不太成熟。在这项研究中,利用了为图像分类开发的鲁棒机器学习技术,并将其应用于声音识
阅读全文
摘要:小波变换WAVENET原始音频的生成模型 摘要 本文介绍了WaveNet,一种用于生成原始音频波形的深度神经网络。该模型是完全概率和自回归的,每个音频样本的预测分布以所有先前的样本为条件;尽管如此,还是证明了它可以在每秒数万个音频样本的数据上有效地训练。当应用于文本到语音时,它会产生最先进的表现,人
阅读全文
摘要:low-frequency array (LOFAR)技术分析 基于高频天线产生低频电磁波信号, 实现多波段信号对目标的照射, 不仅有可能减小低频天线尺寸, 而且可能成为提高雷达目标探测性能的一种途径. 本文将多普勒效应与阵列天线结构相结合, 基于对阵列中各辐射单元的信号时序、相位和间距等参数的控制
阅读全文
摘要:主存储器和DRAM技术分析 SRAM与DRAM •SRAM=静态RAM–只要有电源,数据就会保留 •DRAM=动态RAM –如果你什么都不做,你就会丢失数据 •SRAM:6T/位 –采用普通高速CMOS技术构建 •DRAM:1T每比特(+1个电容器) –采用针对密度优化的特殊DRAM工艺构建 硬件结
阅读全文
摘要:内存基础知识概述 •RAM:随机存取存储器 –历史上定义为具有单个位访问的内存阵列 –指同时具有读取和写入功能的内存 •ROM:只读存储器 –没有“在线”内存写入操作的功能 –写入通常需要高电压或紫外线擦除 •内存的波动性 –易失性存储器会随着时间的推移或断电而丢失数据 •RAM易失 –即使断电,非
阅读全文
摘要:基于几何深度学习示例杂谈 几何深度学习模型的典型示例是用于 2D 平面图像的传统 CNN。 虽然许多人可能认为这是一个经典的深度学习模型,但它可以从几何角度进行解释。 事实上,CNN 如此成功的关键原因之一是其架构中编码的几何特性。 下图概述了一个典型的 CNN 架构VGG-16,其中很明显包含了上
阅读全文
摘要:根据连通性矩阵计算图属性 conmat_to_graph管道执行图形分析。 输入数据应该是npy格式的对称一致性矩阵。 # License: BSD (3-clause) # sphinx_gallery_thumbnail_number = 2 import os.path as op impor
阅读全文
摘要:面向程序设计语言LLVM杂谈 如何为特定语言表达式生成 LLVM IR,请搜索接受相应对象的方法。 例如,对于 if-else 语句: IRCodegenVisitor::codegenExprIR Value *IRCodegenVisitor::codegen(const ExprIfElseI
阅读全文