摘要:
一种原始音频的WAVENET小波变换生成模型 本文介绍了WaveNet,一种用于生成原始音频波形的深度神经网络。该模型是完全概率和自回归的,每个音频样本的预测分布以所有先前的样本为条件;尽管如此,还是证明了它可以在每秒数万个音频样本的数据上有效地训练。当应用于文本到语音时,它会产生最先进的表现,人类 阅读全文
摘要:
STFT短时傅立叶变换的局限性分析 认识到傅立叶变换的关键局限性,即:缺乏空间分辨率,或者对于时域信号,缺乏时间分辨率。了解短时傅立叶变换(STFT)背后的逻辑,以克服这一限制。认可STFT中的时间和频率分辨率之间的转换。 傅立叶变换非常善于识别时域信号f(t)的正弦分量。然而,FT的基本构建块复指 阅读全文
摘要:
LOFAR & DEMON 频谱分析 LOFAR (Low frequency analysis and recording)谱可反映信号的非平稳特性,进而可提取信号中的宽带线谱分布特征。但是轴频及其倍频却因为基本上都淹没在低频宽带噪声中而无法直接获取。 而舰船宽带噪声高频段存在调制现象,DEMON 阅读全文
摘要:
机器学习语音处理:滤波器组、梅尔频率倒谱系数 (MFCC) 以及介于两者之间的内容 语音处理在任何语音系统中都起着重要作用,无论是自动语音识别(ASR)还是说话人识别或其他东西。长期以来,梅尔频率倒谱系数 (MFCC) 是非常流行的特征;但最近,过滤器库变得越来越受欢迎。本文将讨论过滤器组和MFCC 阅读全文
摘要:
点对点DDR技术图例 阅读全文
摘要:
LLVM IR代码生成codegen分析 常用指令 1.从源码生成.ll clang main.c -emit-llvm -S -c -o main.ll 2.运行.ll lli main.ll 3.编译汇编 llc main.ll 4.生成dot,得到可视化的DAG llc -view-dag-c 阅读全文
摘要:
(交叉)编译工具链组成部分分析 GUN 交叉编译工具链中有三个核心组件:Binutils、GCC、C库,如果需要支持 Linux,则还有个 Linux kernel headers。在源代码组织上他们是相互独立的,需要单独进行交叉编译。 Binutils:包括一些二进文件相关的工具。 1.主要工具 阅读全文
摘要:
光线曝光系统分析:照明系统+投影物镜 曝光系统:曝光系统包含照明系统(光源加工)和投影物镜(高分辨成像) ,这是光刻机中最昂贵最复杂的部件之一。物镜的性能决定了光刻机的线宽、套刻精度,这是光刻机的核心部件,其技术水平很大程度上代表了光刻机的技术水平。 光刻机照明与投影物镜系统的工作流程图,如图1所示 阅读全文
摘要:
图渲染示例-几何深度学习图分割 1 图分割示例 图分割是对图的每个组成部分,节点或边进行分类的任务,如图1所示。 从较大的语义分段数据集中,提取出了四足数据集,并显示了此任务的真实标签。在这种情况下,每一部分都有属于五种可能类别之一的标签:耳朵,头部,躯干,腿和尾巴。根据此局部级别的信息,生成节点或 阅读全文
摘要:
几何深度学习技术杂谈 计算机视觉的最新进展,主要来自于新颖的深度学习方法,以及基于大量数据来执行特定任务的分层机器学习模型,随之而来的性能提升,引发了其他科学领域类似应用的淘金热。 https://arxiv.org/pdf/1611.08097.pdf 随着深度学习技术的发展,人们已经不满足于将深 阅读全文