摘要: 论文题目:基于SincNet的原始波形说话人识别 代码地址:https://github.com/mravanelli/SincNet/ 论文作者:Mirco Ravanelli, Yoshua Bengio 博客作者:凌逆战 博客地址(引用请注明出处):https://www.cnblogs.co 阅读全文
posted @ 2019-10-24 09:50 凌逆战 阅读(1959) 评论(0) 推荐(1) 编辑
摘要: 论文地址:Some Commonly Used Speech Feature Extraction Algorithms 前言 语言是一种复杂的自然习得的人类运动能力。成人的特点是通过大约100块肌肉的协调运动,每秒发出14种不同的声音。说话人识别是指软件或硬件接收语音信号,识别语音信号中出现的说话 阅读全文
posted @ 2019-10-23 11:37 凌逆战 阅读(11922) 评论(7) 推荐(12) 编辑
摘要: 文章作者:凌逆战 文章地址:https://www.cnblogs.com/LXP-Never/p/11703440.html 回声就是声音信号经过一系列反射之后,又听到了自己讲话的声音,这就是回声。一些回声是必要的,比如剧院里的音乐回声以及延迟时间较短的房间回声;而大多数回声会造成负面影响,比如在 阅读全文
posted @ 2019-10-19 20:16 凌逆战 阅读(57442) 评论(84) 推荐(64) 编辑
摘要: 智能耳机 人机交互 智能音箱 智能听力器 动圈喇叭 DLC 石墨烯 陶瓷单位 吸音材料 阵列式麦克风 声纹传感器 降噪算法 智能听力保护 ANC ANC 降低噪音通常所采用的三种降噪措施,即在声源处降噪、在传播过程中降噪及在人耳处降噪,都是被动的。为了主动地消除噪声,人们发明了“有源消声”这一技术。 阅读全文
posted @ 2019-10-18 20:16 凌逆战 阅读(14663) 评论(4) 推荐(13) 编辑
摘要: 声波相消理论 当两列声波同时在同一媒质中传播并在某处相遇时,任意点上的振动将是二者引起振动的叠加,该现象被称为声波干涉。 若两列声波具有相同频率及固定相位差,当其传播到同一位置时,若出现同相振动则会产生相长干涉,若出现反相振动则会出现相消干涉。 基于声波相消干涉原理来实现噪声能量的抵消,这即为主动噪 阅读全文
posted @ 2019-10-18 10:14 凌逆战 阅读(24713) 评论(18) 推荐(21) 编辑
摘要: 论文题目:ASEGAN:WGAN音频超分辨率 这篇文章并不具有权威性,因为没有发表,说不定是外国的某个大学的毕业设计,或者课程结束后的作业、或者实验报告。 CS230: Deep Learning, Spring 2018, Stanford University, CA. (LateX templ 阅读全文
posted @ 2019-10-16 11:39 凌逆战 阅读(759) 评论(0) 推荐(0) 编辑
摘要: 论文地址:一种用于语音带宽扩展的深度神经网络方法 论文作者:Kehuang Li;Chin-Hui Lee 代码地址:github 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/10932353.html 摘要 本文提出了一种基于深度神经网络(D 阅读全文
posted @ 2019-10-16 09:54 凌逆战 阅读(956) 评论(4) 推荐(0) 编辑
摘要: Markdown是一种纯文本格式的标记语言。通过简单的标记语法,它可以使普通文本内容具有一定的格式,是深受技术人员喜爱的文档编写方式,很多著名的网站如github都对markdown有良好的支持。 优点: 因为是纯文本,所以只要支持Markdown的地方都能获得一样的编辑效果,可以让作者摆脱排版的困 阅读全文
posted @ 2019-10-11 10:56 凌逆战 阅读(499) 评论(0) 推荐(0) 编辑
摘要: 记得刚开始学TensorFlow的时候,那给我折磨的呀,我一直在想这个TensorFlow官方为什么搭建个网络还要画什么静态图呢,把简单的事情弄得麻烦死了,直到这几天我开始接触Pytorch,发现Pytorch是就是不用搭建静态图的Tensorflow版本,就想在用numpy一样,并且封装了很多深度 阅读全文
posted @ 2019-10-08 21:12 凌逆战 阅读(16950) 评论(0) 推荐(41) 编辑
摘要: 作者:凌逆战 博客地址:https:////www.cnblogs.com/LXP-Never/p/11614053.html 从事深度学习的研究者都知道,深度学习代码需要设计海量的数据,需要很大很大很大(重要的事情说三遍)的计算量,以至于CPU算不过来,需要通过GPU帮忙,但这必不意味着CPU的性 阅读全文
posted @ 2019-10-01 20:25 凌逆战 阅读(8722) 评论(0) 推荐(1) 编辑
摘要: 1. 概述 语音是人类之间沟通交流的最直接也是最快捷方便的一种手段,而实现人类与计算机之间畅通无阻的语音交流,一直是人类追求的一个梦想。 伴随着移动智能设备的普及,各家移动设备的厂家也开始在自家的设备上集成了语音识别系统,像Apple Siri、Microsoft Cortana、Google No 阅读全文
posted @ 2019-09-28 12:14 凌逆战 阅读(13630) 评论(4) 推荐(11) 编辑
摘要: 我们以MNIST手写数字识别为例 载入初次训练的模型,再训练 关于compile和load_model()的使用顺序 这一段落主要是为了解决我们fit、evaluate、predict之前还是之后使用compile。想要弄明白,首先我们要清楚compile在程序中是做什么的?都做了什么? compi 阅读全文
posted @ 2019-09-28 08:40 凌逆战 阅读(17003) 评论(7) 推荐(5) 编辑
摘要: Audio Bit Depth Super-Resolution with Neural Networks 能找到PDF,但是不确定是否发表 作者:Thomas Liu、Taylor Lundy、William Qi 博客作者:凌逆战 论文代码:https://github.com/wqi/bdsr 阅读全文
posted @ 2019-09-27 20:29 凌逆战 阅读(744) 评论(0) 推荐(1) 编辑
摘要: 神经网络就是一种特殊的自编码器,区别在于自编码器的输出和输入是相同的,是一个自监督的过程,通过训练自编码器,得到每一层中的权重参数,自然地我们就得到了输入x的不同的表示(每一层代表一种)这些就是特征,自动编码器就是一种尽可能复现原数据的神经网络。 “自编码”是一种数据压缩算法,其中压缩和解压缩过程是 阅读全文
posted @ 2019-09-27 09:26 凌逆战 阅读(3522) 评论(1) 推荐(6) 编辑
摘要: 众所周知神经网络单元是由线性单元和非线性单元组成的,一般神经网络的计算时线性的,而非线性单元就是我们今天要介绍的--激活函数,不同的激活函数得出的结果也是不同的。他们也各有各的优缺点,虽然激活函数有自己的发展历史,不断的优化,但是如何在众多激活函数中做出选择依然要看我们所实现深度学习实验的效果。 这 阅读全文
posted @ 2019-09-26 17:17 凌逆战 阅读(2981) 评论(4) 推荐(9) 编辑
摘要: 机器学习的很多领域中存在很多稀疏矩阵,比如用来表示分类数据的独热编码、用于表示文档中词汇频率的计数编码、用于表示词汇中标准化的单词频率得分的TF-IDF编码。 稀疏矩阵 稀疏矩阵:在矩阵中,若数值中为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律。 稠密矩阵:在矩阵中,若数值中为0的元 阅读全文
posted @ 2019-09-26 11:11 凌逆战 阅读(878) 评论(0) 推荐(0) 编辑
摘要: librosa是一个非常强大的python语音信号处理的第三方库,本文参考的是librosa的官方文档,本文主要总结了一些重要,对我来说非常常用的功能。学会librosa后再也不用用python去实现那些复杂的算法了,只需要一句语句就能轻松实现。 先总结一下本文中常用的专业名词:sr:采样率、hop 阅读全文
posted @ 2019-09-23 20:19 凌逆战 阅读(62069) 评论(20) 推荐(44) 编辑
摘要: 深度神经网络难训练一个重要的原因就是深度神经网络涉及很多层的叠加,每一层的参数变化都会导致下一层输入数据分布的变化,随着层数的增加,高层输入数据分布变化会非常剧烈,这就使得高层需要不断适应低层的参数更新。为了训练好模型,我们需要谨慎初始化网络权重,调整学习率等。 本篇博客总结几种Normalizat 阅读全文
posted @ 2019-09-22 10:11 凌逆战 阅读(7724) 评论(0) 推荐(9) 编辑
摘要: json.loads(json) 把json格式的字符串转为Python数据类型 html_json = json.loads(res.text) json.dumps(python) 把 python 类型 转为 json 类型 json.load(f) 将json文件读取,并转为python类型 阅读全文
posted @ 2019-09-22 10:00 凌逆战 阅读(455) 评论(0) 推荐(0) 编辑
摘要: matlab colormaps 默认颜色图是 parula ,颜色图从左往右数值不断增大。 matplotlib colormap 颜色图在这个位置https://matplotlib.org/3.1.0/tutorials/colors/colormaps.html,由于太杂了,就没有列出来了 阅读全文
posted @ 2019-09-21 19:41 凌逆战 阅读(1709) 评论(0) 推荐(0) 编辑
摘要: 梅尔倒谱系数(Mel-scale FrequencyCepstral Coefficients,简称MFCC)。依据人的听觉实验结果来分析语音的频谱, MFCC分析依据的听觉机理有两个 第一梅尔刻度(Mel scale):人耳感知的声音频率和声音的实际频率并不是线性的,有下面公式 从频率转换为梅尔刻 阅读全文
posted @ 2019-09-21 09:56 凌逆战 阅读(43599) 评论(17) 推荐(38) 编辑
摘要: 一、前言 我想认真写好快速傅里叶变换(Fast Fourier Transform,FFT),所以这篇文章会由浅到细,由窄到宽的讲解,但是傅里叶变换对于寻常人并不是很容易理解的,所以对于基础不牢的人我会通过前言普及一下相关知识。 我们复习一下三角函数的标准式: $$y=A\cos (\omega x 阅读全文
posted @ 2019-09-20 19:18 凌逆战 阅读(46434) 评论(9) 推荐(39) 编辑
摘要: 声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。 通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的对应关系,以此作为模型训练的基础。 案例:画出语音信号的波形和频率分布,(fre 阅读全文
posted @ 2019-09-20 12:28 凌逆战 阅读(9259) 评论(12) 推荐(11) 编辑
摘要: 主要内容: 2、集合 3、元组 4、字典 复习: 字符串和元组一样,只能读不能写。列表和字典可以嵌套任何东西,列表可以嵌套列表 L = list("hello") # L = ['h', 'e', 'l', 'l', 'o'] 集合、字典是无序的;列表、元组、字符串是有序的 集合、字典、列表是可以修 阅读全文
posted @ 2019-09-19 19:09 凌逆战 阅读(794) 评论(0) 推荐(1) 编辑
摘要: 作者:凌逆战 博客园地址:https://www.cnblogs.com/LXP-Never/p/11543152.html char RNN代码来源于https://github.com/hzy46/Char-RNN-TensorFlow 前言 本人在学习char RNN的过程中,遇到了很多的问题 阅读全文
posted @ 2019-09-18 16:09 凌逆战 阅读(2125) 评论(0) 推荐(4) 编辑
摘要: 数据库是一个存储数据的仓库,主要用在:金融机构、游戏网站、购物网站、论坛网站,现在的主流数据库有:MySQL、SQL_Server、Oracle、Mariadb、DB2、MongoDB ... 那么我们在生产环境中,如何选择使用哪个数据库 1. 是否开源 开源软件:MySQL、Mariadb、Mon 阅读全文
posted @ 2019-09-17 18:58 凌逆战 阅读(2692) 评论(0) 推荐(3) 编辑
摘要: 线程 线程是一种多任务编程的方式,可以使用计算机多核资源。线程又被称为轻量级的进程 线程特征 线程是计算机核心分配的最小单位 一个进程可以包含多个线程,线程是进程中的一个成员,线程中改的变量,是进程中的变量。并没有新开辟一个空间 线程也是一个运行过程,也要消耗计算机资源。多个线程共享其进程的资源和空 阅读全文
posted @ 2019-09-17 10:21 凌逆战 阅读(569) 评论(0) 推荐(2) 编辑
摘要: 多任务编程 意义:充分利用计算机的资源提高程序的运行效率 定义:通过应用程序利用计算机多个核心,达到同时执行多个任务的目的 实施方案: 多进程、多线程 并行:多个计算机核心并行的同时处理多个任务 并发:内核在多个任务间不断切换,达到好像内核在同时处理多个任务的运行效果 程序:是一个可执行文件,是静态 阅读全文
posted @ 2019-09-16 15:21 凌逆战 阅读(951) 评论(0) 推荐(1) 编辑
摘要: 网络编程 网络目的 : 数据的传输 网络数据传输是一个复杂的过程 OSI 七层模型 --》 网络通信标准化流程 应用层 : 提供用户服务,具体内容由特定程序规定 表示层 : 数据的压缩优化 会话层 : 建立应用连接,选择传输层服务 传输层 : 提供不同的传输服务,流量控制 网络层 : 路由选择,网络 阅读全文
posted @ 2019-09-15 19:00 凌逆战 阅读(966) 评论(0) 推荐(2) 编辑
摘要: 这篇博客不是一篇讲解原理的博客,这篇博客主要讲解tnesorlfow的RNN代码结构,通过代码来学习RNN,以及讲解time_steps,如果这篇博客没有让你明白time_steps,欢迎博客下面评论交流。 我曾翻阅各大网站,各大博客,他们的对RNN中time_steps的讲解,都没有一个让人醍醐灌 阅读全文
posted @ 2019-09-15 11:10 凌逆战 阅读(4216) 评论(4) 推荐(2) 编辑
摘要: 支持向量机原理 支持向量机要解决的问题其实就是寻求最优分类边界。且最大化支持向量间距,用直线或者平面,分隔分隔超平面。 基于核函数的升维变换 通过名为核函数的特征变换,增加新的特征,使得低维度空间中的线性不可分问题变为高维度空间中的线性可分问题。 线性核函数:linear,不通过核函数进行维度提升, 阅读全文
posted @ 2019-09-12 11:46 凌逆战 阅读(1043) 评论(0) 推荐(0) 编辑
摘要: 语音信号处理一般都要进行主观评价实验和客观评价实验。 主观评价:邀请测听者对语音进行测听,测听者根据语音的质量和可理解性 给出主观意见得分 客观评价:根据算法来衡量语音质量 主观听力测试可能是评估语音质量或语音清晰度最可靠的方法。但是主观评价实验受到以下限制: 需要训练有素的听众 需要消耗更多的时间 阅读全文
posted @ 2019-09-11 17:02 凌逆战 阅读(21881) 评论(11) 推荐(20) 编辑
摘要: 爬取网站的思路 多级页面数据抓取 1、爬取一级页面,提取所需数据+链接,继续跟进 2、爬取二级页面,提取所需数据+链接,继续跟进 3、... 爬虫代码规范书写: 常见的反爬总结 基于User-Agent反爬 一般被关注的变量是userAgent和Referer和Cookie,可以考虑用浏览器中 1、 阅读全文
posted @ 2019-09-11 08:45 凌逆战 阅读(925) 评论(1) 推荐(1) 编辑
摘要: 人工分类 特征1>特征2 输出 0 特征1<特征2 输出 1 案例: 逻辑分类 通过输入的样本数据,基于多元线型回归模型求出线性预测方程。 $$y=w_0+w_1x_1+w_2x_2$$ 但通过线型回归方程返回的是连续值,不可以直接用于分类业务模型,所以急需一种方式使得把连续的预测值->离散的预测值 阅读全文
posted @ 2019-09-10 15:01 凌逆战 阅读(919) 评论(0) 推荐(0) 编辑
摘要: Fiddler抓包工具 配置Fiddler 配置浏览器代理 1、安装Proxy SwitchyOmega插件2、浏览器右上角:SwitchyOmega->选项->新建情景模式->AID1901(名字)->创建 输入 :HTTP:// 127.0.0.1 8888 点击 :应用选项3、点击右上角Swi 阅读全文
posted @ 2019-09-09 16:23 凌逆战 阅读(1216) 评论(0) 推荐(3) 编辑
摘要: 应用场景 1、多进程 :CPU密集程序2、多线程 :爬虫(网络I/O)、本地磁盘I/O 知识点回顾 队列 线程模块 小米应用商店抓取(多线程) 目标 实现步骤 1、确认是否为动态加载 1、页面局部刷新 2、右键查看网页源代码,搜索关键字未搜到,因此此网站为动态加载网站,需要抓取网络数据包分析 2、F 阅读全文
posted @ 2019-09-09 09:54 凌逆战 阅读(1933) 评论(11) 推荐(6) 编辑
摘要: 线性回归 输入x:0.5 0.6 0.8 1.1 1.4 输出y:5.0 5.5 6.0 6.8 7.0 $w_0$和$w_1$是模型参数预测函数:$y=w_0+w_1 x$ 所谓模型训练,就是根据已知的x和y,找到最佳的模型参数$w_0$和$w_1$,尽可能精确地描述出输入和输出的关系。 5.0 阅读全文
posted @ 2019-09-08 15:52 凌逆战 阅读(704) 评论(0) 推荐(0) 编辑
摘要: Web自动化测试工具,可运行在浏览器,根据指令操作浏览器,只是工具,必须与第三方浏览器结合使用,相比于之前学的爬虫只是慢了一点而已。而且这种方法爬取的东西不用在意时候ajax动态加载等反爬机制。因此找标签可以直接F12找,不用确定源码中是否存在。 安装 Linux: sudo pip3 instal 阅读全文
posted @ 2019-09-08 01:14 凌逆战 阅读(8393) 评论(5) 推荐(20) 编辑
摘要: scrapy框架是异步处理框架,可配置和可扩展程度非常高,Python中使用最广泛的爬虫框架。 安装 Ubuntu安装 1、安装依赖包 2、安装scrapy框架 Windows安装 cmd命令行(管理员): python -m pip install Scrapy Scrapy框架五大组件 下载器中 阅读全文
posted @ 2019-09-07 16:20 凌逆战 阅读(1803) 评论(2) 推荐(5) 编辑
摘要: cookie适用于抓取需要登录才能访问的页面网站 cookie和session机制 http协议为无连接协议,cookie: 存放在客户端浏览器,session: 存放在Web服务器 人人网登录案例 方法一:登录网站手动抓取Cookie 1、先登录成功1次,获取到携带登陆信息的Cookie 登录成功 阅读全文
posted @ 2019-09-06 16:19 凌逆战 阅读(6547) 评论(0) 推荐(2) 编辑