随笔分类

随笔档案

阅读排行榜

随笔分类 - 声纹识别

torchvision简介
摘要：训练声纹识别模型时，发现需要引入torchvision，找到一篇博客介绍较为详细，转载一下：https://blog.csdn.net/frighting_ing/article/details/121863387 阅读全文

posted @ 2023-03-31 14:28 恩格拉拉里克阅读(66) 评论(0) 推荐(0) 编辑
语音信号的时域、频域理解以及时域图、频谱图和语谱图理解
摘要：参考博客https://blog.csdn.net/Robin_Pi/article/details/109204672 阅读全文

posted @ 2023-03-22 09:42 恩格拉拉里克阅读(180) 评论(0) 推荐(0) 编辑
argparse.ArgumentParser()用法解析
摘要：#一、介绍 argparse是python用于解析命令行参数和选项的标准模块。argparse模块的作用是用于解析命令行参数。最近学习GMM-UBM模型时，需要用到解析命令行参数的程序，目的是在终端窗口(ubuntu是终端窗口，windows是命令行窗口)输入训练的参数和选项。因此记录该随笔方便之阅读全文

posted @ 2023-02-24 10:47 恩格拉拉里克阅读(209) 评论(0) 推荐(0) 编辑
几个声学感知刻度
摘要：https://m.pcwanli.com/front/article/21793.html 阅读全文

posted @ 2023-02-23 19:01 恩格拉拉里克阅读(18) 评论(0) 推荐(0) 编辑
latex公式大全
摘要：工具类东西：https://blog.csdn.net/fuchenqianxiao/article/details/124088512 阅读全文

posted @ 2023-02-22 10:06 恩格拉拉里克阅读(59) 评论(0) 推荐(0) 编辑
合成带噪声音信号
摘要：通过使用FaNT工具合成：https://blog.csdn.net/qzhou961/article/details/105426440，这个工具没试过，不准备用该工具，尝试自己构建所需要的含噪语音数据集。 ##参照该博客： https://blog.csdn.net/yyhaohaoxuexi/ 阅读全文

posted @ 2023-02-17 16:19 恩格拉拉里克阅读(86) 评论(0) 推荐(0) 编辑
基于RPCA的语音增强算法在声纹识别中的应用
摘要：个人博客https://blog.csdn.net/ck1798333105/article/details/51218566 阅读全文

posted @ 2023-02-16 20:58 恩格拉拉里克阅读(23) 评论(0) 推荐(0) 编辑
声纹识别中有关于LibROSA库提取MFCC特征的过程解析
摘要：个人博客https://blog.csdn.net/qq_37653144/article/details/89045363 python 中Librosa库提取MFCC特征所调用的函数关系图：注意： ECAPA-TDNN中关于MFCC特征的构建，其实并未使用到MFCC特征，因为ECAPA-TDN 阅读全文

posted @ 2023-02-16 20:05 恩格拉拉里克阅读(144) 评论(0) 推荐(0) 编辑
Pytorch之nn.conv1d理解
摘要：官网https://pytorch.org/docs/stable/generated/torch.nn.Conv1d.html?highlight=conv1d#torch.nn.Conv1d 个人博客https://blog.csdn.net/rothschild666/article/deta 阅读全文

posted @ 2023-02-15 15:54 恩格拉拉里克阅读(48) 评论(0) 推荐(0) 编辑

导航

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

随笔分类 - 声纹识别


Copyright © 2025 恩格拉拉里克 Powered by .NET 9.0 on Kubernetes 博客园