torchvision简介
摘要:训练声纹识别模型时,发现需要引入torchvision,找到一篇博客介绍较为详细,转载一下:https://blog.csdn.net/frighting_ing/article/details/121863387
阅读全文
语音信号的时域、频域理解以及时域图、频谱图和语谱图理解
摘要:参考博客https://blog.csdn.net/Robin_Pi/article/details/109204672
阅读全文
argparse.ArgumentParser()用法解析
摘要:#一、介绍 argparse是python用于解析命令行参数和选项的标准模块。argparse模块的作用是用于解析命令行参数。 最近学习GMM-UBM模型时,需要用到解析命令行参数的程序,目的是在终端窗口(ubuntu是终端窗口,windows是命令行窗口)输入训练的参数和选项。因此记录该随笔方便之
阅读全文
几个声学感知刻度
摘要:https://m.pcwanli.com/front/article/21793.html
阅读全文
latex公式大全
摘要:工具类东西:https://blog.csdn.net/fuchenqianxiao/article/details/124088512
阅读全文
合成带噪声音信号
摘要:通过使用FaNT工具合成:https://blog.csdn.net/qzhou961/article/details/105426440,这个工具没试过,不准备用该工具,尝试自己构建所需要的含噪语音数据集。 ##参照该博客: https://blog.csdn.net/yyhaohaoxuexi/
阅读全文
基于RPCA的语音增强算法在声纹识别中的应用
摘要:个人博客https://blog.csdn.net/ck1798333105/article/details/51218566
阅读全文
声纹识别中有关于LibROSA库提取MFCC特征的过程解析
摘要:个人博客https://blog.csdn.net/qq_37653144/article/details/89045363 python 中Librosa库提取MFCC特征所调用的函数关系图: 注意: ECAPA-TDNN中关于MFCC特征的构建,其实并未使用到MFCC特征,因为ECAPA-TDN
阅读全文
Pytorch之nn.conv1d理解
摘要:官网https://pytorch.org/docs/stable/generated/torch.nn.Conv1d.html?highlight=conv1d#torch.nn.Conv1d 个人博客https://blog.csdn.net/rothschild666/article/deta
阅读全文