02 2023 档案
摘要:评估通常是在面对新数据时估计被测系统的性能。为了进行客观的评价,系统输入以前未见过的数据,这些数据有参考注释。然后将系统输出与参考进行比较,以计算其性能的度量。性能意味着什么,以及应该如何测量它可能会因所开发系统的规格和要求而有所不同:我们可以测量精度来反映系统正确分类或检测声音的频率,或者我们可以
阅读全文
摘要:Audio Pattern Recognition includes: audio tagging acoustic scene classification music classification speech emotion classification sound event detecti
阅读全文
摘要:What enables the ImageNet pretrained models to learn useful audio representations, we systematically study how much of pretrained weights is useful fo
阅读全文
摘要:在这里,我们报告了集成预定义的Gabor滤波器和训练有素的卷积神经网络来生成一个更健壮的特征,称为GCNN。典型的CNN架构使用共享权重来过滤接受域,建模频谱的局部特征。这个过滤过程允许我们将2D Gabor滤波器集成到CNN拓扑中。我们对CNN的接受野进行了修改,采用了几个符合Gabor滤波特征的
阅读全文
摘要:自然环境的长时间记录在被动监测动物多样性方面有许多优点。现在,技术的进步使收集的音频远远超过可以收听的音频,因此需要开发可扩展的方法来区分信号和噪声。使用自动物种识别器的计算方法在精度上有所提高,但需要相当多的编码专业知识。环境记录的内容是不受约束的,机器学习所需的标记数据集的创建是一项耗时、昂贵的
阅读全文
摘要:The earlier layers of CNNs are similar to Gabor filters [1], [29]. [1] A. Krizhevsky, I. Sutskever, and G. E. Hinton, “Imagenet classification with de
阅读全文
摘要:2018,GBFB(spectro-temporal Gabor filter bank) 语音鲁棒特征又可以划分为基于统计特征的鲁棒特征和基于听觉机理的鲁棒特征这2大类。 与统计特性的特征不同,基于生物机理的声学特征提取尝试模拟生理器官对语音的感知来描述声学特征,常见的特征有LPCC[6],MFC
阅读全文
摘要:声学数据为生物学、通信、海洋和地球科学等领域提供了科学和工程方面的见解。我们调查了包括深度学习在内的机器学习(ML)在声学领域的最新进展和变革潜力。ML是一个广泛的技术家族,通常基于统计学,用于自动检测和利用数据中的模式。相对于传统的声学和信号处理,ML是数据驱动的。给定足够的训练数据,ML可以发现
阅读全文