人工智能实验----语音识别---语音特征提取

人工智能实验----语音识别

1、环境介绍

环境	版本
python	python 3.10.6
pip	pip 24.0
编辑器	pycharm2023.3.2(专业版)

2、配置环境

首先我们打开编辑器pycharm创建一个新的工程。

[!NOTE]

可以创建一个新的工程，当然也可以在以前的工程的基础上继续做。如果要在以前的工程上继续做请看下一步。

然后点击创建，等待编辑器准备好项目就行

1、下载需要的库

1、如果你设置了pip的镜像源就请看下一步，如果没有就按照下面的步骤来做。

按住键盘上的Win+R打开运行框，输入cmd，然后在命令提示符窗口中输入

python --version

如果出现以下显示则继续

然后继续输入

pip --version

出现以下显示继续

到这里你的python和pip都是正常的话就继续

[!NOTE]

这里的pip是python自带的工具，你可以简单这么理解，这个东西就是用来下载库的

然后输入下面命令配置pip的镜像源

[!NOTE]

pip镜像源会加快你的下载速度，有些库文件非常大，服务器在国外下载会非常的慢

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/

上面的镜像源我配置的是清华的，也可以配置其他的，只需要把后面的网址换掉就行，下面我列出常用的镜像源地址

名称	地址
清华	https://pypi.tuna.tsinghua.edu.cn/simple/
阿里云	http://mirrors.aliyun.com/pypi/simple/
中国科技大学	https://pypi.mirrors.ustc.edu.cn/simple/
上海交通大学	https://mirror.sjtu.edu.cn/pypi/web/simple/
豆瓣	http://pypi.douban.com/simple/

配置好全局镜像源之后我们就要在我们的项目中进行下载

2、在项目中下载库

这里我把这个实验需要的库列出来

库名	下载命令
numpy	pip install numpy
matplotlib	pip install matplotlib
scipy	pip install scipy
python_speech_features	pip install python_speech_features

我们打开刚才创建好的项目，然后在最下面找到终端，单击

然后在里面输入上面表格和中的下载命令，等待下载完成

[!NOTE]

一定要一条输完之后回车等待下载完成之后再输入下一条命令

下载完成之后我们输入

pip list

检查是否下载完成

我这里已经下载好了就不展示了。

到这里环境就配置好了

3、写代码

在项目的下面创建一个python文件，这里需要写我们需要的实验代码

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc,logfbank

sampling_freq, signal = wavfile.read('2.wav')
signal = signal[:10000]
features_mfcc = mfcc(signal,sampling_freq)
print('\nnMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])
features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')
features_fb = logfbank(signal,sampling_freq)
print('\nnMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])
features_fb = features_fb.T
plt.matshow(features_fb)
plt.title('Filter bank')
plt.show()

我们需要一个格式为wav的音频,这个音频上网站自己去找。记得把音频文件的名字改为“2.wav”

然后运行程序就出来了！！

4、实验总结

在这个实验中也许我们并不是能找到wav格式的音频，但是我们可以使用soundfile这个库文件进行转换为wav格式的音频文件。

在配置环境的时候，前提是你的电脑上要求要有python环境，而且你的pip是正常使用的。在下载库的时候建议使用镜像源，如果不想设置全局镜像源的话可以在命令的后边加上 -i 镜像源地址，例如

pip install numpy -i http://mirrors.aliyun.com/pypi/simple/

求要有python环境，而且你的pip是正常使用的。在下载库的时候建议使用镜像源，如果不想设置全局镜像源的话可以在命令的后边加上 -i 镜像源地址，例如

pip install numpy -i http://mirrors.aliyun.com/pypi/simple/

这样就可以每次都是用不同的镜像源。

posted @ 2024-03-25 18:15 xmnb 阅读(70) 评论(0) 收藏举报

刷新页面返回顶部

wznlove