人工智能实验----语音识别---语音特征提取

人工智能实验----语音识别

1、环境介绍

环境 版本
python python 3.10.6
pip pip 24.0
编辑器 pycharm2023.3.2(专业版)

2、配置环境

​ 首先我们打开编辑器pycharm创建一个新的工程。

[!NOTE]

可以创建一个新的工程,当然也可以在以前的工程的基础上继续做。如果要在以前的工程上继续做请看下一步。

图1

然后点击创建,等待编辑器准备好项目就行

1、下载需要的库

1、如果你设置了pip的镜像源就请看下一步,如果没有就按照下面的步骤来做。

​ 按住键盘上的Win+R打开运行框,输入cmd,然后在命令提示符窗口中输入

python --version

如果出现以下显示则继续

图2

然后继续输入

pip --version

出现以下显示继续

在这里插入图片描述

到这里你的python和pip都是正常的话就继续

[!NOTE]

这里的pip是python自带的工具,你可以简单这么理解,这个东西就是用来下载库的

然后输入下面命令配置pip的镜像源

[!NOTE]

pip镜像源会加快你的下载速度,有些库文件非常大,服务器在国外下载会非常的慢

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/

上面的镜像源我配置的是清华的,也可以配置其他的,只需要把后面的网址换掉就行,下面我列出常用的镜像源地址

名称 地址
清华 https://pypi.tuna.tsinghua.edu.cn/simple/
阿里云 http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
上海交通大学 https://mirror.sjtu.edu.cn/pypi/web/simple/
豆瓣 http://pypi.douban.com/simple/

配置好全局镜像源之后我们就要在我们的项目中进行下载

2、在项目中下载库

​ 这里我把这个实验需要的库列出来

库名 下载命令
numpy pip install numpy
matplotlib pip install matplotlib
scipy pip install scipy
python_speech_features pip install python_speech_features

我们打开刚才创建好的项目,然后在最下面找到终端,单击
在这里插入图片描述

然后在里面输入上面表格和中的下载命令,等待下载完成

[!NOTE]

一定要一条输完之后回车等待下载完成之后再输入下一条命令

下载完成之后我们输入

pip list

检查是否下载完成

在这里插入图片描述

我这里已经下载好了就不展示了。

到这里环境就配置好了

3、写代码

在项目的下面创建一个python文件,这里需要写我们需要的实验代码

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc,logfbank

sampling_freq, signal = wavfile.read('2.wav')
signal = signal[:10000]
features_mfcc = mfcc(signal,sampling_freq)
print('\nnMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])
features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')
features_fb = logfbank(signal,sampling_freq)
print('\nnMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])
features_fb = features_fb.T
plt.matshow(features_fb)
plt.title('Filter bank')
plt.show()

我们需要一个格式为wav的音频,这个音频上网站自己去找。记得把音频文件的名字改为“2.wav”

然后运行程序就出来了!!

在这里插入图片描述

4、实验总结

​ 在这个实验中也许我们并不是能找到wav格式的音频,但是我们可以使用soundfile这个库文件进行转换为wav格式的音频文件。

​ 在配置环境的时候,前提是你的电脑上要求要有python环境,而且你的pip是正常使用的。在下载库的时候建议使用镜像源,如果不想设置全局镜像源的话可以在命令的后边加上 -i 镜像源地址,例如

pip install numpy -i http://mirrors.aliyun.com/pypi/simple/

求要有python环境,而且你的pip是正常使用的。在下载库的时候建议使用镜像源,如果不想设置全局镜像源的话可以在命令的后边加上 -i 镜像源地址,例如

pip install numpy -i http://mirrors.aliyun.com/pypi/simple/

这样就可以每次都是用不同的镜像源。

posted @ 2024-03-25 18:15  xmnb  阅读(70)  评论(0)    收藏  举报