使用SpeechRecognition进行语音识别
操作系统 : CentOS7.7.1908_x64
gcc版本 :4.8.5
Python 版本 : 3.6.8
安装语音识别环境:
virtualenv -p /usr/bin/python3 py36asr source py36asr/bin/activate pip install SpeechRecognition yum install python3-devel yum install pulseaudio-libs-devel yum install alsa-lib-devel pip install PocketSphinx
配置中文语音识别数据:
下载地址:
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/
选择: Mandarin->cmusphinx-zh-cn-5.2.tar.gz
配置数据:
cd py36asr/lib/python3.6/site-packages/speech_recognition/pocketsphinx-data/ tar zxvf cmusphinx-zh-cn-5.2.tar.gz mv cmusphinx-zh-cn-5.2 zh-cn cd zh-cn mv zh_cn.cd_cont_5000 acoustic-model mv zh_cn.lm.bin language-model.lm.bin mv zh_cn.dic pronounciation-dictionary.dict
测试文本:
自然语言理解和生成是一个多方面问题,我们对它可能也只是部分理解。
语音识别示例:
(py36asr) [root@host60 pyasrTest1]# ls test1.py test1.wav (py36asr) [root@host60 pyasrTest1]# cat test1.py # -*- coding: utf-8 -*- # /usr/bin/python import speech_recognition as sr r = sr.Recognizer() test = sr.AudioFile("test1.wav") with test as source: audio = r.record(source) type(audio) c=r.recognize_sphinx(audio, language='zh-cn') print(c) (py36asr) [root@host60 pyasrTest1]# python test1.py 自然 语言 李杰 和 申城 是一 个 多方 面 问题 我们 对 他 可能 也 只是 部分 礼节 (py36asr) [root@host60 pyasrTest1]#
本文涉及资源下载地址:https://pan.baidu.com/s/1Out0tJlb_Qs-2C06_2YHOQ
可关注微信公众号(聊聊博文)后回复 2020062101 获取提取码。
本文github地址:
https://github.com/mike-zhang/mikeBlogEssays/blob/master/2020/20200621_使用SpeechRecognition进行语音识别.rst
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)