Azure语音转文本服务:智能识别,中英文无缝转换
作用:说话的人说的是英文,那么转换成的文本就是英文的,同理,说话的人说的是中文,那么转换成的文本也就是英文的。
完整可跑通的代码很简单:
import azure.cognitiveservices.speech as speechsdk
def recognize_from_microphone(filename):
# This example requires environment variables named "SPEECH_KEY" and "SPEECH_REGION"
speech_config = speechsdk.SpeechConfig(subscription='SPEECH_KEY',
region='SPEECH_REGION')
auto_detect_source_language_config = speechsdk.languageconfig.AutoDetectSourceLanguageConfig(
languages=["en-US", "zh-CN"])
audio_config = speechsdk.AudioConfig(filename=filename)
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_config=audio_config,
auto_detect_source_language_config=auto_detect_source_language_config)
speech_recognition_result = speech_recognizer.recognize_once_async().get()
print('转换结果:', speech_recognition_result.text)
if __name__ == "__main__":
try:
recognize_from_microphone("1.wav") # 中文语音
recognize_from_microphone("2.wav") # 英文语音
except Exception as ex:
print(ex)
结果:
两个关键参数的获取:
在这里获取:
https://portal.azure.com/#home
对于自动识别的官方文档说明:
https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/language-identification?tabs=once&pivots=programming-language-python
还能设置短语,提高识别精准度:
https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/improve-accuracy-phrase-list?tabs=terminal&pivots=programming-language-python
如何将该参数添加到API中呢?
官方是这么用的:
这样就得提高语音转文字精准度。
这篇分享文章就到这里啦!如果你对文章内容有疑问或想要深入讨论,欢迎在评论区留言,我会尽力回答。同时,如果你觉得这篇文章对你有帮助,不妨点个赞并分享给其他同学,让更多人受益。
想要了解更多相关知识,可以查看我以往的文章,其中有许多精彩内容。记得关注我,获取及时更新,我们可以一起学习、讨论技术,共同进步。
感谢你的阅读与支持,期待在未来的文章中与你再次相遇!
我的微信公众号:【xdub】,欢迎大家订阅,我会同步文章到公众号上。