Azure语音转文本服务:智能识别,中英文无缝转换

作用:说话的人说的是英文,那么转换成的文本就是英文的,同理,说话的人说的是中文,那么转换成的文本也就是英文的。

完整可跑通的代码很简单:

import azure.cognitiveservices.speech as speechsdk

def recognize_from_microphone(filename):

  # This example requires environment variables named "SPEECH_KEY" and "SPEECH_REGION"

  speech_config = speechsdk.SpeechConfig(subscription='SPEECH_KEY',

  region='SPEECH_REGION')

  auto_detect_source_language_config = speechsdk.languageconfig.AutoDetectSourceLanguageConfig(

  languages=["en-US", "zh-CN"])

  audio_config = speechsdk.AudioConfig(filename=filename)

  speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_config=audio_config,

  auto_detect_source_language_config=auto_detect_source_language_config)

  speech_recognition_result = speech_recognizer.recognize_once_async().get()

  print('转换结果:', speech_recognition_result.text)

if __name__ == "__main__":

  try:

    recognize_from_microphone("1.wav") # 中文语音

    recognize_from_microphone("2.wav") # 英文语音

  except Exception as ex:

  	print(ex)

结果:

 

两个关键参数的获取:

 

在这里获取:

https://portal.azure.com/#home

 

 

对于自动识别的官方文档说明:

https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/language-identification?tabs=once&pivots=programming-language-python

 

还能设置短语,提高识别精准度:

https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/improve-accuracy-phrase-list?tabs=terminal&pivots=programming-language-python

 

 

如何将该参数添加到API中呢?

官方是这么用的:

 

这样就得提高语音转文字精准度。

这篇分享文章就到这里啦!如果你对文章内容有疑问或想要深入讨论,欢迎在评论区留言,我会尽力回答。同时,如果你觉得这篇文章对你有帮助,不妨点个赞并分享给其他同学,让更多人受益。

想要了解更多相关知识,可以查看我以往的文章,其中有许多精彩内容。记得关注我,获取及时更新,我们可以一起学习、讨论技术,共同进步。

感谢你的阅读与支持,期待在未来的文章中与你再次相遇!

我的微信公众号:【xdub】,欢迎大家订阅,我会同步文章到公众号上。

posted @ 2024-10-23 14:45  一方_self  阅读(30)  评论(0编辑  收藏  举报