录音转文字SDK哪家强?

最近在做一款录音App,有一个模块是录音转文字功能,于是对比了市面上常见的API,国内做的比较大的主要有讯飞、腾讯、阿里、百度、华为。

讯飞

讯飞在国内做语音SDK是做的比较早的,翻译出来的准确率挺不错的,支持的方言也多,比较成熟。只是价格上比较贵,感觉是最贵的API了,适合对转写要求比较高的用户。
SDK有个缺点就是不能直接给OSS地址,调用他家的SDK必须要上传音频文件。

一共有6种套餐,我给大家介绍其中两种:

套餐三:

1000小时3900元,相当于一小时3.9元,赠送3个方言/语种,使用有效期一年。

套餐六:

10万小时12万元,相当于一小时1.2元,赠送8个方言/语种,使用有效期一年。

他们官网介绍地址:

https://www.xfyun.cn/services/lfasr

腾讯

腾讯依托微信的用户群体,语音转文字也是做的挺不错的,翻译的也很准确,标点符号都能翻译出来,客服服务也好,你问了问题立马打电话给你,SDK调试也方便,有在线调试网页。

支持5小时以内的录音文件进行识别,文件大小不超过512MB,异步返回识别全部结果。识别结果在服务端可保存7天。方言也支持几十种。

他们家分付费跟预付费两种。

预付费,就是购买资源包,有效期是1年

最贵套餐,30万小时,21万人名币,一个小时0.7元

后付费,就是先使用再付费

一个月使用量是30万小时以上,一个小时是0.95元

感觉购买资源包比较划算,搞活动的时候,资源包能便宜到0.6元一个小时。

他们官网介绍地址以及计费说明:

https://cloud.tencent.com/document/product/1093/35686

华为

华为的我没有使用过SDK,官网也没有介绍支持的方言,文件大小限制,转写时间什么的。

华为就是按照小时计费的,最贵的套餐:

20万小时,20万人名币,1块钱1小时,有效期是一年。

他们官网介绍地址以及计费说明:

https://support.huaweicloud.com/productdesc-sis/sis_01_0020.html

阿里云

做的挺专业的,支持的语种也很多,中国国内语言32种(普通话+方言),国外语言32种。他们家分付费跟预付费两种。

预付费,就是购买资源包,有效期是1年

最贵套餐,25万小时,20万人名币,一个小时0.8元

后付费,就是先使用再付费

一个月使用量5000小时以上,一个小时是1.2元

他们官网介绍地址以及计费说明:

https://help.aliyun.com/document_detail/207373.html

百度

百度音频文件转写目前支持的语言有中文普通话和英语。

预付费,就是购买资源包,有效期是1年

最贵套餐,50万小时,30万人名币,一个小时0.6元

后付费,就是先使用再付费

没有使用量的说法,就是一个小时2块钱

他们官网介绍地址以及计费说明:

https://ai.baidu.com/tech/speech

最后总结

从识别准确率、套餐价格、支持语种来说,个人觉得最适合的SDk是阿里跟腾讯,我自己的App也是接的腾讯云,有时间打算把阿里云也接入进来。这样可以两家SDK切换使用。

我自己开发的App名字叫:「楚少录音」,已上架各大应用商店,欢迎大家去体验下载,目前有录音、视频转文字、文字转语音(智能配音)、音频裁剪、音频合并、格式转换、音频裁剪、音频降噪等功能。

首页

官网:

https://luyin.art

posted @ 2022-11-13 23:51  安辉  阅读(565)  评论(0编辑  收藏  举报