录音转文字SDK哪家强?
最近在做一款录音App,有一个模块是录音转文字功能,于是对比了市面上常见的API,国内做的比较大的主要有讯飞、腾讯、阿里、百度、华为。
讯飞
讯飞在国内做语音SDK是做的比较早的,翻译出来的准确率挺不错的,支持的方言也多,比较成熟。只是价格上比较贵,感觉是最贵的API了,适合对转写要求比较高的用户。
SDK有个缺点就是不能直接给OSS地址,调用他家的SDK必须要上传音频文件。
一共有6种套餐,我给大家介绍其中两种:
套餐三:
1000小时3900元,相当于一小时3.9元,赠送3个方言/语种,使用有效期一年。
套餐六:
10万小时12万元,相当于一小时1.2元,赠送8个方言/语种,使用有效期一年。
他们官网介绍地址:
腾讯
腾讯依托微信的用户群体,语音转文字也是做的挺不错的,翻译的也很准确,标点符号都能翻译出来,客服服务也好,你问了问题立马打电话给你,SDK调试也方便,有在线调试网页。
支持5小时以内的录音文件进行识别,文件大小不超过512MB,异步返回识别全部结果。识别结果在服务端可保存7天。方言也支持几十种。
他们家分付费跟预付费两种。
预付费,就是购买资源包,有效期是1年
最贵套餐,30万小时,21万人名币,一个小时0.7元
后付费,就是先使用再付费
一个月使用量是30万小时以上,一个小时是0.95元
感觉购买资源包比较划算,搞活动的时候,资源包能便宜到0.6元一个小时。
他们官网介绍地址以及计费说明:
华为
华为的我没有使用过SDK,官网也没有介绍支持的方言,文件大小限制,转写时间什么的。
华为就是按照小时计费的,最贵的套餐:
20万小时,20万人名币,1块钱1小时,有效期是一年。
他们官网介绍地址以及计费说明:
https://support.huaweicloud.com/productdesc-sis/sis_01_0020.html
阿里云
做的挺专业的,支持的语种也很多,中国国内语言32种(普通话+方言),国外语言32种。他们家分付费跟预付费两种。
预付费,就是购买资源包,有效期是1年
最贵套餐,25万小时,20万人名币,一个小时0.8元
后付费,就是先使用再付费
一个月使用量5000小时以上,一个小时是1.2元
他们官网介绍地址以及计费说明:
百度
百度音频文件转写目前支持的语言有中文普通话和英语。
预付费,就是购买资源包,有效期是1年
最贵套餐,50万小时,30万人名币,一个小时0.6元
后付费,就是先使用再付费
没有使用量的说法,就是一个小时2块钱
他们官网介绍地址以及计费说明:
最后总结
从识别准确率、套餐价格、支持语种来说,个人觉得最适合的SDk是阿里跟腾讯,我自己的App也是接的腾讯云,有时间打算把阿里云也接入进来。这样可以两家SDK切换使用。
我自己开发的App名字叫:「楚少录音」,已上架各大应用商店,欢迎大家去体验下载,目前有录音、视频转文字、文字转语音(智能配音)、音频裁剪、音频合并、格式转换、音频裁剪、音频降噪等功能。
官网: