import os
import subprocess
for file in os.listdir('dev1'):
subprocess.run(f'ffmpeg -i dev1/{file} -ar 16000 -ac 1 -c:a pcm_s16le dev/{file}',shell=True)
ASRT模型只处理16k帧率的音频
生成列表文件
import os
import re
import shutil
from pypinyin import pinyin,Style
lst_f=open('E:/ASRT_v1.3.0/datalist/cus250118/val.wav.lst','w',encoding='utf8')
syl_f=open('E:/ASRT_v1.3.0/datalist/cus250118/val.syllable.txt','w',encoding='utf8')
for file in os.listdir('dev'):
trans=os.path.splitext(file)[0].split('_')[1] # 音频文件名 %3d_trans.wav
trans=re.sub(r'\W','',trans)
syllables=[i[0] for i in pinyin(trans,style=Style.TONE3,neutral_tone_with_five=True)]
syllables=' '.join(syllables)
lst_f.write(f'{trans}{file}\n')
syl_f.write(f'{trans}{syllables}\n')
print(file)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现