【AI】whisper笔记

地址:https://github.com/openai/whisper

安装python,控制台运行python进入交互式 Python 解释器,表示安装成功。

git clone https://github.com/openai/whisper.git

手动安装ffmpeg,配置环境变量ffmpeg/bin。

vs code 安装code run、和python插件。
终端安装
pip install -U openai-whisper
pip install setuptools-rust

注意: pip install torch, 下载的是cpu版本的
# 需要到pytorch官网按照他的命令下载
    
N卡控制面板-帮助-系统信息-组件-第三行NVCUDA.DLL产品名称里是“CUDA 10.1.0 driver”
安装支持CUDA版本的torch,在pytorch官网找到对应的,https://pytorch.org/
或官网:https://pytorch.org/get-started/previous-versions/
网页搜索“CUDA 10.1”找到:
pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

截取:[
按照官方的一键安装脚本很可能安装不到正确版本的torch,导致运行时报错或者出现CPU跑冒烟而GPU不工作的情况。 作者:NB_XX https://www.bilibili.com/read/cv19274476/?from=search&spm_id_from=333.337.0.0 出处:bilibili
如果已经安装了torch,请先卸载掉
pip uninstall torch
清除pip缓存
pip cache purge
安装支持CUDA版本的torch
pip install torch -f https://download.pytorch.org/whl/torch_stable.html
]

验证CUDA版本和GPU可用:
cmd输入python进入
import torch
torch.__version__
torch.cuda.is_available()

终端到whisper目录执行:
--language Chinese或者zh。 模型:small不加初始提示的话是繁体。tiny最小不准确。base。small。medium。large。
whisper test.wav --model small --language zh --initial_prompt "以下是普通话的句子。"
whisper test.wav --model medium --language zh
whisper 音频001.mp3 --model tiny --language zh --device cuda
whisper 音频001.mp3 --model base --language Chinese --device cuda --initial_prompt "以下是普通话的句子。"
whisper 音频001.mp3 --model small --language zh --device cuda
whisper 音频001.mp3 --model medium --language zh --device cuda

-------------------------------------
 


posted @ 2024-01-10 14:40  lanofsky  阅读(31)  评论(0编辑  收藏  举报