Whisper 是 OpenAI 开源的强大语音识别模型,支持多语言转写。
本文详细介绍如何在 Linux 环境下离线安装官方 Whisper,如何利用断点续传安全下载大模型,结合 screen 工具实现后台任务管理,避免断线烦恼。
Whisper 依赖 Python3 和 ffmpeg,另外用到 wget 断点续传和 screen 任务管理。
sudo apt update
sudo apt install -y python3 python3-pip ffmpeg wget screen git
python3
和 pip3
:Python环境ffmpeg
:音频处理依赖wget
:断点续传下载工具screen
:后台任务管理神器git
:克隆官方仓库官方提供了 pip 安装方式,简洁快速:
pip3 install git+https://github.com/openai/whisper.git
如果想本地调试,可以克隆仓库安装:
git clone https://github.com/openai/whisper.git
cd whisper
pip3 install -r requirements.txt
python3 setup.py install
建议统一管理模型文件,避免混乱:
mkdir -p /data02/YangXian/whisper/models
Whisper 官方模型体积较大,直接下载容易断线导致失败,推荐用 wget -c
实现断点续传。
模型名称 | 文件大小 | 官方下载链接(示例) |
---|---|---|
tiny | 70MB | https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt |
base | 140MB | https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt |
small | 244MB | https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt |
medium | 740MB | https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt |
large-v2 | 2.9GB | https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt |
创建一个脚本,方便统一批量下载:
#!/bin/bash
MODEL_DIR="/data02/YangXian/whisper/models"
mkdir -p "$MODEL_DIR"
cd "$MODEL_DIR" || exit 1
declare -A models=(
["tiny"]="https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt"
["base"]="https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt"
["small"]="https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt"
["medium"]="https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt"
["large-v2"]="https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt"
)
for name in "${!models[@]}"; do
echo " 开始下载 $name 模型..."
wget -c -O "$name.pt" "${models[$name]}"
done
echo "✅ 所有模型下载完成,存放于 $MODEL_DIR"
运行:
chmod +x download_official_whisper_models.sh
./download_official_whisper_models.sh
模型文件大,下载时间长,推荐使用 screen
管理后台任务,避免中断。
screen -S whisper-download
./download_official_whisper_models.sh
按 Ctrl + A
,然后按 D
,将任务挂起,安全退出。
恢复 session:
screen -r whisper-download
screen -ls
安装好模型后,可直接加载本地模型使用:
import whisper
model = whisper.load_model("/data02/YangXian/whisper/models/medium.pt")
result = model.transcribe("your_audio_file.mp3")
print(result["text"])
以上流程适用于各种 Linux 服务器或本地开发环境,助你轻松完成 Whisper 离线安装及模型管理!
如果觉得本文对你有帮助,欢迎点赞关注留言!一起学习进步 ✨