✨Whisper 官方版本离线安装及断点续传下载 + screen 后台管理全流程指南

Whisper 官方版本离线安装及断点续传下载 + screen 后台管理全流程指南

Whisper 是 OpenAI 开源的强大语音识别模型,支持多语言转写。
本文详细介绍如何在 Linux 环境下离线安装官方 Whisper,如何利用断点续传安全下载大模型,结合 screen 工具实现后台任务管理,避免断线烦恼。


一、环境准备 ️

Whisper 依赖 Python3 和 ffmpeg,另外用到 wget 断点续传和 screen 任务管理。

sudo apt update
sudo apt install -y python3 python3-pip ffmpeg wget screen git
  • python3pip3:Python环境
  • ffmpeg:音频处理依赖
  • wget:断点续传下载工具
  • screen:后台任务管理神器
  • git:克隆官方仓库

二、安装官方 Whisper

官方提供了 pip 安装方式,简洁快速:

pip3 install git+https://github.com/openai/whisper.git

如果想本地调试,可以克隆仓库安装:

git clone https://github.com/openai/whisper.git
cd whisper
pip3 install -r requirements.txt
python3 setup.py install

三、创建模型存储目录

建议统一管理模型文件,避免混乱:

mkdir -p /data02/YangXian/whisper/models

四、断点续传下载官方 Whisper 模型文件

Whisper 官方模型体积较大,直接下载容易断线导致失败,推荐用 wget -c 实现断点续传。

模型名称 文件大小 官方下载链接(示例)
tiny 70MB https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt
base 140MB https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt
small 244MB https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt
medium 740MB https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt
large-v2 2.9GB https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt

下载脚本示例

创建一个脚本,方便统一批量下载:

#!/bin/bash

MODEL_DIR="/data02/YangXian/whisper/models"
mkdir -p "$MODEL_DIR"
cd "$MODEL_DIR" || exit 1

declare -A models=(
  ["tiny"]="https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt"
  ["base"]="https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt"
  ["small"]="https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt"
  ["medium"]="https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt"
  ["large-v2"]="https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt"
)

for name in "${!models[@]}"; do
  echo " 开始下载 $name 模型..."
  wget -c -O "$name.pt" "${models[$name]}"
done

echo "✅ 所有模型下载完成,存放于 $MODEL_DIR"

运行:

chmod +x download_official_whisper_models.sh
./download_official_whisper_models.sh

五、使用 screen 管理后台下载任务

模型文件大,下载时间长,推荐使用 screen 管理后台任务,避免中断。

  1. 创建 screen 会话:
screen -S whisper-download
  1. 运行下载脚本:
./download_official_whisper_models.sh
  1. Ctrl + A,然后按 D,将任务挂起,安全退出。

  2. 恢复 session:

screen -r whisper-download
  1. 查看所有 session:
screen -ls

六、Python 调用官方 Whisper 本地模型示例

安装好模型后,可直接加载本地模型使用:

import whisper

model = whisper.load_model("/data02/YangXian/whisper/models/medium.pt")

result = model.transcribe("your_audio_file.mp3")
print(result["text"])

七、总结

  • 环境准备齐全,安装 Python、ffmpeg、wget、screen
  • 采用官方 Whisper,保证稳定与兼容
  • 使用断点续传,避免下载中断导致失败
  • 利用 screen 实现后台稳定运行
  • 简洁 Python 调用示例快速上手

以上流程适用于各种 Linux 服务器或本地开发环境,助你轻松完成 Whisper 离线安装及模型管理!


如果觉得本文对你有帮助,欢迎点赞关注留言!一起学习进步 ✨

你可能感兴趣的:(python,人工智能,whisper)