Retrieval-based-Voice-Conversion-WebUI 使用指南

Retrieval-based-Voice-Conversion-WebUI 使用指南

Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data <= 10 mins! 项目地址: https://gitcode.com/gh_mirrors/ret/Retrieval-based-Voice-Conversion-WebUI

1. 项目介绍

Retrieval-based-Voice-Conversion-WebUI 是一个基于 VITS 的简单易用的声音转换框架。该项目利用近 50 小时高质量的开源 VCTK 训练集训练基础模型,无版权问题,用户可以自由使用。项目提供了一个实时声音转换的 GUI 界面,并支持模型融合来改变音色。

2. 项目快速启动

环境配置

  • Python 版本要求:3.8 <= Python < 3.11。推荐使用虚拟环境 venv 管理Python环境。

  • 依赖安装:根据你的显卡类型,选择以下命令之一安装依赖。

    • Nvidia GPU
      pip install -r requirements/main.txt
      
    • AMD/Intel GPU
      pip install -r requirements/dml.txt
      
    • AMD ROCM (Linux)
      pip install -r requirements/amd.txt
      
    • Intel IPEX (Linux)
      pip install -r requirements/ipex.txt
      
  • 启动脚本:在项目根目录执行以下命令,一键配置虚拟环境、安装依赖并启动主程序。

    sh ./run.sh
    

资源准备

项目需要一些位于 assets 文件夹中的模型文件来进行推理和训练。可以通过以下方式下载:

  • 自动检查/下载:默认情况下,程序启动时会自动检查所需资源的完整性。如果资源不完整,程序仍会继续启动。如果需要下载所有资源,请添加 --update 参数。
  • 手动下载:资源文件位于 Hugging Face space,可以在 tools 文件夹中找到下载脚本。

直接启动

使用以下命令启动 WebUI:

python web.py

对于需要使用 IPEX 技术的 I-card 用户(仅限 Linux),执行以下命令:

source /opt/intel/oneapi/setvars.sh
./run.sh

对于 Windows 用户,可以下载并解压 RVC-beta.7z,解压后双击 go-web.bat 一键启动程序。

3. 应用案例和最佳实践

(此处可以添加一些使用该项目的实际案例和最佳实践,例如如何快速训练一个声音转换模型,如何使用 GUI 界面进行实时声音转换等。)

4. 典型生态项目

(此处可以列出一些与 Retrieval-based-Voice-Conversion-WebUI 相关的生态项目,例如声音转换相关的其他开源项目、工具或库。)

Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data <= 10 mins! 项目地址: https://gitcode.com/gh_mirrors/ret/Retrieval-based-Voice-Conversion-WebUI

你可能感兴趣的:(Retrieval-based-Voice-Conversion-WebUI 使用指南)