fac-via-ppg 项目使用教程

fac-via-ppg 项目使用教程

fac-via-ppg Foreign Accent Conversion by Synthesizing Speech from Phonetic Posteriorgrams (Interspeech'19) 项目地址: https://gitcode.com/gh_mirrors/fa/fac-via-ppg

1. 项目目录结构及介绍

fac-via-ppg/
├── data/
│   └── filelists/
├── src/
│   ├── common/
│   ├── script/
│   └── waveglow/
├── test/
│   └── data/
├── .gitignore
├── LICENSE
├── README.md
├── environment.yml
└── spec-file.txt
  • data/: 存放数据文件,特别是 filelists 目录,用于指定训练和验证数据的文本文件。
  • src/: 项目的主要代码目录,包含以下子目录:
    • common/: 包含项目通用的代码和配置文件。
    • script/: 包含项目的启动脚本,如 train_ppg2mel.pytrain_waveglow.py
    • waveglow/: 包含与 WaveGlow 模型相关的代码和配置文件。
  • test/: 包含项目的单元测试代码和测试数据。
  • .gitignore: Git 忽略文件配置。
  • LICENSE: 项目许可证文件。
  • README.md: 项目说明文档。
  • environment.yml: 项目依赖环境配置文件。
  • spec-file.txt: 项目规范文件。

2. 项目启动文件介绍

2.1 train_ppg2mel.py

该脚本是用于训练 PPG-to-Mel 模型的启动文件。它位于 src/script/ 目录下。

cd src/script
python train_ppg2mel.py

2.2 train_waveglow.py

该脚本是用于训练 WaveGlow 模型的启动文件。它也位于 src/script/ 目录下。

cd src/script
python train_waveglow.py

2.3 generate_synthesis.py

该脚本是用于生成语音合成的启动文件。它同样位于 src/script/ 目录下。

cd src/script
python generate_synthesis.py --ppg2mel_model <模型路径> --waveglow_model <模型路径> --teacher_utterance_path <教师语音路径> --output_dir <输出目录>

3. 项目的配置文件介绍

3.1 environment.yml

该文件用于配置项目的依赖环境。通过该文件,可以使用 conda 创建项目的虚拟环境。

conda env create -f environment.yml

3.2 src/common/hparams.py

该文件包含项目的超参数配置。在训练 PPG-to-Mel 模型时,可以通过修改该文件中的 create_hparams() 函数来调整模型的参数。

3.3 src/waveglow/config.json

该文件包含 WaveGlow 模型的配置参数。在训练 WaveGlow 模型时,可以通过修改该文件来调整模型的配置。

3.4 data/filelists/

该目录下的文件用于指定训练和验证数据的文件列表。每个文件列表文件包含一系列数据文件的路径。

data/filelists/train.txt
data/filelists/val.txt

通过以上配置文件和启动文件,可以方便地进行项目的训练和测试。

fac-via-ppg Foreign Accent Conversion by Synthesizing Speech from Phonetic Posteriorgrams (Interspeech'19) 项目地址: https://gitcode.com/gh_mirrors/fa/fac-via-ppg

你可能感兴趣的:(fac-via-ppg 项目使用教程)