[置顶] 语音标注自动音段对齐工具SPPAS使用笔记

[更新日期:2015/6/8  13:24:23]

      SPPAS工具是由Brigitte BigiLaboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具,目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善,但是对于一般的语音研究者来说,能够自动产生出带有音段信息,并且边界相对整齐的Praat标注文件TextGrid已经是大大提升了工作效率。所以推荐给进行语音研究,而且数据量规模很大的朋友。最近有几位朋友提问在64位上无法安装,这两天在一位朋友的帮助下,在她的64位机器上也安装成功了,官方网站现在更新了,需要安装的环境软件只有三个就可以了。前两个是有专门的64位的,最后一个只需要32位的可执行文件就行。

      有关于这个工具的详细说明,介绍,文档,由此相关的论文等信息请参阅官方网站:http://www.sppas.org/。在这里只是把使用的时候注意的一些地方写出来,以方便一些可能对插件包安装使用并不熟悉的同学。

      打开网站有困难的请到资源里下载:http://download.csdn.net/detail/shaopengfei/8335889

       首先是一些使用时的注意事项:

  • 标注文件,及声音对应的文本文件,都必须是UTF8格式
  • 声音文件必须是单通道文件,16位精度
  • 所有的文件名称中没有特殊字符,比如中文,空格都不允许,推荐只出现字母,下划线,数字或者横线
  • 声音文件和对应的文本文件名称必须完全一致
  • 具体使用步骤应该是
    • 安装工具,在自己的电脑上配置这个工具使用的环境(需要有三个工具安装,下文会提到)
    • 将自己的语音语料制作成一个一个的声音文件,这里的一个的涵义是一个句子,一个词,一个字为单位,短的篇章也可以,但是篇章不要太长,否则效果很差。制作成这样的声音文件之后,再制作相应的文本文档,比如:录音的声音文件Sound001.wav内容是"Can you help me?",那么需要制作一个同样文件名称的文本文件Sound001.txt,内容就添加这个句子  Can you help me   ,这个文本文件的格式为UTF8格式。
    • 然后将这样的文件都添加到SPPAS操作窗口里,选择相应的语言,选择音段对齐选项,点击“执行”就可以产生出来音段对齐的TextGrid了
  • 这其中对于如何把工具环境安装好,对于只有文科基础的同学不太容易操作,但是一旦安装好了,以后就可以直接使用了。

      本文力求对每个环节都写的简单一些,让更多想使用这个工具的人能够很快的将工具配置好,节省自己的工作效率。

 

1. 安装

     这部分主要就是大概翻译了一下官方网站上的Installation这一部分。

  1. windows环境下的安装

    1. 如何知道自己的电脑是32-bits还是64-bits结构(win7):点击开始,点击控制面板里的,系统,在系统类型里可以看到是32位操作系统还是64位。
  2. Python installation

    1. Click here to downloadPython     
    2. 根据操作系统类型选择下载文件:
      1. 32位:Windows x86 MSI Installer (2.7.6)(sig)
      2. 64位:Windows X86-64 MSI Installer (2.7.6)[1](sig)
    3. 安装过程即和常规安装软件的过程类似。    
      1. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第1张图片
      2. 注意安装路径
      3. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第2张图片
      4. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第3张图片
      5. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第4张图片
  3. WxPython installation

    1. Click here to downloadwxPython 
    2. 根据操作系统类型选择下载文件:
      1. 32位:
        wxPython3.0-win32-py27 32-bit Python 2.7
      2. 64位:
        wxPython3.0-win64-py27 64-bit Python 2.7
    3. 安装过程:
      1. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第5张图片
      2. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第6张图片
      3. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第7张图片
      4. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第8张图片
  4. Julius installation

    1. Click here to downloadJulius (release >= 4.1)     
    2. 这个组件不需要安装,直接解压到一个目录里
    3. 打开这个目录,打开bin目录,找到Julius.exe,注意因为本文下载的是Julius 4.3.1版本,所以其实这个文件名称是Julius-4.3.1.exe,即要把这个文件拷贝到C:\windows\目录下,并且改名为:julius.exe  
    4. 注意:64位机器不需要找专门的这个版本,就使用和第(3)同样的方式操作就可以了,已经测试过,是成功了。
    5. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第9张图片
  5. SPPAS工具的下载安装

    1. 下载新版本的Download SPPAS version 1.6.9 (2015-05-14)
    2. 下载后直接解压到磁盘根目录下,比如D盘下。D:\sppas\,目录级别不要太深。
    3. 打开后,直接打开里面的sppas.bat,就可以运行了。
    4. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第10张图片
    5. 打开之后是这样的界面:
    6. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第11张图片
  6. MacOS环境下的安装

 2. 制作声音文件和文本

  • 手工制作声音文件和文本文件
    • 手工录音,然后分别针对每一个录音单位制作文本文件
    • [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第12张图片
    • 注意声音文件和文本文件是对应出现的。文件名称必须一样。而文本文件,比如Sound_1.txt里面就是这个声音的内容,没有其它多余信息。如红色箭头所指。在保存这个文本文件的时候,需要注意编码格式为UTF-8格式,如下面的红色方框所示。
  • 批量制作声音文件和文本文件
    • 使用前面的文章《Praat 将连续录制的声音文件切成小单位文件》介绍的方法,可以对连续录制的很长的声音文件切分成小的单位文件。在这里要继续使用这个脚本产生的文件名列表,fileList.txt,这个文件里是这样的
    • order	filename	sentence
      1	Sound_1.wav
      2	Sound_2.wav
      3	Sound_3.wav
      4	Sound_4.wav
      5	Sound_5.wav
      6	Sound_6.wav
      7	Sound_7.wav
      8	Sound_8.wav
    • 我们利用产生的文件名,把录音对应的内容,和文件名对应起来。如下面所示
    • Sound_1.wav	关心
      Sound_2.wav	刚刚
      Sound_3.wav	单一
      Sound_4.wav	糟糕
      Sound_5.wav	新鲜
      Sound_6.wav	餐厅
      Sound_7.wav	西瓜
      Sound_8.wav	车厢
       
    • 然后再使用,本人编写的另外一个工具,可以直接产生有这些内容的文本文件,工具下载地址如下:
      • 批量产生有内容列表的UTF-8格式文本文件
    • 产生的文件内容如下,之所以使用这样的工具产生文本,主要是为了产生UTF-8格式的文本文件。
    • [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第13张图片

3. 导入SPPAS进行切分

  1. 经过上面的步骤,我们已经制作了批量的声音文件和文本文件,把这些文件放在同一个目录内:
    1. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第14张图片
  2. 然后打开SPPAS这个工具,点击Add files将声音文件添加到窗口里,同时,有同样文件名的txt也会被添加到窗口里,把这些文件通过使用ctrl或者shift键,全部选择,然后把右侧的几个对齐的选项选择,并且在语言里选择相应的语言,比如这里选择的是中文,ZH。
    1. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第15张图片
    2. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第16张图片
  3. 点击右下角的这个长的按钮,就是执行按钮,然后系统就会自动产生出来对齐音段的TextGrid文件。
  4. 一般情况下,会同时产生几个TextGrid
    1. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第17张图片
  5. 我们只需要最终的结果Sound_-merge.TextGrid文件。
  6. 这就是最终的结果:可以看到,准确度并不高,但是省去了很多人工的添加边界,输入字符的过程。
  7. [置顶] 语音标注自动音段对齐工具SPPAS使用笔记_第18张图片

你可能感兴趣的:(python,标注,SPPAS,Praat)