TORGO 数据库:构音障碍语音研究的宝贵资源

TORGO 数据库:构音障碍语音研究的宝贵资源

在语音识别和语音病理学领域,构音障碍(Dysarthria)是一个重要的研究方向。构音障碍是由神经运动接口异常引起的,导致发音器官运动异常,语音不清晰,传统自动语音识别(ASR)系统难以有效识别。为了推动这一领域的研究,多伦多大学开发了 TORGO 数据库,这是一个包含构音障碍患者和正常对照组语音数据的宝贵资源。


1. 数据库简介

TORGO 数据库是由多伦多大学计算机科学系和言语病理学系与 Holland-Bloorview 儿童康复医院合作开发的。该数据库旨在为开发适用于构音障碍患者的 ASR 模型提供数据支持。数据库包含以下内容:

  • 数据类型:声学特征、3D 发音运动数据、语音提示(prompts)和语音转录(transcriptions)。
  • 研究对象:构音障碍患者(如脑瘫 CP 和肌萎缩侧索硬化症 ALS)和正常对照组。
  • 时间范围:数据记录于 2008 年至 2010 年。
  • 资助方

你可能感兴趣的:(语音识别与Wenet实战,语音识别与ESPnet实战,语音识别)