Kaldi 第6页

Kaldi特征提取之-预处理

Kaldi特征提取之-预处理背景本质上语音信号是一维的时间信号，随时间上下波动。现实中，人们再说话时会受到各种音素的干扰，为了进一步进行处理，我们必须进行必要的预处理以便之后的特征提取。

wxb_blog·2020-08-25 04:50

kaldi上运行thchs30中文语音库的错误总结

align_fmllr.sh:doingfinalalignment.ERROR:FstHeader::Read:BadFSTheader:-ERROR(fstdeterminizestar[5.1]:ReadFstKaldi

HalFTeen·2020-08-25 04:33

Kaldi sre10, sre16 数据格式

做个记录,给大多数跑脚本但是又没有官方数据的朋友一起交流讨论:引用自己在知乎的回答:跑kaldi的脚本到最后都是得用自己的数据去训练去测试的,kaldi只需要三个文件utt2spk,spk2utt和wav.scp

RoadmanG·2020-08-25 04:13

kaldi特征提取部分代码分析

kaldi特征提取部分代码分析1.make_fbank.shmake_fbank.sh脚本使用方式：make_fbank.sh[options][[]]其中data-dir代表了原始音频文件路径，log-dir

奶斯ssss·2020-08-25 04:24

Kaldi学习笔记：01(kaldi/egs/sitw/v1)run.sh解析

kaldi学习笔记-01-sitw简介脚本修改run.sh简介研究生阶段入坑了说话人识别方向，最近在学习如何使用Kaldi提取i-vector进行说话人识别，在这里记录一下学习的笔记。

qijiajun97·2020-08-25 03:29

Kaldi thchs30手札（六）说话人自适应训练（SAT)、FMLLR以及quick训练（line 87-104)

欢迎大家关注我的博客http://pelhans.com/，所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line87-104行研究和知识总结，内容涵盖说话人自适应训练

Pelhans·2020-08-25 03:17

Kaldi单步完美运行AIShell v1 S5之五：DNN (chain)

Kaldi单步完美运行AIShellv1S5之五：DNN（chain）致谢机器配置问题：显卡设备老旧，一个GPU，想跑tdnn模型，如何破？

见性见声·2020-08-25 03:52

Kaldi单步完美运行AIShell v1 S5之二：单音素MonoPhone

Kaldi单步完美运行AIShellv1S5之二：MONO致谢机器配置Kaldi下AIShellv1详细输出之二：monophone第三部分：单音素结果第四部分：Monophone训练、解码、校准第五部分

见性见声·2020-08-25 03:21

Kaldi单步完美运行AIShell v1 S5之一：MONO前

Kaldi单步完美运行AIShellv1S5之一：MONO前致谢机器配置Kaldi下AIShellv1详细输出第一部分：数据准备第二部分：MFCC&CMVN第三部分：单音素致谢感谢AIShell在商业化道路上的探索

见性见声·2020-08-25 03:20

Kaldi学习之数据准备详细解释说明

文章对Kaldi数据准备做更详细的解释，如有错误，还请指正。

llearner·2020-08-25 03:46

KALDI工具箱运行TIMIT语料库库实例教程

1.进入对应的目录，进行如下操作：zhangju@ubuntu:~$cdkaldi-trunk/egs/timit/s5/zhangju@ubuntu:~/kaldi-trunk/egs/timit/s5

ldd530314297·2020-08-25 03:54

kaldi中查看深度学习模型参数

cdpath/of/kaldi/src/nnetbin/./nnet-infopath/of/final.nnet

jiangtopaz·2020-08-25 03:29

kaldi平台上aishell运行时出现的问题及解决办法

问题1：ThisscriptisintendedtobeusedwithGPUsbutyouhavenotcompiledKaldiwithCUDAIfyouwanttouseGPUs(andhavethem

程序猿-博客·2020-08-25 03:50

语音识别工具Kaldi 笔记

`本文翻译来自：[http://white.ucc.asn.au/Kaldi-Notes/tidigits/train]水平有限，翻译有不准确的地方望指出。

gwpjiayou·2020-08-25 03:38

KALDI之aishell模型说话人识别之V1

1.首先，成功安装kaldi在服务器上，用gitclone那种方式安装（和在本地Unbuntu乌班图环境安装没区别）。

落雪snowflake·2020-08-25 02:23

kaldi中声纹识别例子大概步骤综述

如何利用kaldi搭建说话人识别的例子。仅仅是搭建，具体的很多参数的调整需要大家根据数据集的不同慢慢调整。

落雪snowflake·2020-08-25 02:52

kaldi---get_egs.sh和get_egs_targets.sh区别

get_egs.sh和get_egs_targets.sh文件理解get_egs.sh和get_egs_targets.sh文件实现的功能相同，都是生成label标签和帧之间的对应，并划分训练-验证样本数据集。不同的是，get_egs.sh是通过上步已经生成的对齐文件夹（ali）及其相关文件生成帧级别的样本标签，而get_egs_targetes.sh文件是通过上步已经准备好的targets_sc

陌上阳光·2020-08-24 17:22

kaldi数据集下载（swbd）

kaldi数据集下载（swbd）LDC：https://catalog.ldc.upenn.edu/byyear（97年LDC97S62Switchboard-1Release2）https://linguistics.cornell.edu

陌上阳光·2020-08-24 17:22

全新mac安装kaldi

1.安装xcode官网下载xcodehttps://developer.apple.com/download/2.安装Xcode命令行工具$xcode-select--install3.安装homebrew命令获取网址：https://brew.sh//usr/bin/ruby-e"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/inst

陌上阳光·2020-08-24 17:50

Kaldi特征提取之-VAD

Kaldi特征提取之-VAD背景VAD即VoiceActivityDetection，用于检测静音和非静音。

wxb_blog·2020-08-24 16:34

kaldi——用shellscript（bash）制作yesno的recipe（一）

先从kaldi的安装说起吧一，kaldi的安装与编译首先cd到安装的目录下cd /wangyu #wangyu是我建的一个文件夹然后安装kaldigitclonehttps:

Wang_yu09·2020-08-24 13:53

Kaldi 杂记

台式机器：I5-6500GTX950，ubuntu14.04(新手建议不要太新的ubutnu，出现问题不好百度)1.安装CUDA7.5到NVIDIA下载CUDA安装包，然后在安装一些可能需要的库：sudoapt-getinstallppa-purgesudoapt-add-repositoryppa:xorg-edgerssudoapt-getupdatesubversion,automake,a

Aderic·2020-08-24 11:39

make_mfcc_pitch.sh阅读笔记

steps/make_mfcc_pitch.sh--cmd"xexp/make_mfcc/mfccdir||exit1;提取特征代码：compute-mfcc-feats#提取mfcc特征compute-kaldi-pitch-feats

诸葛村姑·2020-08-24 04:57

Kaldi HMM拓扑和状态转换模型

我的书：淘宝购买链接当当购买链接京东购买链接##HMM拓扑使用c++的HmmTopology来描述音素的HMM拓扑。其描述的一个实例（3-stateBakis模型）如下：123456780000.510.51110.520.52220.530.53在这个实例中只有一个TopologyEntry，其包括了音素1~8（所以这个例子总共8个音素，这些音素共享相同的拓扑）。有三个发射状态，每个状态包括一个

shichaog·2020-08-24 02:24

Kaldi 查看ark,fst,tree等文件用到的命令

*1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件，scp可以直接用cat命令看

诸葛村姑·2020-08-23 19:42

[Kaldi] 查看不同文件

20190108qzd1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件，scp

原来是酱紫呀·2020-08-22 15:59

美国 AI 的秘密武器——中国人才，国际局势影响人才流动

去年，国际语音识别领域大神级人物，Kaldi之父DanielPovey拒绝了Facebook来到中国选择了小米。上周，英特尔芯片设计师JimKeller离职，中国网友纷纷评论欢迎到中国企业就职。

芒果果·2020-08-22 15:31

kaldi tutorial

https://eleanorchodroff.com/tutorial/kaldi/index.html

·Barton··2020-08-22 14:57

Kaldi thchs30手札（七） DNN-HMM模型的训练

欢迎大家关注我的博客http://pelhans.com/，所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line106-107行研究和知识总结，主要内容为Kaldi

Pelhans·2020-08-22 13:36

kaldi 源码分析(三) - run.pl 分析

在kaldi样本(egs/xxx/s5)目录下，大都会存在如下文件及文件夹：cmd.sh#并行执行命令，通常分run.pl,queue.pl两种config#参数定制化配置文件，mfcc,decode,

走在成长的道路上·2020-08-21 11:45

杂记：腾讯暑期实习 Web 后端开发面试经历

可能是因为我在简历中有过一个语音识别的项目经验，但那只是大二的一个课程作业，我对其中的原理并不十分了解，只说了什么Kaldi的内部是GMM+HMM模型实现的，唉。接下来是四道编程题，

weixin_33774615·2020-08-20 01:36

wav 文件按起止时间切割

step1:sox不能直接切，先转化为sphos.system(‘sox{}-fsph{}’.format(wav_filepath,sph_filepath))step2:用kaldi的sph2pipe

jinmingz·2020-08-19 22:00

kaldi常用工具（原理分析）

kaldi/src/gmmbin/gmm-copy–binary=false

jinmingz·2020-08-19 06:42

Kaldi中的plda的训练以及computer-socre

最近一直有个疑惑，plda是怎么训练的？就是plda是怎么计算得分的?又是怎么根据得分进行判断说话人的？EER跟准确率之间又是什么关系？时间很紧，论文还没写，需要静一静，好好弄明白这个来清醒一下。提取完i-vector之后，计算出每一句话的ivector特征，然后计算了sreivector-meanscp:exp/ivectors_sre/ivector.scpexp/ivectors_sre/m

jinmingz·2020-08-19 06:42

特征提取I-VECTOR算法源码01

#include#include"ivector/agglomerative-clustering.h"namespacekaldi{voidAgglomerativeClusterer::Cluster

落雪snowflake·2020-08-19 05:41

KALDI中声纹识别学习流程及资源

KALDI工具包中的例子首先最基础的就是egs/aishell/V1,先跑通它，并理解代码和基础理论知识。egs/sre08REMAD.TXT系统开发所需的数据（除了所描述的测试数据之外）在..

落雪snowflake·2020-08-19 05:40

kaldi 用ivector计算plda出错

运行结果如下：=====FEATURESEXTRACTION=====steps/make_mfcc.sh--cmdrun.pl--nj1data/trainexp/make_mfcc/trainmfccsteps/make_mfcc.sh:movingdata/train/feats.scptodata/train/.backupsteps/make_mfcc.sh:[info]:nosegme

新一姬·2020-08-19 04:32

KALDI中ivector提取过程

/local/data_prep.sh/home/yixin/kaldi/egs/clarinet/data/clarinet_audio/wav/home/yixin/kaldi/egs/clarinet

新一姬·2020-08-19 04:32

语音识别

语音识别主流开源框架：HTK、Kaldi、CMUSphinx。因为目前只接触了Sphinx，对于另外两个框架没有太深入研究。

飞星·2020-08-19 03:14

kaldi 强制对齐相关代码介绍

CorpusPhoneticsTutorialEleanorChodroffIntroPennForcedAlignerAutoVOTKaldiOtherResourcesPrerequisitesFamiliarizationTrainingAcousticModelsConceptuallyTrainingAcousticModelsForcedAlignmentKaldiForcedAlig

dlx59140096·2020-08-19 01:43

kaldi训练mono-phone——强制对齐

kaldi中训练声学模型，首先是训练单音素模型，即mono-phone过程，本文主要讲述mono-phone训练的过程。

audiocool·2020-08-19 01:29

kaldi中基于决策树的状态绑定

为什么要做状态绑定假如我们有218monophone，然后现在要考虑上下文音素对发音的影响，这时候我们通常使用triphone。那么会有几个triphone呢？答案是218的3次方。如果不进行聚类，我们需要建立(218的3次方)*3个混合gmm模型(假设每个triphone有3个状态)，计算量巨大,另一方面会引起数据稀疏。所以通常我们会根据数据特征对triphone的状态进行绑定。常见的状态绑定方

nlpgeek·2020-08-19 01:28

kaldi语音特征预处理-mfcc特征与标签对齐（一）

学习kaldi已经接近两个月了，终于将kaldi中语音的特征数据提取出来，对于其分帧的标签进行对齐，即将输入到TensorFlow搭建的模型中，下面详细的讲解一下如何提取语音的特征以及对音素标签进行对齐

Xwei1226·2020-08-19 01:38

PYTORCH-KALDI语音识别工具包

PYTORCH-KALDI语音识别工具包MircoRavanelli1，TitouanParcollet2，YoshuaBengio1*Mila,Universit´edeMontr´eal,∗CIFARFellowLIA

king_audio_video·2020-08-18 11:23

Kaldi结果文件可视化查看

转载：https://blog.csdn.net/zjm750617105/article/details/52540823目录L.fstMFCC&FBANKmonophone,triphonetreeali.1.gzshow-transitions样例是用自己的数据跑的，改编自wsj，文件名称不是很标准，但重点是工具的使用，加路径是为了好理解，内容暂时不解释，以后有时间来补充。这个文档太棒了，理

我是个粉刷匠·2020-08-17 08:52

【kaldi】Kaldi+CUDA安装向问题（含libtool is not installed.的解决方法）

现在汇总一下出现的问题。（1）Ubuntu16.04更新Nvidia驱动后，图形登录界面无限循环H：目前（请右上看眼发文时间），最新版本的Ubuntu16.04不兼容Nvidia驱动。14.04或者14.10版本是安全的。这里，提供一个站点：厦门大学的信息与网络中心。里面有很多linux版本。有Deepin/CenOS/ubuntu等。（2）虚拟机是（几乎）无法调用GPU的/不能运行CUDA的吗？

HH_Lab·2020-08-16 02:41

win10+cuda8.0+vs2013+kinectv2+bundlefusion的安装配置

bundlefusion下载下来https://github.com/niessner/BundleFusion6.下载mLibExtrernal，放在与bundlefusion同级文件夹下：http://kaldir

CptM·2020-08-16 01:40

语音识别—Viterbi解码

曾看过很多语音识别书（余栋的语音识别实战、陈果果的kaldi实战以及张雪英的数位语音处理等书）、课程（七月在线、深蓝学院等课程），上述研究对

Xwei1226·2020-08-15 22:58

语音识别技术(AI VQ HMM)，语音样本及开源工具 Kaldi等，双麦阵列

--AI：计算机视觉、语音识别、NLP(NaturalLanguageProcessing)人工智能正从比较初级的计算智能向更高层次的智能过渡。更高层次的智能包括3个阶段：感知（perception）智能，计算机视觉（computervision），认知（cognition）阶段，第一个阶段是感知（perception）智能，机器要听得见、看得见。听得见是我们常说的语音识别，机器把人说的一句话，由

desaco·2020-08-15 22:15

在树莓派上搭建kaldi离线语音识别系统（交叉编译）

在树莓派上搭建kaldi离线语音识别系统（交叉编译）一、系统功能和环境概述1.1、实现功能1.2、开发环境二、kaldi语音识别工具箱三、树莓派的相关配置四、kaldi交叉编译过程4.1、配置Ubuntu

麻城明歌·2020-08-15 11:47

推荐频道

Kaldi