E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Kaldi
Kaldi
特征提取之-预处理
Kaldi
特征提取之-预处理背景本质上语音信号是一维的时间信号,随时间上下波动。现实中,人们再说话时会受到各种音素的干扰,为了进一步进行处理,我们必须进行必要的预处理以便之后的特征提取。
wxb_blog
·
2020-08-25 04:50
Kaldi
kaldi
上运行thchs30中文语音库的错误总结
align_fmllr.sh:doingfinalalignment.ERROR:FstHeader::Read:BadFSTheader:-ERROR(fstdeterminizestar[5.1]:ReadFst
Kaldi
HalFTeen
·
2020-08-25 04:33
ASR
Kaldi
sre10, sre16 数据格式
做个记录,给大多数跑脚本但是又没有官方数据的朋友一起交流讨论:引用自己在知乎的回答:跑
kaldi
的脚本到最后都是得用自己的数据去训练去测试的,
kaldi
只需要三个文件utt2spk,spk2utt和wav.scp
RoadmanG
·
2020-08-25 04:13
声纹识别
Kaldi
kaldi
特征提取部分代码分析
kaldi
特征提取部分代码分析1.make_fbank.shmake_fbank.sh脚本使用方式:make_fbank.sh[options][[]]其中data-dir代表了原始音频文件路径,log-dir
奶斯ssss
·
2020-08-25 04:24
语音识别
Kaldi
学习笔记:01(
kaldi
/egs/sitw/v1)run.sh解析
kaldi
学习笔记-01-sitw简介脚本修改run.sh简介研究生阶段入坑了说话人识别方向,最近在学习如何使用
Kaldi
提取i-vector进行说话人识别,在这里记录一下学习的笔记。
qijiajun97
·
2020-08-25 03:29
Kaldi
thchs30手札(六)说话人自适应训练(SAT)、FMLLR以及quick训练(line 87-104)
欢迎大家关注我的博客http://pelhans.com/,所有文章都会第一时间发布在那里~本部分是对
Kaldi
thchs30中run.sh的代码的line87-104行研究和知识总结,内容涵盖说话人自适应训练
Pelhans
·
2020-08-25 03:17
ASR
Kaldi
单步完美运行AIShell v1 S5之五:DNN (chain)
Kaldi
单步完美运行AIShellv1S5之五:DNN(chain)致谢机器配置问题:显卡设备老旧,一个GPU,想跑tdnn模型,如何破?
见性见声
·
2020-08-25 03:52
Kaldi
Kaldi
单步完美运行AIShell v1 S5之二:单音素MonoPhone
Kaldi
单步完美运行AIShellv1S5之二:MONO致谢机器配置
Kaldi
下AIShellv1详细输出之二:monophone第三部分:单音素结果第四部分:Monophone训练、解码、校准第五部分
见性见声
·
2020-08-25 03:21
Kaldi
Kaldi
单步完美运行AIShell v1 S5之一:MONO前
Kaldi
单步完美运行AIShellv1S5之一:MONO前致谢机器配置
Kaldi
下AIShellv1详细输出第一部分:数据准备第二部分:MFCC&CMVN第三部分:单音素致谢感谢AIShell在商业化道路上的探索
见性见声
·
2020-08-25 03:20
Kaldi
Kaldi
学习之数据准备详细解释说明
文章对
Kaldi
数据准备做更详细的解释,如有错误,还请指正。
llearner
·
2020-08-25 03:46
语音识别
Kaldi
语音
多媒体
KALDI
工具箱运行TIMIT语料库库实例教程
1.进入对应的目录,进行如下操作:zhangju@ubuntu:~$cd
kaldi
-trunk/egs/timit/s5/zhangju@ubuntu:~/
kaldi
-trunk/egs/timit/s5
ldd530314297
·
2020-08-25 03:54
kaldi
中查看深度学习模型参数
cdpath/of/
kaldi
/src/nnetbin/./nnet-infopath/of/final.nnet
jiangtopaz
·
2020-08-25 03:29
语音识别
kaldi
平台上aishell运行时出现的问题及解决办法
问题1:ThisscriptisintendedtobeusedwithGPUsbutyouhavenotcompiled
Kaldi
withCUDAIfyouwanttouseGPUs(andhavethem
程序猿-博客
·
2020-08-25 03:50
语音识别
语音识别工具
Kaldi
笔记
`本文翻译来自:[http://white.ucc.asn.au/
Kaldi
-Notes/tidigits/train]水平有限,翻译有不准确的地方望指出。
gwpjiayou
·
2020-08-25 03:38
Kaldi语音识别
KALDI
之aishell模型说话人识别之V1
1.首先,成功安装
kaldi
在服务器上,用gitclone那种方式安装(和在本地Unbuntu乌班图环境安装没区别)。
落雪snowflake
·
2020-08-25 02:23
KALDI工具
说话人识别
kaldi
中声纹识别例子大概步骤综述
如何利用
kaldi
搭建说话人识别的例子。仅仅是搭建,具体的很多参数的调整需要大家根据数据集的不同慢慢调整。
落雪snowflake
·
2020-08-25 02:52
深度学习声纹识别
KALDI工具
kaldi
---get_egs.sh和get_egs_targets.sh区别
get_egs.sh和get_egs_targets.sh文件理解get_egs.sh和get_egs_targets.sh文件实现的功能相同,都是生成label标签和帧之间的对应,并划分训练-验证样本数据集。不同的是,get_egs.sh是通过上步已经生成的对齐文件夹(ali)及其相关文件生成帧级别的样本标签,而get_egs_targetes.sh文件是通过上步已经准备好的targets_sc
陌上阳光
·
2020-08-24 17:22
kaldi
kaldi
数据集下载(swbd)
kaldi
数据集下载(swbd)LDC:https://catalog.ldc.upenn.edu/byyear(97年LDC97S62Switchboard-1Release2)https://linguistics.cornell.edu
陌上阳光
·
2020-08-24 17:22
kaldi
全新mac安装
kaldi
1.安装xcode官网下载xcodehttps://developer.apple.com/download/2.安装Xcode命令行工具$xcode-select--install3.安装homebrew命令获取网址:https://brew.sh//usr/bin/ruby-e"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/inst
陌上阳光
·
2020-08-24 17:50
kaldi
Kaldi
特征提取之-VAD
Kaldi
特征提取之-VAD背景VAD即VoiceActivityDetection,用于检测静音和非静音。
wxb_blog
·
2020-08-24 16:34
Kaldi
kaldi
——用shellscript(bash)制作yesno的recipe(一)
先从
kaldi
的安装说起吧一,
kaldi
的安装与编译首先cd到安装的目录下cd /wangyu #wangyu是我建的一个文件夹然后安装
kaldi
gitclonehttps:
Wang_yu09
·
2020-08-24 13:53
软件安装
AI
Kaldi
杂记
台式机器:I5-6500GTX950,ubuntu14.04(新手建议不要太新的ubutnu,出现问题不好百度)1.安装CUDA7.5到NVIDIA下载CUDA安装包,然后在安装一些可能需要的库:sudoapt-getinstallppa-purgesudoapt-add-repositoryppa:xorg-edgerssudoapt-getupdatesubversion,automake,a
Aderic
·
2020-08-24 11:39
杂陈
make_mfcc_pitch.sh阅读笔记
steps/make_mfcc_pitch.sh--cmd"xexp/make_mfcc/mfccdir||exit1;提取特征代码:compute-mfcc-feats#提取mfcc特征compute-
kaldi
-pitch-feats
诸葛村姑
·
2020-08-24 04:57
Kaldi
HMM拓扑和状态转换模型
我的书:淘宝购买链接当当购买链接京东购买链接##HMM拓扑使用c++的HmmTopology来描述音素的HMM拓扑。其描述的一个实例(3-stateBakis模型)如下:123456780000.510.51110.520.52220.530.53在这个实例中只有一个TopologyEntry,其包括了音素1~8(所以这个例子总共8个音素,这些音素共享相同的拓扑)。有三个发射状态,每个状态包括一个
shichaog
·
2020-08-24 02:24
语音识别
Kaldi
查看ark,fst,tree等文件用到的命令
*1.ark,scp文件~/
kaldi
/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件,scp可以直接用cat命令看
诸葛村姑
·
2020-08-23 19:42
[
Kaldi
] 查看不同文件
20190108qzd1.ark,scp文件~/
kaldi
/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件,scp
原来是酱紫呀
·
2020-08-22 15:59
美国 AI 的秘密武器——中国人才,国际局势影响人才流动
去年,国际语音识别领域大神级人物,
Kaldi
之父DanielPovey拒绝了Facebook来到中国选择了小米。上周,英特尔芯片设计师JimKeller离职,中国网友纷纷评论欢迎到中国企业就职。
芒果果
·
2020-08-22 15:31
人工智能
google
microsoft
斯坦福大学
kaldi
tutorial
https://eleanorchodroff.com/tutorial/
kaldi
/index.html
·Barton·
·
2020-08-22 14:57
Kaldi
thchs30手札(七) DNN-HMM模型的训练
欢迎大家关注我的博客http://pelhans.com/,所有文章都会第一时间发布在那里~本部分是对
Kaldi
thchs30中run.sh的代码的line106-107行研究和知识总结,主要内容为
Kaldi
Pelhans
·
2020-08-22 13:36
ASR
kaldi
源码分析(三) - run.pl 分析
在
kaldi
样本(egs/xxx/s5)目录下,大都会存在如下文件及文件夹:cmd.sh#并行执行命令,通常分run.pl,queue.pl两种config#参数定制化配置文件,mfcc,decode,
走在成长的道路上
·
2020-08-21 11:45
杂记:腾讯暑期实习 Web 后端开发面试经历
可能是因为我在简历中有过一个语音识别的项目经验,但那只是大二的一个课程作业,我对其中的原理并不十分了解,只说了什么
Kaldi
的内部是GMM+HMM模型实现的,唉。接下来是四道编程题,
weixin_33774615
·
2020-08-20 01:36
wav 文件按起止时间切割
step1:sox不能直接切,先转化为sphos.system(‘sox{}-fsph{}’.format(wav_filepath,sph_filepath))step2:用
kaldi
的sph2pipe
jinmingz
·
2020-08-19 22:00
kaldi
kaldi
常用工具(原理分析)
kaldi
/src/gmmbin/gmm-copy–binary=false
jinmingz
·
2020-08-19 06:42
ASR
kaldi
Kaldi
中的plda的训练以及computer-socre
最近一直有个疑惑,plda是怎么训练的?就是plda是怎么计算得分的?又是怎么根据得分进行判断说话人的?EER跟准确率之间又是什么关系?时间很紧,论文还没写,需要静一静,好好弄明白这个来清醒一下。提取完i-vector之后,计算出每一句话的ivector特征,然后计算了sreivector-meanscp:exp/ivectors_sre/ivector.scpexp/ivectors_sre/m
jinmingz
·
2020-08-19 06:42
kaldi
sre
特征提取I-VECTOR算法源码01
#include#include"ivector/agglomerative-clustering.h"namespace
kaldi
{voidAgglomerativeClusterer::Cluster
落雪snowflake
·
2020-08-19 05:41
KALDI工具
说话人识别
KALDI
中声纹识别学习流程及资源
KALDI
工具包中的例子首先最基础的就是egs/aishell/V1,先跑通它,并理解代码和基础理论知识。egs/sre08REMAD.TXT系统开发所需的数据(除了所描述的测试数据之外) 在..
落雪snowflake
·
2020-08-19 05:40
KALDI工具
说话人识别
kaldi
用ivector计算plda出错
运行结果如下:=====FEATURESEXTRACTION=====steps/make_mfcc.sh--cmdrun.pl--nj1data/trainexp/make_mfcc/trainmfccsteps/make_mfcc.sh:movingdata/train/feats.scptodata/train/.backupsteps/make_mfcc.sh:[info]:nosegme
新一姬
·
2020-08-19 04:32
Kaldi学习
KALDI
中ivector提取过程
/local/data_prep.sh/home/yixin/
kaldi
/egs/clarinet/data/clarinet_audio/wav/home/yixin/
kaldi
/egs/clarinet
新一姬
·
2020-08-19 04:32
Kaldi学习
语音识别
语音识别主流开源框架:HTK、
Kaldi
、CMUSphinx。因为目前只接触了Sphinx,对于另外两个框架没有太深入研究。
飞星
·
2020-08-19 03:14
语音识别
kaldi
强制对齐相关代码介绍
CorpusPhoneticsTutorialEleanorChodroffIntroPennForcedAlignerAutoVOT
Kaldi
OtherResourcesPrerequisitesFamiliarizationTrainingAcousticModelsConceptuallyTrainingAcousticModelsForcedAlignment
Kaldi
ForcedAlig
dlx59140096
·
2020-08-19 01:43
kaldi
kaldi
训练mono-phone——强制对齐
kaldi
中训练声学模型,首先是训练单音素模型,即mono-phone过程,本文主要讲述mono-phone训练的过程。
audiocool
·
2020-08-19 01:29
kaldi
中基于决策树的状态绑定
为什么要做状态绑定假如我们有218monophone,然后现在要考虑上下文音素对发音的影响,这时候我们通常使用triphone。那么会有几个triphone呢?答案是218的3次方。如果不进行聚类,我们需要建立(218的3次方)*3个混合gmm模型(假设每个triphone有3个状态),计算量巨大,另一方面会引起数据稀疏。所以通常我们会根据数据特征对triphone的状态进行绑定。常见的状态绑定方
nlpgeek
·
2020-08-19 01:28
语音识别
声学模型
kaldi
语音特征预处理-mfcc特征与标签对齐(一)
学习
kaldi
已经接近两个月了,终于将
kaldi
中语音的特征数据提取出来,对于其分帧的标签进行对齐,即将输入到TensorFlow搭建的模型中,下面详细的讲解一下如何提取语音的特征以及对音素标签进行对齐
Xwei1226
·
2020-08-19 01:38
kaldi
PYTORCH-
KALDI
语音识别工具包
PYTORCH-
KALDI
语音识别工具包MircoRavanelli1,TitouanParcollet2,YoshuaBengio1*Mila,Universit´edeMontr´eal,∗CIFARFellowLIA
king_audio_video
·
2020-08-18 11:23
webrtc
多媒体
ASP
语音质量评价
ASR
Kaldi
结果文件可视化查看
转载:https://blog.csdn.net/zjm750617105/article/details/52540823目录L.fstMFCC&FBANKmonophone,triphonetreeali.1.gzshow-transitions样例是用自己的数据跑的,改编自wsj,文件名称不是很标准,但重点是工具的使用,加路径是为了好理解,内容暂时不解释,以后有时间来补充。这个文档太棒了,理
我是个粉刷匠
·
2020-08-17 08:52
语音解码网络结果
【
kaldi
】
Kaldi
+CUDA安装向问题(含libtool is not installed.的解决方法)
现在汇总一下出现的问题。(1)Ubuntu16.04更新Nvidia驱动后,图形登录界面无限循环H:目前(请右上看眼发文时间),最新版本的Ubuntu16.04不兼容Nvidia驱动。14.04或者14.10版本是安全的。这里,提供一个站点:厦门大学的信息与网络中心。里面有很多linux版本。有Deepin/CenOS/ubuntu等。(2)虚拟机是(几乎)无法调用GPU的/不能运行CUDA的吗?
HH_Lab
·
2020-08-16 02:41
【kaldi】
【新手第一篇】
win10+cuda8.0+vs2013+kinectv2+bundlefusion的安装配置
bundlefusion下载下来https://github.com/niessner/BundleFusion6.下载mLibExtrernal,放在与bundlefusion同级文件夹下:http://
kaldi
r
CptM
·
2020-08-16 01:40
bundlefusion
语音识别—Viterbi解码
曾看过很多语音识别书(余栋的语音识别实战、陈果果的
kaldi
实战以及张雪英的数位语音处理等书)、课程(七月在线、深蓝学院等课程),上述研究对
Xwei1226
·
2020-08-15 22:58
语音识别-深度学习
语音识别技术(AI VQ HMM),语音样本及开源工具
Kaldi
等,双麦阵列
--AI:计算机视觉、语音识别、NLP(NaturalLanguageProcessing)人工智能正从比较初级的计算智能向更高层次的智能过渡。更高层次的智能包括3个阶段:感知(perception)智能,计算机视觉(computervision),认知(cognition)阶段,第一个阶段是感知(perception)智能,机器要听得见、看得见。听得见是我们常说的语音识别,机器把人说的一句话,由
desaco
·
2020-08-15 22:15
个人研究与计划
热点(hot)技术
在树莓派上搭建
kaldi
离线语音识别系统(交叉编译)
在树莓派上搭建
kaldi
离线语音识别系统(交叉编译)一、系统功能和环境概述1.1、实现功能1.2、开发环境二、
kaldi
语音识别工具箱三、树莓派的相关配置四、
kaldi
交叉编译过程4.1、配置Ubuntu
麻城明歌
·
2020-08-15 11:47
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他