kaldi中yesno数据集脚本解析总结

rm -rf data exp mfcc #删除以下文件
local/prepare_data.sh waves_yesno #数据文件准备
local/prepare_dict.sh #数据字典准备
utils/prepare_lang.sh --position-dependent-phones false data/local/dict “” data/local/lang data/lang #利用lang文件将几个文件对操作
utils/fix_data_dir.sh data/KaTeX parse error: Expected 'EOF', got '#' at position 4: x #̲排序文件工具 mkdir -p…PATH:pwd/…/…/…/tools/irstlm/bin #先用pwd获取绝对路径,然后用export更改环境变量
echo “Preparing train and test data” #echo用于字符串的输出
waves_dir=$1 # $1是你给你写的shell脚本传的第一个参数
ls -1 KaTeX parse error: Expected 'EOF', got '#' at position 42: …es_all.list #̲ls -1”的意思是让ls的输…waves_dir是第一个参数的意思?> data/local/waves_all.list 在local下创建list文件
cd data/local…/…/local/create_yesno_waves_test_train.pl waves_all.list waves.test waves.train #好像是把后三个文件创建出来了
…/…/local/create_yesno_wav_scp.pl ${waves_dir} waves.test > ${test_base_name}_wav.scp
…/…/local/create_yesno_wav_scp.pl ${waves_dir} waves.train > ${train_base_name}_wav.scp #把相应的文件创造出来
cp …/…/input/task.arpabo lm_tg.arpa #cp指的是复制;把task.arpabo 复制给lm_tg.arpa
cd …/… #使用cd 命令实现进入当前目录的父目录的父目录

for x in train_yesno test_yesno; do
mkdir -p data/KaTeX parse error: Expected 'EOF', got '#' at position 3: x #̲在data文件夹下创建trai…{x}_wav.scp data/KaTeX parse error: Expected 'EOF', got '#' at position 11: x/wav.scp #̲把(train_yesno t…x.txt data/KaTeX parse error: Expected 'EOF', got '#' at position 8: x/text #̲同理把local下的两个txt…x/text | awk '{printf("%s global\n", KaTeX parse error: Expected 'EOF', got '}' at position 4: 1);}̲' > data/x/utt2spk #前者的text取第一列,后面加上’global’然后生成后面文件 #awk 后面接两个单引号并加上大括号 {} 来配置想要对数据进行的处理动作;
utils/utt2spk_to_spk2utt.pl x / u t t 2 s p k > d a t a / x/utt2spk >data/ x/utt2spk>data/x/spk2utt #利用.pl文件将utt2spk转化成spk2utt #cat+文件=一次显示整个文件
mkdir -p data/local/dict #创建字典文件夹
cp input/lexicon_nosil.txt data/local/dict/lexicon_words.txt #将前者文件复制到后者
cat input/phones.txt | grep -v SIL > data/local/dict/nonsilence_phones.txt #将前者文件中的SIL给移除了,然后把该文件复制到后者
echo “SIL” > data/local/dict/optional_silence.txt #创建后两个文件然后打印SIL
echo “Dictionary preparation succeeded” #最后打印该文字

你可能感兴趣的:(语音识别,kaldi,yesno数据集,shell,语音识别)