python音频特征提取_Python音频特征提取(MFCC, IMFCC, GFCC, LFCC, PNCC ...)

初入音频领域,往往需要学会音频特征提取之后再进一步展开更多的其他工作,然而学会音频处理需要语音信号处理的各种知识(傅里叶变换、DCT变换啊、小波变换啊。。。乱七八糟的我也不懂)

但是python有很多第三方库封装好了很多函数使得人们提取更加简单,常见的库(librosa、numpy...)但是这些都还不够,因为我是一点都不懂 hahahha...

这里介绍一个库(spafe,直接提取,并且各种特征提取都有jupyter notebook范例)

spafe: 简化的Python音频功能提取

spafe旨在简化音频中的特征提取。 该库涵盖:MFCC,IMFCC,GFCC,LFCC,PNCC,PLP等。它还提供了各种滤波器组模块(Mel,Bark和Gammatone滤波器组)和其他频谱统计信息。Fbank、MFCC、BFCC、GFCC、LFCC、MSRCC、NGCC、PNCC、PSRCC特征提取范例(好多特征都没听过...)

spafe库地址Welcome to spafe documentation!​spafe.readthedocs.io

安装极其简单: pip install spafe

提取各种特征的范例程序地址:https://github.com/SuperKogito/spafe/tree/master/examples​github.com

这个项目值得更多的Star!!!

以下是小补充:

范例程序中的fs, sig = scipy.io.wavfile.read("./test.wav")

部分音频可能会报错,换成下面这个会好点sig, fs = librosa.load("./test.wav", sr=16000)

你可能感兴趣的:(python音频特征提取)