您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页MFCCFilterBank的提取流程

MFCCFilterBank的提取流程

来源:爱go旅游网
MFCCFilterBank的提取流程

1. 预加重:通过⼀个⼀阶有限激励响应⾼通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响。

2. 分帧:根据语⾳的短时平稳特性,语⾳可以以帧为单位进⾏处理,实验中选取的语⾳帧长为32ms,帧移为16ms。3. 加窗:采⽤汉明窗对⼀帧语⾳加窗,以减⼩吉布斯效应的影响。

1. 汉明窗,海明窗,是⼀个窗函数,这个函数在某⼀区间有⾮零值,⽽在其余区间皆为0。这是为了⽅便做快速傅⾥叶变换4. 快速傅⽴叶变换(Fast Fourier Transformation, FFT):将时域信号变换成为信号的功率谱(频域信号)。

5. 梅尔滤波器组: ⽤⼀组Mel频标上线性分布的三⾓窗滤波器(共24个三⾓窗滤波器),对信号的功率谱滤波,每⼀个三⾓窗滤波器覆盖的范围都近似于⼈⽿的⼀个临界带宽,以此来模拟⼈⽿的掩蔽效应。 ⼀般取40个三⾓滤波器,取对数后即40维fbank6. 求对数:三⾓窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。

7. 离散余弦变换(Discrete Cosine Transformation, DCT,可选):去除各维信号之间的相关性(去相关),将信号映射到低维空间(从40维降到13维)。 若去除这⼀步,得到的则是Filter Bank特征,因为dnn模型可以学习特征间的相关性,因此不需要

去相关性的操作。

8. 得到MFCC或Filter Bank

9. Delta差分:⼤量实验表明,在语⾳特征中加⼊表征语⾳动态特性的差分参数,能够提⾼系统的识别性能。在本系统中,我们也⽤到了MFCC参数的⼀阶差分参数(Delta-Delta)和⼆阶差分参数(Delta-Delta+Delta)。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务