摘 要: | 基于机器学习和信号处理的声学检测方法是目前病理嗓音检测的重要手段,嗓音特征的提取是其中至关重要的一环。目前广泛使用的特征,存在依赖基频提取、易受噪声影响、计算复杂度高等不足。针对这些不足,本文提出了一种基于多频带分析和混沌分析的病理嗓音检测方法。使用gammatone滤波器组模拟人耳听觉特性进行多频带分析,获取不同频带的信号;根据嗓音中的混沌现象带来的湍流噪声会恶化频谱收敛性的特点,对每个频带的信号进行短时傅里叶变换,提取特征gammatone短时谱自相似度(GSTS),分析每个频带信号的混沌程度,来区分正常和病理嗓音。实验结果显示,结合传统机器学习方法,GSTS在马萨诸塞州眼耳医院(MEEI)病理嗓音数据库中识别准确率达到99.50%,相比已有识别率最高的特征提升3.46%,同时特征提取时间相比传统非线性特征大幅减少。该结果表明,相比已有特征,GSTS具有更高的提取效率和更好的识别效果。
|