基于语音预训练模型的抑郁症识别研究 |
| |
引用本文: | 黄祥胜,廖义龙,张文劲,张莉.基于语音预训练模型的抑郁症识别研究[J].生物医学工程学杂志,2024(1):9-16. |
| |
作者姓名: | 黄祥胜 廖义龙 张文劲 张莉 |
| |
作者单位: | 中南民族大学生物医学工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(81601586);;中央高校基本科研业务费专项资金项目(CZZ21007,CZQ23031,CZQ23029); |
| |
摘 要: | 针对数量日益增多的抑郁症患者群体,本文提出一种通过语音信号有效识别抑郁症的人工智能方法,以提高诊断和治疗效率。首先,通过微调语音到特征向量模型2.0(wav2vec 2.0)的预训练模型对语音进行编码和上下文化,从而获得高质量的语音特征;然后,应用情感障碍分析的公用数据集——绿野仙踪忧虑分析访谈语料库(DAIC-WOZ)数据集验证上述模型。结果显示,在抑郁症识别的二分类任务中,该方法在精确率方面达到了93.96%、召回率达到了94.87%、F1分数达到了94.41%,总体分类准确率达到96.48%。在评估抑郁症严重程度的四分类任务中,精确率均达到92.59%及以上,召回率均达到92.89%及以上,F1分数均达到93.12%以上,总体分类准确率达到94.80%。基于上述结果证明,本文提出的方法在小样本情况下有效提升了分类的准确率,对于抑郁症的识别和严重程度评估效果良好。未来,该方法有望在抑郁症的诊断中起到辅助支持的作用。
|
关 键 词: | 抑郁症识别 语音预训练模型 语音特征 |
|
|