首页 | 本学科首页   官方微博 | 高级检索  
检索        

基于语音预训练模型的抑郁症识别研究
引用本文:黄祥胜,廖义龙,张文劲,张莉.基于语音预训练模型的抑郁症识别研究[J].生物医学工程学杂志,2024(1):9-16.
作者姓名:黄祥胜  廖义龙  张文劲  张莉
作者单位:中南民族大学生物医学工程学院
基金项目:国家自然科学基金资助项目(81601586);;中央高校基本科研业务费专项资金项目(CZZ21007,CZQ23031,CZQ23029);
摘    要:针对数量日益增多的抑郁症患者群体,本文提出一种通过语音信号有效识别抑郁症的人工智能方法,以提高诊断和治疗效率。首先,通过微调语音到特征向量模型2.0(wav2vec 2.0)的预训练模型对语音进行编码和上下文化,从而获得高质量的语音特征;然后,应用情感障碍分析的公用数据集——绿野仙踪忧虑分析访谈语料库(DAIC-WOZ)数据集验证上述模型。结果显示,在抑郁症识别的二分类任务中,该方法在精确率方面达到了93.96%、召回率达到了94.87%、F1分数达到了94.41%,总体分类准确率达到96.48%。在评估抑郁症严重程度的四分类任务中,精确率均达到92.59%及以上,召回率均达到92.89%及以上,F1分数均达到93.12%以上,总体分类准确率达到94.80%。基于上述结果证明,本文提出的方法在小样本情况下有效提升了分类的准确率,对于抑郁症的识别和严重程度评估效果良好。未来,该方法有望在抑郁症的诊断中起到辅助支持的作用。

关 键 词:抑郁症识别  语音预训练模型  语音特征
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号