基于语音预训练模型的抑郁症识别研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于语音预训练模型的抑郁症识别研究

引用本文：	黄祥胜,廖义龙,张文劲,张莉.基于语音预训练模型的抑郁症识别研究[J].生物医学工程学杂志,2024(1):9-16.

作者姓名：	黄祥胜廖义龙张文劲张莉

作者单位：	中南民族大学生物医学工程学院

基金项目：	国家自然科学基金资助项目（81601586）；;中央高校基本科研业务费专项资金项目（CZZ21007,CZQ23031,CZQ23029）；

摘要：	针对数量日益增多的抑郁症患者群体，本文提出一种通过语音信号有效识别抑郁症的人工智能方法，以提高诊断和治疗效率。首先，通过微调语音到特征向量模型2.0(wav2vec 2.0)的预训练模型对语音进行编码和上下文化，从而获得高质量的语音特征；然后，应用情感障碍分析的公用数据集——绿野仙踪忧虑分析访谈语料库（DAIC-WOZ）数据集验证上述模型。结果显示，在抑郁症识别的二分类任务中，该方法在精确率方面达到了93.96%、召回率达到了94.87%、F1分数达到了94.41%，总体分类准确率达到96.48%。在评估抑郁症严重程度的四分类任务中，精确率均达到92.59%及以上，召回率均达到92.89%及以上，F1分数均达到93.12%以上，总体分类准确率达到94.80%。基于上述结果证明，本文提出的方法在小样本情况下有效提升了分类的准确率，对于抑郁症的识别和严重程度评估效果良好。未来，该方法有望在抑郁症的诊断中起到辅助支持的作用。
关键词：	抑郁症识别语音预训练模型语音特征

设为首页 | 免责声明 | 关于勤云 | 加入收藏