基于融合模型的中文病历文本智能纠错研究 |
| |
引用本文: | 姜会珍,焦雪莹,邹凌伟,许仕杰,朱卫国.基于融合模型的中文病历文本智能纠错研究[J].中国卫生信息管理,2023(3):448-453. |
| |
作者姓名: | 姜会珍 焦雪莹 邹凌伟 许仕杰 朱卫国 |
| |
作者单位: | 1. 中国医学科学院北京协和医院 |
| |
摘 要: | 目的 针对中文医学病历文本,进行错别字智能纠错,以改善中文病历质量,减少诊疗文书差错产生的概率。方法 将统计语言模型和基于神经网的预训练模型相融合,进行中文病历文本错别字纠错的训练和验证,最终通过综合指标F1进行模型效果的评估。结果 实验结果显示,融合模型的中文病历错别字纠错F1为0.6254,优于单统计语言模型和单预训练模型的F1值0.4813和0.5970。结论 基于统计语言模型和预训练模型的融合方法,在中文病历文本错别字纠错方面有较好的效果,对临床病历书写质量的保障有一定的现实辅助意义。
|
关 键 词: | 自然语言处理 中文病历 错别字纠错 融合模型 |
|
|