基于词嵌入结合BiLSTM-CRF模型的病历实体识别 |
| |
作者姓名: | 李超凡 马凯 |
| |
作者单位: | 徐州医科大学医学信息与工程学院 |
| |
基金项目: | 徐州市科技计划项目重点研发计划(KC21308); |
| |
摘 要: | 在传统中文电子病历的命名实体识别任务中,针对医疗实体边界不清、实体嵌套、语句成分缺失、高度依赖人工提取特征等问题,提出基于词嵌入结合BiLSTM-CRF模型的中文电子病历命名实体识别模型。将电子病历文本数据集进行脱敏处理及序列标注等数据预处理,结合词嵌入匹配病历文本序列进行词向量化表示,利用BiLSTM神经网络对前后向病历文本进行空间语义建模,获取文本序列的语义特征,然后利用CRF预测实体标签输出。实验结果表明,改进后的BiLSTM-CRF模型显著提高了病历实体识别的准确率和召回率。
|
关 键 词: | 电子病历 命名实体识别 双向长短期记忆神经网络 条件随机场 |
|