首页 | 本学科首页   官方微博 | 高级检索  
     

基于词嵌入结合BiLSTM-CRF模型的病历实体识别
作者姓名:李超凡  马凯
作者单位:徐州医科大学医学信息与工程学院
基金项目:徐州市科技计划项目重点研发计划(KC21308);
摘    要:在传统中文电子病历的命名实体识别任务中,针对医疗实体边界不清、实体嵌套、语句成分缺失、高度依赖人工提取特征等问题,提出基于词嵌入结合BiLSTM-CRF模型的中文电子病历命名实体识别模型。将电子病历文本数据集进行脱敏处理及序列标注等数据预处理,结合词嵌入匹配病历文本序列进行词向量化表示,利用BiLSTM神经网络对前后向病历文本进行空间语义建模,获取文本序列的语义特征,然后利用CRF预测实体标签输出。实验结果表明,改进后的BiLSTM-CRF模型显著提高了病历实体识别的准确率和召回率。

关 键 词:电子病历  命名实体识别  双向长短期记忆神经网络  条件随机场
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号