首页 | 本学科首页   官方微博 | 高级检索  
     

基于RoBERTa的BiLSTM-CRF模型在中文病案实体识别中的应用研究
作者姓名:许思特  孙木
作者单位:上海交通大学医学院附属瑞金医院统计信息科
摘    要:目的:构建适用于中文电子病案审核的命名实体识别模型,提高医院统计部门相关病案审核的工作效率,为人工智能技术在医疗卫生行业的应用奠定基础。方法:基于1 700条真实中文电子病历,选取“症状体征”“疾病诊断”“治疗方式”“解剖部位”“影像检查”“手术”等作为主要实体,结合经人工审核的病案结果进行BIOES标注,基于RoBERTa的BiLSTM-CRF算法,构建中文病案实体识别模型。结果:所建实体识别模型在CCKS2017中准确率为94.80%,召回率为96.03%,F1值为0.95;在CCKS2019中准确率为81.91%,召回率为83.03%,F1值为0.83。与传统基于Word2Vec、BERT的识别模型相比,RoBERTa-BiLSTM-CRF模型具有更优的效果。结论:基于RoBERTa的BiLSTM-CRF模型在中文电子病案实体识别中效果良好,能够对中文电子病历进行有效的初步识别和筛查,提高相关统计人员的审核效率。

关 键 词:住院病案  中文电子病历  命名实体识别  RoBERTa
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号