首页 | 本学科首页   官方微博 | 高级检索  
     

多特征融合的中医古籍医案命名实体识别研究
作者姓名:张璐瑶  束建华  王鹏  阚红星  徐永祥  周洁  唐书宣
作者单位:安徽中医药大学医药信息工程学院 合肥 230012;安徽中医药大学中医学院 合肥 230012;安徽中医药大学新安医学与中医药现代化研究所 合肥 230012
基金项目:中央财政中医药事业传承与发展专项经费资助基金项目(项目编号:RZ2200001383);安徽省高校协同创新项目(项目编号:GXXT-2023-071);安徽省高等学校科学研究重大项目(项目编号:2024AH040143)。
摘    要:
目的/意义 构建中医古籍医案命名实体语料库,提升通用领域命名实体识别模型在中医古籍医案领域的识别精度与适用性。方法/过程 制定中医古籍医案命名实体标注规范,并据此对2 384则新安医案进行人工标注。构建RoBERTa-BiLSTM-CRF中医古籍医案命名实体识别模型,利用RoBERTa预训练语言模型生成具有语义特征的字向量,利用BiLSTM-CRF模型学习序列全局语义特征并解码输出最佳标签序列。引入词典和规则特征,增强模型对实体边界和类别的感知能力。结果/结论 模型在所建立的新安医案命名实体语料库上展现了良好的识别效果。融合领域术语词典与规则特征后,模型的综合F1值提升至72.8%。

关 键 词:中医古籍医案  命名实体识别  语料库  词典  自然语言处理
修稿时间:2024-07-27
点击此处可从《医学信息学杂志》浏览原始摘要信息
点击此处可从《医学信息学杂志》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号