首页 | 本学科首页   官方微博 | 高级检索  
检索        

基于深度表示的中医病历症状表型命名实体抽取研究
引用本文:原旎,卢克治,袁玉虎,舒梓心,杨扩,张润顺,李晓东,周雪忠.基于深度表示的中医病历症状表型命名实体抽取研究[J].世界科学技术-中医药现代化,2018,20(3):355-362.
作者姓名:原旎  卢克治  袁玉虎  舒梓心  杨扩  张润顺  李晓东  周雪忠
作者单位:1. 北京交通大学计算机与信息技术学院 北京 100044;,1. 北京交通大学计算机与信息技术学院 北京 100044;,1. 北京交通大学计算机与信息技术学院 北京 100044;,2. 湖北省中医院 武汉 430061;,1. 北京交通大学计算机与信息技术学院 北京 100044;,3. 中国中医科学院广安门医院 北京 100053,2. 湖北省中医院 武汉 430061;,1. 北京交通大学计算机与信息技术学院 北京 100044;
基金项目:国家中医药管理局2015年度国家中医临床研究基地业务建设第二批科研专项(JDZX2015171):肝病回顾性病例表型信息抽取方法与分析研究,负责人:周雪忠;国家科技部国家重点研发计划项目(2017YFC1703506):中医药大数据挖掘研究与创新应用,负责人:于剑。
摘    要:目的:命名实体识别在自然语言处理中是最基本的任务之一,本文通过应用深度表示的方法实现临床上的现病史数据的自动标识。方法:本文随机选取了10 426条现病史句子作为主要的文本研究对象,分别用词嵌入(word2vec)和网络结构特征(node2vec)两种构建向量的方法生成不同的词向量特征,再在基于条件随机场(Conditional Random Field,CRF)和结构化支持向量机(Structured Support Vector Machines,SSVM)的方法上进行十重交叉验证,计算并比较基于深度表示的症状表型命名实体抽取的性能。结果:传统的CRF算法的三个评价指标(准确率,召回率,F 值)为(0.888 9,0.786 9,0.834 8);基于WENER方法下的CRF和SSVM的评价指标为(0.975 0,0.984 9,0.979 8)和(0.992 8,0.988 9,0.990 8);在GENER方法下基于词的CRF和SSVM算法的三个评价指标为(0.972 8,0.976 8,0.975 2)和(0.983 3,0.974 5,0.978 8);GENER方法下基于字的CRF和SSVM算法的评价指标为(0.927 8,0.862 8,0.887 9)和(0.943 7,0.946 8,0.941 3)。结论:深度表示的命名实体抽取算法性能要比传统的非深度表示的命名实体标识算法性能好。另外,通过比较深度表示的两种算法的性能后发现,无论是基于word2vec生成的词向量还是基于node2vec生成的词向量,SSVM模型算法性能均优于CRF算法的性能。

关 键 词:条件随机场  结构化支持向量机  命名实体抽取  中医病历
收稿时间:2018/2/11 0:00:00
修稿时间:2018/3/14 0:00:00

Depth Representation-based Named Entity Extraction for Symptom Phenotype of TCM Medical Record
Yuan Ni,Lu Kezhi,Yuan Yuhu,Shu Zixin,Yang Kuo,Zhang Runshun,Li Xiaodong and Zhou Xuezhong.Depth Representation-based Named Entity Extraction for Symptom Phenotype of TCM Medical Record[J].World Science and Technology-Modernization of Traditional Chinese Medicine,2018,20(3):355-362.
Authors:Yuan Ni  Lu Kezhi  Yuan Yuhu  Shu Zixin  Yang Kuo  Zhang Runshun  Li Xiaodong and Zhou Xuezhong
Institution:1. College of Computer Science and Information Technology Beijing Jiaotong University, Beijing 100044, China;,1. College of Computer Science and Information Technology Beijing Jiaotong University, Beijing 100044, China;,1. College of Computer Science and Information Technology Beijing Jiaotong University, Beijing 100044, China;,2. Hubei Hospital of Traditional Chinese Medicine, Wuhan 430061, China;,1. College of Computer Science and Information Technology Beijing Jiaotong University, Beijing 100044, China;,3. Guang??anmen Hospital, Chinese Academy of Chinese Medical Sciences, Beijing 100053, China,2. Hubei Hospital of Traditional Chinese Medicine, Wuhan 430061, China; and 1. College of Computer Science and Information Technology Beijing Jiaotong University, Beijing 100044, China;
Abstract:
Keywords:Conditional random field  structured support vector machines  named entity recognition deep representationtraditional Chinese medical recordst
点击此处可从《世界科学技术-中医药现代化》浏览原始摘要信息
点击此处可从《世界科学技术-中医药现代化》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号