首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 218 毫秒
1.
目的/意义 探索基于中文电子病历的命名实体识别方法在构建医学知识图谱和相关应用推广方面的技术可行性。方法/过程 采用真实医疗电子病历数据对词嵌入表示模型进行精化,构建医学术语专有嵌入表示,并利用卷积神经网络等多模型提取局部语义特征,实现基于堆叠注意网络的中文医疗命名实体识别。结果/结论 堆叠注意网络模型F1值达到91.5%,较其他模型具备更强的医疗命名实体识别性能。进一步解决中文医疗命名实体识别难点,在实现全局语义特征全面深入提取的同时降低时间成本。  相似文献   

2.
基于真实中文电子病历与网络爬取数据,构建病历实体识别模型,确定实体关系,进行知识图谱可视化展现,搭建基于规则匹配的问答系统。探索适用于中文电子病历的知识图谱与知识体系构建方法,提高医院统计部门相关审核工作效率,为人工智能技术在医疗卫生行业应用奠定基础。  相似文献   

3.
目的/意义 改善中文电子病历命名实体识别模型的性能,更好地开展医疗信息的组织和挖掘。方法/过程 构建ERNIE-BiGRU-Attention-CRF中文电子病历命名实体识别模型,首先采用ERNIE1.0预训练模型生成具有语义特征的词向量,然后利用BiGRU捕获全局语义特征与语法结构特征,通过Attention机制进一步增强语义特征的捕获,最后连接CRF解码层输出全局概率最大的标签序列。结果/结论 在公开的医疗文本数据集CCKS2017开展对比实验、消融实验,利用生成的模型进行实例分析,取得较好的识别效果。  相似文献   

4.
介绍国内外电子病历命名实体识别研究现状,阐述基于注意力机制和膨胀卷积神经网络的电子病历命名实体识别模型构建方法、结构以及实验环境、具体设计和结果,实验表明该模型具有更好的命名实体识别效果。  相似文献   

5.
在传统中文电子病历的命名实体识别任务中,针对医疗实体边界不清、实体嵌套、语句成分缺失、高度依赖人工提取特征等问题,提出基于词嵌入结合BiLSTM-CRF模型的中文电子病历命名实体识别模型。将电子病历文本数据集进行脱敏处理及序列标注等数据预处理,结合词嵌入匹配病历文本序列进行词向量化表示,利用BiLSTM神经网络对前后向病历文本进行空间语义建模,获取文本序列的语义特征,然后利用CRF预测实体标签输出。实验结果表明,改进后的BiLSTM-CRF模型显著提高了病历实体识别的准确率和召回率。  相似文献   

6.
针对中文电子病历命名实体识别任务中存在的边界划分不准确、实体识别率不高等问题,提出基于深度学习的CNN-BiLSTM-CRF模型,详细阐述模型结构与原理,采集3 127份中文电子病历数据进行实验以验证模型性能,结果表明该模型具有较好的识别效果及性能。  相似文献   

7.
分析中文电子病历数据实体关系提取常用方法,提出一种基于双向编码器表征的实体关系联合抽取算法,使用级联解码器以及指针标注方法完成实体关系抽取及实体识别,实验结果证明该方法可有效抽取电子病历实体关系。  相似文献   

8.
采用自标注中文电子病历标准数据集,融合相似度算法与预训练模型并分别应用于实体映射的候选实体生成和实体消歧阶段,对不同相似度算法和预训练模型的性能进行比较分析。提出基于别名间相似性改进药物类实体映射效果的方法,结合Jaccard相似度算法与BERT预训练模型,高效实现海量中文电子病历实体映射任务。  相似文献   

9.
目的:构建适用于中文电子病案审核的命名实体识别模型,提高医院统计部门相关病案审核的工作效率,为人工智能技术在医疗卫生行业的应用奠定基础。方法:基于1 700条真实中文电子病历,选取“症状体征”“疾病诊断”“治疗方式”“解剖部位”“影像检查”“手术”等作为主要实体,结合经人工审核的病案结果进行BIOES标注,基于RoBERTa的BiLSTM-CRF算法,构建中文病案实体识别模型。结果:所建实体识别模型在CCKS2017中准确率为94.80%,召回率为96.03%,F1值为0.95;在CCKS2019中准确率为81.91%,召回率为83.03%,F1值为0.83。与传统基于Word2Vec、BERT的识别模型相比,RoBERTa-BiLSTM-CRF模型具有更优的效果。结论:基于RoBERTa的BiLSTM-CRF模型在中文电子病案实体识别中效果良好,能够对中文电子病历进行有效的初步识别和筛查,提高相关统计人员的审核效率。  相似文献   

10.
阐述基于BiLSTM-CRF基准模型,融合词向量及词属性推理机制实现中文电子病历命名实体识别的方法,包括医学语料库构建与词向量训练、融合词属性推理机制等,分析实验结果,指出医学领域词向量及词属性推理机制的引入有助于提升中文电子病历命名实体识别效果。  相似文献   

11.
提出一种基于三元组信息抽取策略的新型实体提取模型,以解决传统命名实体识别方法应用于高血压中医电子病历医疗实体识别时出现的实体离散问题,阐述实验数据集及相关处理、实验方法与结果,为中医医疗实体自动化抽取提供方法学参考。  相似文献   

12.
Objectives Medical knowledge extraction (MKE) plays a key role in natural language processing (NLP) research in electronic medical records (EMR), which are the important digital carriers for recording medical activities of patients. Named entity recognition (NER) and medical relation extraction (MRE) are two basic tasks of MKE. This study aims to improve the recognition accuracy of these two tasks by exploring deep learning methods.Methods This study discussed and built two application scenes of bidirectional long short-term memory combined conditional random field (BiLSTM-CRF) model for NER and MRE tasks. In the data preprocessing of both tasks, a GloVe word embedding model was used to vectorize words. In the NER task, a sequence labeling strategy was used to classify each word tag by the joint probability distribution through the CRF layer. In the MRE task, the medical entity relation category was predicted by transforming the classification problem of a single entity into a sequence classification problem and linking the feature combinations between entities also through the CRF layer.Results Through the validation on the I2B2 2010 public dataset, the BiLSTM-CRF models built in this study got much better results than the baseline methods in the two tasks, where the F1-measure was up to 0.88 in NER task and 0.78 in MRE task. Moreover, the model converged faster and avoided problems such as overfitting.Conclusion This study proved the good performance of deep learning on medical knowledge extraction. It also verified the feasibility of the BiLSTM-CRF model in different application scenarios, laying the foundation for the subsequent work in the EMR field.  相似文献   

13.
针对中文医学命名实体识别任务中实体细粒度较大、识别准确率不高等问题,提出一种融合特征Albert的中文医学命名实体识别算法,利用自建的真实标注语料对模型进行训练与测试,结果表明模型具有较好的识别效果。  相似文献   

14.
目的/意义 探讨人工智能技术应用于淋巴水肿患者电子病历非结构化文本数据的关键实体识别问题。方法/过程 阐述样本稀缺背景下模型微调训练的解决方案,选取首都医科大学附属北京世纪坛医院淋巴外科既往收治患者594例为研究对象,依据临床医生标注的15种关键实体类别,微调GlobalPointer模型的预测层,借助其全局指针识别嵌套和非嵌套的关键实体。分析实验结果的准确性和临床应用可行性。结果/结论 微调后模型总体精准率、召回率和 Macro_F1均值分别为0.795、0.641和0.697,为淋巴水肿电子病历数据精准挖掘奠定基础。  相似文献   

15.
知识图谱技术促进了新药研发的进展,但国内研究起点晚且领域知识多以文本形式存储,图谱重用率低。因此,本研究基于多源异构的医药文本,设计了以Bert-wwm-ext预训练模型为基础,并融合级联思想的中文命名实体识别模型,从而减少了传统单次分类的复杂度,进一步提高了文本识别的效率。实验结果显示,该模型在自建的训练语料上的F1分数达0.903,精确率达89.2%,召回率达91.5%。同时,将模型应用于公开数据集CCKS2019上,结果显示该模型能够更好地识别中文文本中的医疗实体。最后,利用此模型构建了一个中文医药知识图谱,图谱包含13 530个实体,10 939个属性,以及39 247个相关关系。本研究所提出的中文医药实体识别与图谱构建方法,有望助力研究者加快医药知识新发现,从而缩短新药研发进程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号