首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
在传统中文电子病历的命名实体识别任务中,针对医疗实体边界不清、实体嵌套、语句成分缺失、高度依赖人工提取特征等问题,提出基于词嵌入结合BiLSTM-CRF模型的中文电子病历命名实体识别模型。将电子病历文本数据集进行脱敏处理及序列标注等数据预处理,结合词嵌入匹配病历文本序列进行词向量化表示,利用BiLSTM神经网络对前后向病历文本进行空间语义建模,获取文本序列的语义特征,然后利用CRF预测实体标签输出。实验结果表明,改进后的BiLSTM-CRF模型显著提高了病历实体识别的准确率和召回率。  相似文献   

2.
基于公开发表的中文病例报告文献构建医学诊疗实体语料库,搭建语料标注审核平台,以基于上下文语义理解的方式识别疾病、症状、检查、治疗4类医学诊疗实体。通过构建字符、词边界、上下文、词性和词典等特征,基于条件随机场模型提出一种多特征融合的中文病例报告诊疗命名实体识别方法,具有较高的识别准确率。  相似文献   

3.
阐述基于BiLSTM-CRF基准模型,融合词向量及词属性推理机制实现中文电子病历命名实体识别的方法,包括医学语料库构建与词向量训练、融合词属性推理机制等,分析实验结果,指出医学领域词向量及词属性推理机制的引入有助于提升中文电子病历命名实体识别效果。  相似文献   

4.
目的:医学问题文本数据存在上下文语义缺失且特征稀疏高维等特点,为提高其聚类效果,提出将文本语义特征和主题特征相融合的文本表示方法用于文本聚类。方法:以医疗社区中的问题文本为数据源,将加权fastText词汇语义特征和LDA文档主题特征融合对问题文本进行表示,构建融合特征用于问题文本聚类,聚类效果评估采用聚类准确度(ACC)和标准互信息(NMI)。结果:与其他方法相比,特征融合的聚类模型表现最佳,其聚类准确度和标准互信息为0.577和0.429,高于其他相关基线模型。结论:实验表明,将特征进行融合能够更加全面准确有效地表征医学问题文本,为医学问题文本特征表示和聚类知识发现提供参考。  相似文献   

5.
目的/意义 改善中文电子病历命名实体识别模型的性能,更好地开展医疗信息的组织和挖掘。方法/过程 构建ERNIE-BiGRU-Attention-CRF中文电子病历命名实体识别模型,首先采用ERNIE1.0预训练模型生成具有语义特征的词向量,然后利用BiGRU捕获全局语义特征与语法结构特征,通过Attention机制进一步增强语义特征的捕获,最后连接CRF解码层输出全局概率最大的标签序列。结果/结论 在公开的医疗文本数据集CCKS2017开展对比实验、消融实验,利用生成的模型进行实例分析,取得较好的识别效果。  相似文献   

6.
目的:探索中医术语的自动识别方法,扩充中医文本的自然语言处理形式。方法采用基于条件随机场( CRF)的方法,针对《伤寒论》文本中的症状、病名、脉象、方剂等中医术语的自动识别标注问题,通过结合字本身、词性、词边界、术语类别标注的特征,分析不同特征组合对术语识别的影响,并探讨最具有效性的组合。结果以字本身、词边界、词性、类别标签为特征组合的中医术语识别模型准确率为85.00%,召回率为68.00%,F值为75.56%。结论字本身、词性、词边界、术语类别标注的多特征融合的模型识别效果最优。  相似文献   

7.
目的 提出一种基于注意力机制的药物词向量生成模型Drug2vec,对药物信息做向量化表示,并与Word2vec和Med2vec模型比较向量转化效果。方法 使用注意力机制捕获医疗实体对中心词的作用,提出了Drug2vec模型,将非结构化电子病历中的医疗实体转化为向量。使用包含14 219例系统性红斑狼疮(SLE)患者和963个药物实体的数据集,测试了Drug2vec模型生成词向量的效果,并且与广泛应用的语言概念空间向量转化模型Word2vec和Med2vec进行对比。结果 在SLE患者数据集中,Drug2vec模型产生的药物词向量准确度优于Word2vec和Med2vec模型。药物词向量相似度排序结果显示Drug2vec模型的向量结果符合临床医师的用药顺序。结论 Drug2vec模型可以更精确地利用周围实体修正中心药物实体,从而产生更准确的药物向量。  相似文献   

8.
基于语义解析和规则匹配融合的模型,利用少量的语义训练语料,以中文医疗知识图谱为知识基础,构建中文医疗问答系统,解决医疗领域中文语料缺乏且标注难度大的问题.该系统由语义解析模块(SPM)和答案查询模块(AQM)组成.其中,SPM由意图识别和命名实体识别组成,它们分别以BERT-TextCNN和BiLSTM-CRF模型为基...  相似文献   

9.
针对中文医学命名实体识别任务中实体细粒度较大、识别准确率不高等问题,提出一种融合特征Albert的中文医学命名实体识别算法,利用自建的真实标注语料对模型进行训练与测试,结果表明模型具有较好的识别效果。  相似文献   

10.
目的/意义 研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据。方法/过程 提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采用双向长短期记忆人工神经网络提取实体特征,使用条件随机场进行序列预测。将人工标注的400份共计5万余字的医案按照3∶1划分为训练集和测试集,使用该模型识别中医医案中的身体部位、药物、症状、疾病4类命名实体。结果/结论 该模型在测试集F1值为84.81%,优于其他未嵌入部首的模型,表明该模型能够更有效地识别中医医案中的命名实体,更好地结构化医案。  相似文献   

11.
目的/意义 探索基于中文电子病历的命名实体识别方法在构建医学知识图谱和相关应用推广方面的技术可行性。方法/过程 采用真实医疗电子病历数据对词嵌入表示模型进行精化,构建医学术语专有嵌入表示,并利用卷积神经网络等多模型提取局部语义特征,实现基于堆叠注意网络的中文医疗命名实体识别。结果/结论 堆叠注意网络模型F1值达到91.5%,较其他模型具备更强的医疗命名实体识别性能。进一步解决中文医疗命名实体识别难点,在实现全局语义特征全面深入提取的同时降低时间成本。  相似文献   

12.
目的 提出一种基于Re-entity新分词方法的条件随机场(CRF)模型,并与双向长短记忆神经网络(BiLSTM)-CRF和Lattice-长短记忆神经网络(LSTM)进行比较。方法 比较了现有实体识别方法和模型后,针对2018年全国知识图谱与语义计算大会(CCKS2018)任务一“电子病历命名实体识别”,提出基于Re-entity的CRF、BiLSTM-CRF、Lattice-LSTM方法,并在不同语料库训练不同参数级别的字符向量集。分别将各方法引入神经网络模型中进行模型性能对比实验,最后分别基于句子级和篇级输入句长进行对比研究。结果 CRF模型在最优特征工程的结果下引入Re-entity方法后性能得到提高,句子级的Lattice-LSTM模型在该任务上取得了89.75%的严格F1-measure,优于CCKS2018任务一的最高结果(89.25%)。结论 基于Re-entity新分词方法的CRF模型可利用中文临床药物知识库有效提高电子病历中药物的识别率,Re-entity方法可改善数据预处理阶段分词导致的错误累加,Lattice结构可以更好地结合字符和词序列的潜在语义信息,同时句子级输入能有效提高神经网络模型的识别准确率。  相似文献   

13.
针对医学文本图像字符识别的后处理技术进行研究,通过建立医学常用专业词库,基于中文汉字图像的Hog特征和相关系数计算字符之间的文字相似度,从而对识别后的文本进行拼写检查校正,提高字符识别准确率。  相似文献   

14.
目的:提出中医药优势病种文献数据语义网络模型构建的思路,以实现中医药优势病种文献数据集成共享,进一步揭示中医药优势病种信息内涵。方法:顶层本体的设计基于中医临床术语系统及中医药学语言系统,抽取中医药概念及关系,利用获取的中医药优势病种文献全信息数据,确定其核心概念和非核心概念。基于基础数据抽取规范,利用顶层本体与基础数据结合的方法构建语义网络模型。结果:通过分析中医药优势病种文献数据特点,成功构建了体现中医药优势病种特色的语义网络模型。结论:构建规范的中医药优势病种文献语义网络模型有利于中医药优势病种信息的集成与应用,可以为中医药数据的统一规范提供指导。  相似文献   

15.
Chinese word processing in nonfluent aphasic patients   总被引:1,自引:0,他引:1  
Background Chinese nonfluent aphasic patients experience apparent speech production deficit, but it remains less known in which part of Chinese speech production this deficit occurs. The present study aimed to examine the ability of nonfluent aphasic patients in Chinese orthography, phonological and semantic processing via two experiments. Experiment I disclosed the general pattern of deficit of Chinese nonfluent aphasic patients in speech production. Experiment II tested whether this deficit occurs in orthography, phonological or semantic processing. Methods The present study adopted neuropsychological testing methods to compare speech production and Chinese word processing between nonfluent aphasic patients (the patient group) and normal individuals (the control group). Character reading and word reading tasks were used to test speech production. Chinese radical decision, rhyme decision and semantic decision tasks were used to examine word processing. Reaction time and the correct answer rate were collected. Results The patient group had a longer reaction time and was more prone to errors in both character reading and word reading tasks than was the control group. For the patient group, there was no difference between the reaction time of character reading and word reading, the error rate of the former was higher than the latter. In radical decision task the reaction time and error rate to the radical "木" were higher in the patient group than in the control group. In the rhyme decision task, the reaction time and error rate to the rhyme "ang" were higher for the aphasic patients. In the semantic decision task the reaction time to characters in the category of animals was higher for the aphasic patients, yet the error rate was not significantly different between the two groups. Conclusions Nonfluent aphasic patients seemingly have decreased speed of speech production and an increased error rate. There is a deficit in phonological processing of aphasic patients while their semantic processing may remain intact.  相似文献   

16.
通过分析医务人员需求、调研循证医学相关标准和数据库,建立了循证医学数据库信息模型的文献特征、诊疗过程和证据强度三维顶层结构模块,并在顶层模块下表达了更加细化概念的数据组和数据元,规范了数据元表达的概念属性等等级语义结构。结果证明,采用模块化的方法构建循证医学数据库信息模型语义结构,能更好地管理和组织临床文献,使医务人员能更好地检索和利用循证医学信息。  相似文献   

17.
Comments were made on the "word-for-word" literal translation method used by Mr. Nigel Wiseman in A Practical Dictionary of Chinese Medicine. He believes that only literal translation can reflect Chinese medical concepts accurately. The so-called "word-for-word" translation is actually "English-wordfor- Chinese-character" translation. First, the authors of the dictionary made a list of Single Characters with English Equivalents, and then they gave each character of the medical term an English equivalent according to the list. Finally, they made some minor modifications to make the rendering grammatically smoother. Many English terms thus produced are confusing. The defect of the word-for-word literal translation stems from the erroneous idea that a single character constitutes the basic element of meaning corresponding to the notion of "word" in English, and the meaning of a disyllabic or polysyllabic Chinese word is the simple addition of the constituent characters. Another big mistake is the negligence of the polysemy of Chinese characters. One or two English equivalents can by no means cover all the various meanings of a single character which is a polysemous monosyllabic word. Various examples were cited from this dictionary to illustrate the mistakes.  相似文献   

18.
从《黄帝内经·素问》中"■"字入手,考证""在中医古典文献中的具体应用,认为《素问》之"■",《灵枢》之"悗"、《针灸甲乙经》之"闷"三字可通也。"■"、"鞔"、"悗"、"免心"等4字是乃"声训"而俱读"免声","懑"、"闷"亦读"莫困切"而"满"则为"懑"字之借用。最后,总结出"■"、"鞔"、"悗"、"免心""懑"、"闷"、"满"形虽有七,而其义则一也,为"■"字的古今鉴别提供了依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号