首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
在传统中文电子病历的命名实体识别任务中,针对医疗实体边界不清、实体嵌套、语句成分缺失、高度依赖人工提取特征等问题,提出基于词嵌入结合BiLSTM-CRF模型的中文电子病历命名实体识别模型。将电子病历文本数据集进行脱敏处理及序列标注等数据预处理,结合词嵌入匹配病历文本序列进行词向量化表示,利用BiLSTM神经网络对前后向病历文本进行空间语义建模,获取文本序列的语义特征,然后利用CRF预测实体标签输出。实验结果表明,改进后的BiLSTM-CRF模型显著提高了病历实体识别的准确率和召回率。  相似文献   

2.
针对现有的向量空间模型在电子病历聚类时忽略语义关系的不足,提出了一种基于关联关系的电子病历聚类方法:从海量的电子病历中分析特征语的同现概率,根据关联规则分析特征词语的关联关系,挖掘电子病历特征词之间的隐含语义关系,表达电子病历向量,结果表明,基于关联关系的电子病历聚类更为准确。  相似文献   

3.
目的/意义 探讨基于电子病历的临床决策支持领域研究现状、研究热点与前沿。方法/过程 基于文献计量方法,运用CiteSpace 6.2.R2软件绘制国家/地区分布、作者合作、机构合作、关键词共现和聚类科学知识图谱进行可视化分析,通过Python进行聚类热度挖掘与分析。结果/结论 基于电子病历数据的临床决策支持领域呈现快速发展态势,美国、中国为主要研究国家,国内外机构之间存在较强合作关系,关键词主要涉及电子病历、人工智能等。  相似文献   

4.
目的:通过研究电子病历中文字词提取及字词分布规律,探讨妇幼病历中文字词分布规律及特征词库构建。方法:以不同城市的两所妇幼保健医院某年患者全量电子病历为例,按互联网通用词库、医疗术语库、医疗术语分词库、病历分词库、术语及病历分词联合分词库等不同字词库对电子病历样本进行字词对比统计分析,并以此分析提取出妇幼病历字词分布规律及其字词特征。结果:妇幼病历样本统计结果表明,妇幼病历中文字词相对集中、量级有限、分布有规律、字词特征明显。结论:妇幼电子病历中文字词及其分布规律研究表明,妇幼电子病历中文字集中在2 000个左右,中文词也是集中在2 000个以内,妇幼特征词共有3 178个,因此以妇幼电子病历为例进行中文字词研究具有重要意义,对后期电子病历智能应用与开发具有参考价值。  相似文献   

5.
目的:针对当前电子病历录入中的便捷性与规范性的双重需求,尝试利用神经网络算法来挖掘病历文本的语言习惯和承接关系,以便嵌入病历录入系统,提高医生输入的效率和质量。方法:设计了基于大数据的电子病历录入推荐工具,对骨创伤科病历文本进行清洗构建训练集后做特征编码,采用基于深度学习的BiLSTM网络算法,学习专科专病的语义信息。结果:分别基于BERT特征、独热编码、词向量三种文本表示,针对过往病历数据建立BiLSTM模型,预测下一句文本,结果表明使用BERT预训练模型特征的BiLSTM模型F1-score达到75.23%,且具有实际应用的价值。在专科专病文本推荐的场景下,BERT特征优于独热编码和Word2Vec词向量。  相似文献   

6.
目的探索利用主成分-线性判别分析基于中药的功效主治属性判别其药性的可行性。方法收集《中华本草》中收录的药性明确、功效主治属性特征详尽的植物药1 725种,首先运用主成分-线性判别建立模型,以此模型对药性进行判别分类,采用10次5折交叉验证评价模型稳定性,然后按照随机抽样的原则,从寒、热性两类药材中分别随机抽取80%(共1 380种)的药材作为训练集建立模型,其余20%(共345种)药材组成测试集,做预测。结果运用主成分-线性判别模型,全部1 725种中药的组内判别正确率为94.43%,交叉验证平均正确率为91.54%。训练组的组内回代判别正确率为94.78%,测试组的预测正确率为90.14%。结论基于主成分-线性判别对中药药性进行判别,不仅保证了线性判别的正常运行,而且判别准确率高,模型稳定性好,能够为临床用药提供依据。  相似文献   

7.
目的:分析电子病历中的患者特征,实现冠心病患者亚型下危险因素的分层抽取。方法:提出改进的Labeled LDA模型,以多项分布生成冠心病亚型类别标签,然后从亚型类别标签生成危险因素分层这一隐含主题,构建冠心病亚型—患者—危险因素分层—患者特征的4层结构主题模型。该模型通过建立亚型类别标签与危险因素分层之间的映射关系,首先对冠心病亚型进行多分类预测,然后实现患者危险因素在不同亚型下的分层自动抽取。结果:使用真实临床环境采集的电子病历数据进行验证,准确率达到了83.23%,Macro-F1值达到了82.31%。结论:实验结果表明,通过约束患者亚型类别与危险因素分层隐含主题之间的映射,改进的Labele LDA模型具有较高的模型可解释性,且准确率均高于逻辑回归、支持向量机、随机森林和Light GBM等4种对比模型。  相似文献   

8.
在对文本挖掘和中文分词方法进行概述的基础上,结合中文生物医学文本的特点,提出基于重现的无词典分词方法在构建医学文献相关性数据库、发现医学新名词、预测新兴研究趋势和基于文献的知识发现中的应用设想.  相似文献   

9.
目的结合自然语言处理方法,研究可以有效抽取中医古籍中所含症状和药物文本实体信息的方法。方法以《金匮要略》为例,采用条件随机场(CRF)算法,先将文本进行分词处理,然后以词性、基于键值对的中医诊断标记集作为辅助特征,通过症状-药物BIO标签为训练特征来训练出模型,然后利用该模型对测试集文本进行自动标签标注。结果基于多特征CRF自动标注的结果准确率达到84.5%,召回率达到70.9%,F测度值达到77.1%。结论运用CRF方法加入词性、中医诊断标记集特征集进行训练得出的多特征模型,能有效提高CRF算法对中医古籍的实体抽取能力,生成的模型可用来自动化抽取中医古籍文本的症状药物实体信息。  相似文献   

10.
目的:电子病历数据中的主诉、现病史、既往史、鉴别诊断、影像诊断、手术记录等主体内主要采用中文自然语言文字描述,是临床医生实际诊疗细节的具体体现,包含了诊疗细节的大量、丰富信息。本研究目的在于建立一种从中进行有效信息提取并组织成可分析利用的形式,供目前医学数据处理、医学研究之用。方法:基于医院的真实电子病历数据,设计定制化的基于规则学习及信息抽取方法,采用三个步骤实现中文信息的抽取:(1)抽样标注,随机抽取600份电子病历的病史信息(包括现病史、既往史、个人史、家族史等),采用本研究开发的标注平台,对其中需要抽取的信息(以糖尿病史为实例)进行标注;(2)根据标注结果,进行抽取模版归纳,并将抽取模版进行重写,生成可以直接用于抽取的Perl语言正则表达式抽取规则,并利用这些规则进行实际信息抽取;(3)对抽取结果进行人工验证与自动化验证相结合的方法,对方法的有效性进行验证。结果:所设计方法已在国家医疗数据中心平台上实现,并针对糖尿病病史抽取在医院进行了单个科室的现场验证,2015年1 436份糖尿病患者病历的病史抽取结果为召回率87.6%、准确率99.5%、F分数(F-Score)0.93;全体糖尿病患者10%抽样病历共1 223份的抽取结果为召回率89.2%、准确率99.2%、F-Score 0.94,效果较好。结论:主要采用自然语言处理与基于规则的信息抽取相结合的方法,设计并实现了从非结构化的中文电子病历文本数据中抽取定制化信息的算法,与已有工作比对效果较好。  相似文献   

11.
目的:探究2010-2019年国际上电子病历研究领域的热点.方法:以2010-2019年Web of Science中有关电子病历研究的12217篇文献作为研究对象,以作者关键词、扩展关键词和摘要为文档语料,通过各主题的困惑度确定最佳主题个数,采用LDA主题模型实现主题聚类.通过主题强度和阈值确定电子病历研究领域201...  相似文献   

12.
电子病历文本中存在错别字既不符合国家电子病历管理规范,又降低了自然语言处理技术的效果,影响了电子病历的价值挖掘与应用。阐述了一种基于在大量真实病历语料上训练出的预训练语言模型进行自动纠错的方法。实验证明,该方法在仿真数据集和真实病历数据集上检错和纠错都取得了很好的效果,运行效率很高,可以支持事中和事后的电子病历纠错,有效提升电子病历质量,推动电子病历的应用。  相似文献   

13.
电子病历与医疗质量实时控制研究   总被引:2,自引:0,他引:2  
简要介绍电子病历的涵义与模块构成,探讨如何利用电子病历从信息共享、时限控制、分级管理、临床决策支持几方面实现医疗质量实时控制,指出电子病历应用过程中面临的挑战及其应对策略,即加强质量管理教育、决策层高度重视、推进医院全面信息化管理以及提升决策支持能力。  相似文献   

14.
《J Am Med Inform Assoc》2006,13(4):456-464
This study evaluated the domain completeness and expressiveness issues of the International Classification for Nursing Practice-based (ICNP) nursing data dictionary (NDD) through its application in an enterprise electronic medical record (EMR) system as a standard vocabulary at a single tertiary hospital in Korea. Data from 2,262 inpatients obtained over a period of 9 weeks (May to July 2003) were extracted from the EMR system for analysis. Among the 530,218 data-input events, 401,190 (75.7%) were entered from the NDD, 20,550 (3.9%) used only free text, and 108,478 (20.4%) used a combination of coded data and free text. A content analysis of the free-text events showed that 80.3% of the expressions could be found in the NDD, whereas 10.9% were context-specific expressions such as direct quotations of patient complaints and responses, and references to the care plan or orders of physicians. A total of 7.8% of the expressions was used for a supplementary purpose such as adding a conjunction or end verb to make an expression appear as natural language. Only 1.0% of the expressions were identified as not being covered by the NDD. This evaluation study demonstrates that the ICNP-based NDD has sufficient power to cover most of the expressions used in a clinical nursing setting.  相似文献   

15.
目的 探讨基于灰阶超声的不同影像组学模型鉴别乳腺肿块良恶性的临床价值.方法 回顾性分析2018年10月至2020年10月皖南医学院附属太和县人民医院经病理证实的180例患者的乳腺肿块灰阶超声图像并提取影像特征,将肿块按照7:3随机抽样,其中126个肿块作为训练组,54个肿块作为验证组.采用单因素方差分析及最小绝对收缩和...  相似文献   

16.
目的:通过预实验评价不同拼音输入法在电子病历录入中的输入效率。方法:选择3种常用的拼音输入法记录随机抽取的3份病史相关的文本的人机交互行为,分别计算3个文本的错误率以及输入速率,并从文本错误率和输入速率两方面评价各输入法的输入效率。随机选择长度相似的3份新闻文本,对输入法的输入效率进行对比分析。结果:各输入法在同类型的3份文本中的输入速率和文本错误率基本一致。各输入法在EMR录入中的平均速率新闻文本录入,而文本错误率则基本一致。结论:常用输入法在电子病历录入中的输入效率有待提升。  相似文献   

17.
研究了一种基于海量文本挖掘对新兴技术进行分析的方法,并以美国SBIR计划国防部项目数据为例对新兴技术进行实验分析。通过合理选定信息源、建立技术高频词库、新兴技术术语筛选、领域专家研判等环节生成新兴技术领域词簇,再结合应用场景分析建模,可支持从多维度分析评估新兴技术功效。对美国SBIR项目相关海量文本中重点实体的语句级共现关系进行挖掘分析,深度揭示了军事智能领域的新兴技术与战争类型、作战能力之间的量化关联。  相似文献   

18.
分析了医学新闻信息利用的必要性及自动标引的发展现状,提出一种医学新闻文本自动受控标引方法,即以分词词表为基础词表,引入汉化MeSH词表建立标引词表,对中文医学新闻文本进行分词、词频统计和排序,过滤掉不在主题词表中的高频词后,选取词频最高的5个MeSH主题词用作标引词。  相似文献   

19.
目的/意义 探讨人工智能技术应用于淋巴水肿患者电子病历非结构化文本数据的关键实体识别问题。方法/过程 阐述样本稀缺背景下模型微调训练的解决方案,选取首都医科大学附属北京世纪坛医院淋巴外科既往收治患者594例为研究对象,依据临床医生标注的15种关键实体类别,微调GlobalPointer模型的预测层,借助其全局指针识别嵌套和非嵌套的关键实体。分析实验结果的准确性和临床应用可行性。结果/结论 微调后模型总体精准率、召回率和 Macro_F1均值分别为0.795、0.641和0.697,为淋巴水肿电子病历数据精准挖掘奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号