首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
目的:通过挖掘电子病历文本中的信息,探索有效的文本挖掘方法,以期实现电子病历的决策支持价值。方法:将2500份胃癌患者电子病历随机分为训练组和测试组,利用词典结合统计的方法对训练组病历文本进行分词,根据每个切分词与从病历中抽取的治疗方案的共现频次对切分词进行聚类,统计训练组病历中的文本在各个聚类中词的匹配数,并以训练组病历文本在各类中的匹配词数和治疗方案建立起Bayes判别函数作为决策支持模型,对测试组病历进行验证,对分词方法及判别模型进行评价。结果:随机抽取50份发现分词召回率为74.24%,准确率为82.30%,F-1值为78.06%。在切分词聚为五类时,所建立的判别模型对测试组病历的判定准确率为62%。结论:词典结合统计的分词方法在电子病历文本分词中的效果较好,基于聚类的电子病历文本挖掘可实现病历的决策支持价值,但建立的决策支持模型准确度不高,仍需对建模过程中病历文本分词及切分词的处理进行进一步研究。  相似文献   

2.
目的:利用计算机自动揭示大量医学文献中蕴含的中西医疾病名称对应关系,为中西医知识体系融合和临床诊疗实践提供借鉴参考。方法:构建中西医病名词典和抽取规则,利用自编程序对医学文献进行分词、特征词匹配,抽取病名对应关系,并通过人工审核和效果评估,循环迭代优化算法,选取糖尿病相关文献并进行验证。结果:获取到552个与糖尿病相关的中西医疾病名称对应关系,准确率(P)为88.75%,召回率(R)为76.67%,F值为82.27%。结论:验证了改进模式匹配的中西医疾病名称关联映射算法的有效性,可为中西医疾病名称关联对应研究提供新思路。  相似文献   

3.
目的分析近一年我院全面实施电子病历系统后的部分住院电子病历存在的问题,探讨其的改进措施。方法随机抽取2011年7月-2012年6月的住院电子病历3000份,三位检查员检查选取的电子病历资料的质量,并填写调查表,分析电子病历中存在的问题。主要问题:(1)电子记录的拷贝和粘贴,(2)过度使用的电子模版,(3)缺少的患者或医师的签名,(4)记录的时间不准确,(5)未及时记录,以及(6)其他。按电子病历缺陷成因分为以下四组:医师、护士、患者或亲属以及一般工作人员例如基本信息记录员和病案编码员。结果六类主要问题中,抽取的电子病历缺陷率分别占16.5%,27.8%,9.2%,3.9%,2.7%和5.5%。不同的成因组内记录缺陷率也明显不同。电子病历的使用权限对其缺陷率也有一定的影响。结论在电子病历的生成过程中,各组人员都应该认真按照工作要求尽职尽责,电子病历系统可以针对专业性人员进行使用权限管理、修改权限管理、专业性模版设计以方便使用并减少错误。建立电子病历管理系统应包括完善的系统管理应用程序、上级医师审阅并签署电子病历、有关电子病历书写法律和法规的培训,电子病历评审流程的确立,不断的完善电子病历的制度建设和网络建设。  相似文献   

4.
目的:利用前馈神经网络实现电子病历的辅助诊断。方法:通过定义数据元,按照规则从入院记录、首次病程记录中提取临床信息;然后基于前馈神经网络训练学习模型进行辅助诊断。系统从首次病程记录的诊断依据中提取临床信息作为神经网络的输入,以病历的出院诊断(ICD-10疾病编码)作为输出,利用科室的归档病历训练模型。主管医生录入入院记录后,系统自动解析病历,推荐诊断。结果:基于该模型对心血管内科1000份、神经内科914份电子病历进行测试,诊断符合率分别达到医生诊断水平的86%、76%。结论:基于前馈神经网络的电子病历辅助诊断系统性能整体表现良好,是人工智能辅助诊断的有益探索。  相似文献   

5.
目的 了解社区慢性病患者电子健康档案的真实性,为社区电子健康档案质量管理提出相应建议。方法 于2014年8月,采用简单随机抽样的方法,在温州市瓯海区梧田街道社区卫生服务中心抽取慢性病患者电子健康档案500份。采用根据预调查修改后的浙江省2013年版《高血压/糖尿病患者健康档案核查表》对纳入档案进行信息收集,同时对纳入档案患者进行电话访问。结果 500份电子健康档案的失访率为35.6%(178/500),322份未失访档案的真实率为70.2%(226/322)。档案不真实原因分别为:患者否认患高血压/糖尿病而有高血压/糖尿病档案26份(27.1%)、未进行体检而有体检记录25份(26.0%)、未进行面对面随访而有随访记录42份(43.8%)、末次随访记录中≥3项与回答不符6份(6.3%)、体检记录和面对面随访记录均不符3份(3.1%)。结论 社区慢性病患者电子健康档案的失访率较高、真实率较低。建议政府部门加大政策投入、基层医疗机构加强监督管理、建档者参与档案的质量评估,共同改善档案的真实性现状。  相似文献   

6.
目的采用自然语言处理技术从非结构化手术记录中智能提取胃癌分期的相关信息,并评估其效能。方法从电子病历系统中搜集2016至2018年确诊为胃癌并行手术的病例共632人,分析其手术记录,根据临床问题确定临床实体和属性。由两名医生进行标注,结果作为金标准。按3:1将数据集随机分为训练组和验证组。提取记录信息主要包括两步,首先采用识别医学实体,其次采用提取属性。采用精确度,召回率和F值评估模型效果。结果模型分析了共21319个实体,4390个属性。模型建立中,精确匹配医学实体识别平均精确度0.84,召回率0.87,F值0.85。属性平均精确度0.86,召回率0.88,F值0.87。松弛匹配的F值大于精确匹配下的F值。158份验证组手术记录中,19.62%出现浆膜受侵,37.34%出现肿大淋巴结,4.43%出现腹膜转移。结论本文提出了一种新的混合方法从手术记录中智能提取胃癌分期相关信息,未来将有可能在不同系统疾病的电子病历中应用。  相似文献   

7.
电子病历包含病人丰富的诊疗信息,价值相当高。如何快速抽取出电子病历中用户感兴趣的数据,为临床决策、科研提供数据支持是当前电子病历数据利用的重要课题。介绍一种电子病历信息抽取工具,定义规则并建立规则库,构建疾病实体关系,实现电子病历信息抽取。  相似文献   

8.
目的 通过人工智能技术探索自动化病历质控方法,规范病历书写流程,解决人工质控弊端。方法 本文构建了基于人工智能的病历质控系统,该系统首先依据权威标准和专家意见设计并构建质控规则库,通过数据采集引擎自动采集病历数据,然后通过后结构化引擎转换为结构化数据,最后由病历质控引擎结合规则库分析数据,进行质量问题判定,实现自动化智能质控。将该系统应用于病历质控,选取现病史雷同、主诉描述缺陷、初步诊断不全、月经婚育史缺失、主诉现病史不匹配5个质控点,随机抽取2022年1月的2 918份出院病历进行人工智能质控,然后组织病历质控专家进行正确性复核,并对比既往人工质控记录,分析结果。以复核正确的问题数作为金标准,对5个质控点进行受试者工作特征(ROC)曲线分析。结果 根据病历质控专家复核,人工智能质控正确率达到89.57%。通过对比抽样病历的人工智能质控和既往人工质控结果,抽样病历既往人工质控检出问题中仅有1个在人工智能质控系统中未检出,人工智能质控正确检出病历质量问题的数量约为人工质控的2.97倍。ROC曲线分析示,人工智能质控组的5个质控点AUC值均有统计学意义(P<0.05),且AUC值均接...  相似文献   

9.
目的:利用MeSH组配规则自动抽取文摘中表达特定语义关系的句子,为制定自然语言处理关系抽取模板以及句子水平的信息检索提供依据。方法:根据主题词组配规则,使用python语言从文摘数据中匹配出含有特定MeSH主题词概念的候选关系句,从中抽取出以描述概念间关系的短语或句子。邀请专家对100条候选关系句进行概念间语义关系人工标注,将得到的语义关系三元组作为评价金标准,与自动抽取出的概念间关系进行对比分析。将自动抽取的结果加以整理形成特定概念之间的语义关系表达。结果:对大量的自然文本句进行句法分析,批量识别出2个特定概念间语义关系抽取方法的准确率为87%,召回率为62%,F1=71.8%。结论:利用MeSH组配规则抽取表达特定语义关系句子的方法具有较高的准确率与召回率,对生物医学文本理解及医学知识发现等具有借鉴意义。  相似文献   

10.
目的:通过信息化手段,建立一套有效的、智能化的、可执行的电子病历质控体系,对医院电子病历书写质量进行管控,以规范电子病历书写、提高医疗质量。方法:利用人工智能技术,基于一体化信息平台、临床数据中心(CDR),依据电子病历书写规范及质控规则,实现电子病历的质量控制,自动生成每月质控报表。结果:通过完善电子病历智能质控体系,结合信息系统,提高了临床电子病历书写的规范性。采用SPSS 23.0对系统上线前后病历质控情况进行统计分析,差异具有统计学意义(P<0.05)。结论:电子病历智能质控体系的建立,有助于临床书写病历的标准化和规范化,提高医疗质量,同时为管理部门提供决策支持。  相似文献   

11.
电子病历系统作为医院信息化建设的核心,不仅要实现对临床信息的高效管理,还应该满足临床信息利用的需求,实现临床决策支持的功能.对国内外有关电子病历系统在临床决策支持方面的应用进行了文献综述,以求对面向临床决策的电子病历系统相关问题有较全面的了解.  相似文献   

12.
长期以来。病历都是以一种叙述性的自然语言方式来记录。医学文献中大量的生物医学知识也是以自然语言形式存在。这些叙述性文本信息的自动利用需要自然语言处理技术,因而医学语言处理就成为医学临床实践和转化医学最为核心的信息技术挑战。它对于我国医疗信息化具有重要意义。  相似文献   

13.

Background

Pharmacotherapy is an integral part of any medical care process and plays an important role in the medical history of most patients. Information on medication is crucial for several tasks such as pharmacovigilance, medical decision or biomedical research.

Objectives

Within a narrative text, medication-related information can be buried within other non-relevant data. Specific methods, such as those provided by text mining, must be designed for accessing them, and this is the objective of this study.

Methods

The authors designed a system for analyzing narrative clinical documents to extract from them medication occurrences and medication-related information. The system also attempts to deduce medications not covered by the dictionaries used.

Results

Results provided by the system were evaluated within the framework of the I2B2 NLP challenge held in 2009. The system achieved an F-measure of 0.78 and ranked 7th out of 20 participating teams (the highest F-measure was 0.86). The system provided good results for the annotation and extraction of medication names, their frequency, dosage and mode of administration (F-measure over 0.81), while information on duration and reasons is poorly annotated and extracted (F-measure 0.36 and 0.29, respectively). The performance of the system was stable between the training and test sets.  相似文献   

14.
目的 探讨痰湿型多囊卵巢综合征(PCOS)可能的发病因素,为多囊卵巢综合征临床诊断及疾病的预防治疗提供可靠的理论依据.方法 纳入235例痰湿型PCOS患者,收集其个人资料、体格检查、生活方式、家族遗传史情况、中医四诊等相关信息,采用描述性统计法分析数据.结果 按年龄分为16~20岁(4.26%)、21~25岁(28.94%)、26 ~30岁(46.81%)、31~35岁(17.44%)和36 ~40岁(2.55%)组.173例患者达到肥胖标准,其中Ⅰ度肥胖患者最多,占37.45%.175例患者WHR≥0.8,提示存在腹部脂肪堆积.家族遗传疾病的发生率由高到低为高血压(38.72%)、糖尿病(23.83%)、母亲及姐妹月经紊乱(15.32%)、男性早秃(10.64%)、妇科肿瘤(8.94%).高血压和糖尿病史家族父系患病的发生率均高于母系.在饮食习惯上,食用零食、甜食或油炸食品的人数居多,不食用的人数较少.在运动习惯上,没有良好的运动习惯的患者人数占88.93%.结论 痰湿型PCOS肥胖者居多,以腹型肥胖为主.家族高血压、糖尿病发生率较高并且没有良好的饮食和运动习惯.  相似文献   

15.
纷繁、嘈杂、快节奏的生活把我们带入讲究快捷高效的信息化时代,上网购物、信息传输、电子商务、网上预约、挂号甚至远程医疗等等,为人们所津津乐道。电子资讯带给人们快捷的同时缩小了世界的距离。在这个信息化时代电子病历也随之应运而生,然而在电子病历发展的过程中却也引来了不少的争议,本文从法律角度分析探讨电子病历的特点及其效力。  相似文献   

16.
ObjectivesNormalizing mentions of medical concepts to standardized vocabularies is a fundamental component of clinical text analysis. Ambiguity—words or phrases that may refer to different concepts—has been extensively researched as part of information extraction from biomedical literature, but less is known about the types and frequency of ambiguity in clinical text. This study characterizes the distribution and distinct types of ambiguity exhibited by benchmark clinical concept normalization datasets, in order to identify directions for advancing medical concept normalization research.Materials and MethodsWe identified ambiguous strings in datasets derived from the 2 available clinical corpora for concept normalization and categorized the distinct types of ambiguity they exhibited. We then compared observed string ambiguity in the datasets with potential ambiguity in the Unified Medical Language System (UMLS) to assess how representative available datasets are of ambiguity in clinical language.ResultsWe found that <15% of strings were ambiguous within the datasets, while over 50% were ambiguous in the UMLS, indicating only partial coverage of clinical ambiguity. The percentage of strings in common between any pair of datasets ranged from 2% to only 36%; of these, 40% were annotated with different sets of concepts, severely limiting generalization. Finally, we observed 12 distinct types of ambiguity, distributed unequally across the available datasets, reflecting diverse linguistic and medical phenomena.DiscussionExisting datasets are not sufficient to cover the diversity of clinical concept ambiguity, limiting both training and evaluation of normalization methods for clinical text. Additionally, the UMLS offers important semantic information for building and evaluating normalization methods.ConclusionsOur findings identify 3 opportunities for concept normalization research, including a need for ambiguity-specific clinical datasets and leveraging the rich semantics of the UMLS in new methods and evaluation measures for normalization.  相似文献   

17.
以Web of Science为数据源,检索我国医学信息学领域国际发文量,利用SPSS20.0软件对文献关键词进行因子聚类分析,总结出6大研究主题:核医学图像数据库存储研究;计算机自然语言处理和文本挖掘在中国传统医学诊断中的运用;统计方法和计算机处理对临床医学和研究型数据的分析和系统构建;计算机和网络在医院信息系统、临床管理系统、护理系统研发与管理中的运用;统计方法和计算机技术在临床辅助检查心电图和临床疾病的治疗与诊断、临床决策中的运用;电子医学记录和健康记录的安全管理。  相似文献   

18.
陈俐  冯洁  黄萍  荣霞  邹郢  俞朝晖  于涛  翁盛鑫 《中国病案》2011,12(12):46-47
目的探索"数字化病案库"运行软件的设计重点,以帮助临床医务人员更好地提取和利用病案信息和数据。方法 (1)首先建立数字化病案库。(2)尽可能融合建院以来的所有病案及病案数据。(3)建立相应检索和统计病案信息窗口。直接采用"病案首页"项目作为统计、检索窗口。结果使"数字化病案库"成为即可以阅读病案原件内容,又可以提取病案信息和充分利用病案资源的综合软件。结论数字化病案库设计应该是:(1)符合临床医生使用病案的习惯。(2)操作简便。(3)数据准确、及时。(4)检索功能强大。(5)具有可避免医疗纠纷措施。(6)患者末次住院历次病案追踪等功能,与临床紧密结合,方便各类人员使用病案信息,让病案真正服务于临床一线。  相似文献   

19.

Objective

To develop and evaluate a text mining system for extracting key clinical features from vaccine adverse event reporting system (VAERS) narratives to aid in the automated review of adverse event reports.

Design

Based upon clinical significance to VAERS reviewing physicians, we defined the primary (diagnosis and cause of death) and secondary features (eg, symptoms) for extraction. We built a novel vaccine adverse event text mining (VaeTM) system based on a semantic text mining strategy. The performance of VaeTM was evaluated using a total of 300 VAERS reports in three sequential evaluations of 100 reports each. Moreover, we evaluated the VaeTM contribution to case classification; an information retrieval-based approach was used for the identification of anaphylaxis cases in a set of reports and was compared with two other methods: a dedicated text classifier and an online tool.

Measurements

The performance metrics of VaeTM were text mining metrics: recall, precision and F-measure. We also conducted a qualitative difference analysis and calculated sensitivity and specificity for classification of anaphylaxis cases based on the above three approaches.

Results

VaeTM performed best in extracting diagnosis, second level diagnosis, drug, vaccine, and lot number features (lenient F-measure in the third evaluation: 0.897, 0.817, 0.858, 0.874, and 0.914, respectively). In terms of case classification, high sensitivity was achieved (83.1%); this was equal and better compared to the text classifier (83.1%) and the online tool (40.7%), respectively.

Conclusion

Our VaeTM implementation of a semantic text mining strategy shows promise in providing accurate and efficient extraction of key features from VAERS narratives.  相似文献   

20.
目的 :妇科调经片提取工艺。方法 :水提取正交实验。结果 :煎煮时间 (B)及提取次数 (C) 2因素对浸膏得率和芍药苷的含量有显著性影响 (A >0 .0 5 ,B <0 .0 5 ,C <0 .0 1)。结论 :本方最佳提取工艺为第一次加十倍量水 ,煎煮 3h ,第二次加 8倍量水 ,煎煮 2h。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号