首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
目的 从中医临床医案抽取症状命名实体。方法 对名老中医临床肺癌医案进行序列标记,利用条件随机场对标注样本进行学习,采取十折交叉验证对模型进行测试,使用多分类评价指标对模型结果进行评价。结果 CRF模型微平均的三个评价指标(PRF1)为(0.9233 ± 0.0063,0.9222 ± 0.0062,0.9211 ± 0.0062);宏平均评价指标为(0.8822 ± 0.0126,0.8322 ± 0.0215,0.8556 ± 0.0151)。病位权重由高到低依次为“背”、“胸”、“口”、“腰”、“鼻”等词;症状权重由高到低依次为“咳”、“痛”、“痰”、“酸”、“闷”等词。结论 利用条件随机场构建中医临床信息抽取模型,抽取结果符合中医辨证理论,能够有效实现中医临床医案症状命名实体识别。  相似文献   

2.
目的 研究中医医案中症状命名实体的抽取方法,为中医临床信息的自动化抽取提供方法学参考.方法 基于已标注过的名老中医诊治肺癌医案构建长短时记忆网络(LSTM)与条件随机场(CRF)混合模型,应用LSTM层结合预训练字向量抽取医案的抽象特征,通过CRF进行序列标注,使用多分类评价指标对抽取结果进行评价.同时设计不同变体的算...  相似文献   

3.
目的:命名实体识别在自然语言处理中是最基本的任务之一,本文通过应用深度表示的方法实现临床上的现病史数据的自动标识。方法:本文随机选取了10 426条现病史句子作为主要的文本研究对象,分别用词嵌入(word2vec)和网络结构特征(node2vec)两种构建向量的方法生成不同的词向量特征,再在基于条件随机场(Conditional Random Field,CRF)和结构化支持向量机(Structured Support Vector Machines,SSVM)的方法上进行十重交叉验证,计算并比较基于深度表示的症状表型命名实体抽取的性能。结果:传统的CRF算法的三个评价指标(准确率,召回率,F 值)为(0.888 9,0.786 9,0.834 8);基于WENER方法下的CRF和SSVM的评价指标为(0.975 0,0.984 9,0.979 8)和(0.992 8,0.988 9,0.990 8);在GENER方法下基于词的CRF和SSVM算法的三个评价指标为(0.972 8,0.976 8,0.975 2)和(0.983 3,0.974 5,0.978 8);GENER方法下基于字的CRF和SSVM算法的评价指标为(0.927 8,0.862 8,0.887 9)和(0.943 7,0.946 8,0.941 3)。结论:深度表示的命名实体抽取算法性能要比传统的非深度表示的命名实体标识算法性能好。另外,通过比较深度表示的两种算法的性能后发现,无论是基于word2vec生成的词向量还是基于node2vec生成的词向量,SSVM模型算法性能均优于CRF算法的性能。  相似文献   

4.
目的:中医临床病历作为重要的临床数据,以文本的形式记录了医生和患者交互的整个过程。目前,在大数据的背景下,针对临床病历所涵盖的主体问题信息如现病史的分析利用相关研究仍有所欠缺。因此,本文针对中医临床病历中的现病史部分展开症状术语抽取方法研究,为临床病历的进一步使用奠定基础。方法:首先通过随机挑选与专家审核的方式获得了12367份现病史数据,按照疾病种类分成了两组实验,其中糖尿病组包含了4838份数据,脾胃病组7529份数据,以及合并后的混合组12367份数据。并整理出了一份涵盖22996个词的症状术语字典。然后选取滑动窗口特征、词的前后缀特征、词典特征等5种特征模板,使用CRFs 模型开展症状术语命名实体抽取实验。结果:在实验结果评价标准(准确率、召回率和F1 值)上的表现:在开放测试上的评价结果为(0.83、0.8、0.82)、(0.9、0.9、0.89)和(0.88、0.87、0.87);在十重交叉验证上的评价结果为(0.83、0.82、0.83)、(0.95、0.95、0.95)和(0.93、0.92、0.92)。结论:CRFs模型作为一种优秀的序列标注算法,适用于现病史文本的症状术语命名实体抽取任务。  相似文献   

5.
阐述中医外科名医医案中常用八个字的证型命名特点。结合这些医案,强调"八字证型"命名在中医外科疾病辨证中的重要性,尤其在整体辨证与局部辨证不一致的情况下。四字证型有着普遍认可性和简便直观性,临床使用广泛,但应逐渐认识到八字证型以其能够统筹整体辨证与局部辨证的特点,使其在临床诊疗工作中更具针对性,是中医外科名医临床辨证用药的经验体现。  相似文献   

6.
中医药文本命名实体识别在中医药文本挖掘中占有重要地位,本文通过BiLSTM-CRF方法实现对中医医案文本进行命名实体识别,不仅实现了基本命名实体识别,通过对数据集按照中草药、疾病和症状三个类别进行标记,还能够进行命名实体类别识别。对中医药相关医案进行规整的10292条句子进行序列标注,基于word2vec的向量构建,从而进行模型训练迭代,得到了准确率为97.23%,召回率为89.47%,F值为88.34%的中医药命名实体识别模型。各类别识别中,中草药类别识别精准率为94.41%,召回率为94.36%,F值为94.38%;疾病类别精准率为80.92%,召回率为80.92%,F值为80.92%;症状类别精准率为75.68%,召回率为81.68%,F值为78.56%,人工测试模型效果较好,能够对医案数据进行实体识别。命名实体识别模型较多,但用于中医药相关命名实体识别模型数量微乎其微,构建中医药相关命名实体识别模型,将更加有效的推动中医药文本挖掘发展。  相似文献   

7.
随着数据挖掘技术在中医医案研究中被广泛采用,对医案收集的效率和质量提出更高要求,积极探索中医学与计算机、人工智能等相关学科的交叉融合,实现中医医案的半自动收集,以期为名中医经验传承作出贡献。基于Python编程语言的简洁性、开源性以及丰富的第三方扩展库,使用Python,采用OCR文本识别、自然语言处理Jieba中文分词、Fuzzy-Wuzzy模糊字符串匹配等第三方工具库,编码实现医案智能收集系统。通过与医案手工收集相比,智能收集系统极大地提高了医案收集的工作效率,解放人力,提升医案的可靠性。  相似文献   

8.
孟洪宇  孟庆刚 《中医药学刊》2014,(10):2334-2337
中医文献有种类繁多,数量庞大,记录随意,术语表达方式独特等的特点,为知识的获取带来困难。信息抽取技术可以利用计算机对文本信息进行针对性抽取,以结构化的形式将结果储存到数据库中,这种技术可以帮助医学研究者从海量信息中高效获取所需知识。命名实体识别是信息抽取准确与否的关键,对目前常用的几种识别方法进行分析,认为基于统计的方法更适用于中医文献的研究,并选定条件随机场算法,结合中医术语的特点,对该方法及步骤进行了详细阐述。同时,举例介绍了信息抽取技术在中医结构化电子病历及中医专业领域搜索引擎建立中的辅助作用,为其在中医领域的应用提供更广阔的参考思路。  相似文献   

9.
分析针刺临床文献术语识别任务的特殊性,对比目前应用于中医药领域的3种命名实体识别(NER)方法的优缺点,认为双向长短期记忆神经网络-条件随机场模型(Bi LSTM-CRF)能结合上下文信息,利用较少的特征规律完成NER,适合针刺临床文献的术语识别.在此模型基础上,提出针刺临床文献术语识别流程主要包括文献预处理、序列标注...  相似文献   

10.
文章提出从当初中医证的命名阶段相似的思维方式出发来给中医证候动物模型命名,即用同一种思维方式,分别从人和动物出发来总结证候内涵,形成统一的人和动物通用的证的命名,其机体在致病因素的作用下内在的病理生理状态是相同或者相近的,但其候由于个体属性的差异可能会有所不同,就是说同一个证在动物和人会表现出不同的生物表征,但是这一组不同的生物表征所代表的内涵是相同的.  相似文献   

11.
随着机器学习、深度学习与人工智能的兴起与发展,自然语言处理技术也不断革新,其中实体抽取作为自然语言处理的子任务,自其提出以来,实现了从基于匹配模式的抽取到基于传统的机器学习方法抽取,再到基于深度学习的抽取的进步与发展。在医疗信息抽取方面,自然语言处理技术也得到了很好地应用,医学信息得到了更深层次的处理和挖掘。面对中医药领域中灵活的、复杂的和海量的中医药信息,利用实体抽取技术可以将中医药领域更为重要的信息抽取,这也是进一步对中医药信息挖掘的关键一步,基础一步。本文概括了中医药各领域实体抽取技术的应用研究情况,为实体抽取技术在中医药领域的进一步应用发展提供参考,以期促进中医药的传承发展,守正创新。  相似文献   

12.
基于成人哮喘复诊医案建立中医疗效判断模型   总被引:1,自引:0,他引:1  
建立成人哮喘中医复诊医案疗效判断模型,识别和控制某些困素对结局的作用。方法:从现代数据库中获取符合纳入标准的中医复诊医案,对其信息进行提取、规范和量化处理,采用Logistic回归分析方法,将医案中出现的症状作为一个变量,得出就诊人患有目标病证的概率,然后再通过诊断前后患病概率的比较来评定疗效。结果:医案包含211个变量。通过秩和检验对变量进行筛选,共有38项组间差异有显著性,可用于建立logistic模型。最后进入模型的变量对应的症状和权重系数分别为:数脉-0.546、喘0.575、胸痛-0.561、厚苔-1.478、白苔0.709、绛舌-1.786、弦脉0.937、喉中痰鸣1.364对应的变量。结论:模型的效率和数据完整度、症状的选择等密切相关,模型投入应用前还需要考虑到药物与病证的对应关系。  相似文献   

13.
中医内科学是一门实践性很强的学科,教学的改革情况对学生的临床能力提高有着直接的影响。而本数据库的建立就是中医内科教学法改革的一部分,通过对它的实施,可以明显提高学生的学习积极性,训练学生的临床思维能力,有效地提升学生的临床能力,并为临床提供良好的临床数据查询平台。  相似文献   

14.
基于医案数据库的中医心藏象研究   总被引:1,自引:0,他引:1  
目的:为中医心藏象研究提供客观的统计数据。方法:选择古代及近现代中医医家的医案,建立中医医案数据库,采用非条件Logistic多元逐步回归法筛选变量,P<0.05。结果:筛选出中医心病常见的临床证型及各证型的病因或病理结果、症状和临床用药的Logistic回归结果,并定量表达了这些病因或病理结果、症状、用药的重要性大小。结论:总结出中医心的生理功能及生理特性,并强调应重视心的生理特性。  相似文献   

15.
《中医医案学》是一门通过学习和研究中医临床医案,去寻找、发现和总结中医学中诸多奥秘学问的学科.目前,全国各大中医药院校相继开设了《中医医案学》课程,但一般都是作为选修课,故该课程的价值与地位没有得到很好的体现.文章试将其在中医教学体系中的重要作用予以论述,并探讨其学习方法,以期对中医教育起到良好的促进作用.  相似文献   

16.
梁星  毛炜  叶凤珍  黎创 《新中医》2014,46(9):183-185
<正>药对又称对药、对子,是指临床上相对固定的两味药组成,是中药复方配伍中最简单、最常见的形式,符合中医"七情合和"配伍理论,具有紧扣病机、药简力专的特点,是古今中医医家长期临床诊疗工作中的总结,因此总结探讨名中医的常用药对,对指导临床工作及中药开发均有重要意义[1]。既往总结药对的方法常常为个人领悟、口授相传等,现代则常常运用各种数据挖掘技术对其进行挖掘分析解读。前期已研究并报道了运用数据挖掘的方法对慢性常用药进行分析[2],在此基础  相似文献   

17.
目的 基于古今医案云平台研究视神经炎(ON)的中医证型及用药规律。方法纳入自建库以来至2022年12月31日收录于古今医案云平台、中国知网、万方医学网、维普网及中国生物医学文献服务系统中使用中医药治疗ON的医案及文献。将中医证型、处方组成及治法录入Excel软件并建立数据库,对中药名称规范化处理后,运用古今医案云平台(V2.3.5)的数据挖掘模块对中医证型、中药四气、五味、高频中药使用频次、关联规则等进行分析。结果 (1)一般情况:共纳入医案15个和文献110篇,包含68种证型,“肝郁气滞证”出现频次最高(28次,12.02%);233个中药复方,涉及中药211味,累计频次为2,579次,四气以寒性最多(49味,23.22%);五味以甘味药最多(76味,36.02%);归经以肝经药物最多(73味,34.60%)。(2)高频中药使用频次:用药频次≥30次的中药共21味,排在前5位的分别是当归(165次,70.82%)、茯苓(143次,61.37%)、柴胡(127次,54.51%)、白芍(118次,50.64%)、白术(110次,47.21%)。(3)高频中药关联规则:共得到8类核心药对,...  相似文献   

18.
目的:构建基于方剂数据集的知识图谱,以系统性地展示方剂实体及其之间的关系。方法:首先建立方剂数据处理与知识图谱构建的规范化流程,获取方剂数据集,然后在4种常用命名实体识别模型中遴选最优模型进行实体抽取,最后利用Neo4j图数据库构建知识图谱。结果:最终遴选出基于Transformer的双向编码模型-双向长短期记忆网络-条件随机场(BERT-BiLSTM-CRF)模型,从数据集中抽取出症状、中西医病名、中医证候等医学实体,平均F1值达90.55%,形成了规范的方剂数据集并构建了方剂知识图谱。结论:利用本文方法抽取出的医学实体为中医药的临床实践和科学研究提供了系统性展示方剂实体及其之间关系的可靠数据基础。所建立的方剂知识图谱实现了中药方剂的知识检索,不仅有助于发现方剂数据中的潜在知识与内在关系,而且为中医药领域的信息整合和知识发现提供了坚实基础,推动中医药的现代化进程。  相似文献   

19.
目的:提出一种基于改良算法的中医临床处方预评价方法,可以对中医临床处方组成进行智能识别和分析。方法:采用数学方法,在中药药性加权计算方法的基础上进行了改良,并使用两个临床常用处方对该方法进行了验证和分析。结果:对中医经典处方酸枣仁汤的分析,发现养心安神药占全方权重的0.46,故可推断出结果为"本方主要由养心安神药构成";对中医经典处方龟鹿二仙胶的分析,发现补阳药药味数量为1种,所占全方权重为0.56,补阴药药味数量2种,共占权重0.38,故可推断出结果为"本方主要由补阴药构成,以补阳药辅佐"。结论:该方法可以对中医临床处方进行准确的识别和分析。  相似文献   

20.
目的:探讨痉病中医证候的分布特点。方法:选取大型电子丛书《中华医典》作为古籍医案数据来源,中国知识资源总库(CNKI)、维普中文期刊数据库(VIP)、万方学术期刊全文数据库、中国生物医学文献服务系统(CBM)、中国中医药数据库检索系统、中国优秀博硕士学位论文全文数据库、Cochrane图书馆、Pubmed、Embase等作为现代医案数据来源,建立数据库,对古今医案痉病的证候运用SPSS19.0软件进行数理统计。结果:古今医案证候汇总中,证候类型归纳为64个,频次排在前五位的依次为邪壅经络(18.48%)、阴血亏虚动风(16.67%)、痰热动风(9.70%)、阳明腑证(4.85%)及热入营血证(4.85%)。结论:初步反映了痉病常见的证候及分布规律,为痉病中医辨证分型标准及中医临床诊疗指南的修订提供了参考和依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号