首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 343 毫秒
1.
目的/意义 肝癌电子病历中蕴涵大量医学专业知识,且大部分以非结构化数据形式存在,难以自动化提取。肝癌电子病历实体识别研究有助于构建肝癌领域医疗辅助决策系统和医学知识图谱。方法/过程 构建RoBERTa算法与CRF算法相结合的命名实体识别模型,利用自标注肝癌电子病历真实数据进行模型训练与测试。结果/结论 RoBERTa-CRF模型优于其他基线模型,具有较好实体识别效果。  相似文献   

2.
目的/意义 探索基于中文电子病历的命名实体识别方法在构建医学知识图谱和相关应用推广方面的技术可行性。方法/过程 采用真实医疗电子病历数据对词嵌入表示模型进行精化,构建医学术语专有嵌入表示,并利用卷积神经网络等多模型提取局部语义特征,实现基于堆叠注意网络的中文医疗命名实体识别。结果/结论 堆叠注意网络模型F1值达到91.5%,较其他模型具备更强的医疗命名实体识别性能。进一步解决中文医疗命名实体识别难点,在实现全局语义特征全面深入提取的同时降低时间成本。  相似文献   

3.
知识图谱技术促进了新药研发的进展,但国内研究起点晚且领域知识多以文本形式存储,图谱重用率低。因此,本研究基于多源异构的医药文本,设计了以Bert-wwm-ext预训练模型为基础,并融合级联思想的中文命名实体识别模型,从而减少了传统单次分类的复杂度,进一步提高了文本识别的效率。实验结果显示,该模型在自建的训练语料上的F1分数达0.903,精确率达89.2%,召回率达91.5%。同时,将模型应用于公开数据集CCKS2019上,结果显示该模型能够更好地识别中文文本中的医疗实体。最后,利用此模型构建了一个中文医药知识图谱,图谱包含13 530个实体,10 939个属性,以及39 247个相关关系。本研究所提出的中文医药实体识别与图谱构建方法,有望助力研究者加快医药知识新发现,从而缩短新药研发进程。  相似文献   

4.
目的:利用深度学习方法自动抽取中文生物医学文本中的开放式概念关系,以增强生物医学文本理解及医学知识网络构建。方法:使用BiLSTM-CRF模型从中文生物医学文献数据中抽取以句子上下文短语描述的开放式概念关系,并与基于条件随机场(Conditional Random Fields,CRF)和基于长短时记忆网络(Long Short-Term Memory,LSTM)的方法进行对比分析。结果:基于BiLSTM-CRF的中文生物医学开放式概念关系抽取方法取得F1值为0.5221,显著高于基于CRF模型的方法(F1值为0.2353)和基于LSTM模型的方法(F1值为0.3355)。结论:与单独使用CRF模型或LSTM模型的方法相比,基于BiLSTM-CRF的开放式概念关系抽取方法具有更好的鲁棒性和泛化性,对于生物医学文本理解、医学知识网络构建等研究具有借鉴意义。  相似文献   

5.
医学知识图谱构建研究进展   总被引:1,自引:0,他引:1       下载免费PDF全文
针对医学数据专业性强、结构复杂等特点,解析了构建医学知识图谱的关键技术,介绍了利用机器学习和深度学习的方法识别医学命名实体、实体链接和抽取语义关系,以及医学知识图谱在医院智能导诊、疾病筛查和预测、辅助临床诊断、医疗保险风险预测和医学知识科普方面的应用。结合当前我国医学知识图谱构建在数据和技术层面临的问题和挑战,提出了相应的对策和建议。  相似文献   

6.
目的 针对缺血性脑卒中这一发病率高、预后差的疾病,应用自然语言处理技术从患者出院小结中进行文本数据挖掘,并通过Python编程语言将非结构化的文本数据转换成供后续统计分析的结构化数据库.方法 利用缺血性脑卒中患者出院小结资料,构建基于知识增强的语义表示模型(ERNIE)+神经网络+条件随机场的命名实体识别模型,进行疾病、药物、手术、影像学检查、症状5种医疗命名实体的识别,提取实体构建半结构化数据库.为了进一步从半结构化数据库中提取出结构化数据,构建基于ERNIE的孪生文本相似度匹配模型,评价指标为准确率,采用最优模型构建协变量提取器.结果 命名实体识别模型总体F1值为90.27%,其中疾病F1值为88.41%,药物F1值为91.03%,影像学检查F1值为87.71%,手术F1值为87.07%,症状F1值为96.59%.文本相似度匹配模型的总体准确率为99.11%.结论 通过自然语言处理技术,实现了从完全的非结构化数据到半结构化数据再到结构化数据的构建流程,与人工阅读病历并手动提取病历信息相比,极大提高了数据库构建的效率.  相似文献   

7.
目的:提出一种基于医疗知识图谱的BERT-BiLSTM-CRF命名实体识别模型(MKG-BERT-BiLC),用于解决BERT类语言模型在处理医疗电子病历命名实体识别任务时,由于缺乏一定医疗领域背景知识而导致无法充分发挥其作用的问题。方法:将医疗知识图谱中的三元组信息集成到BERT-BiLSTM-CRF模型中,可实现为模型配备相应的医疗领域知识,进而增强模型的语言表征能力。结果:利用现有公开数据集进行实验,融入知识图谱后BERT-BiLSTM-CRF模型的识别精确率、召回率和F1值均有显著提升,优于现有NER模型。结论:MKG-BERT-BiLC模型能够更好地识别电子病历中的命名实体,具有一定的实用价值。  相似文献   

8.
目的:通过构建的特征加权方法筛选出最佳特征子集,构建创伤性颅脑损伤输血机器学习预测模型。方法:通过对临床输血多维数据的异常值与缺失值处理、特征方差与相关性系数计算、特征评分归一化与特征分数加权相加和基于相关性的特征选择(CFS),建立单病种输血大数据的特征加权选择方法,并筛选出最佳特征子集,采用XGBoost算法模型验证特征子集的应用性能。结果:本研究建立了创伤性颅脑损伤输血大数据的特征加权选择方法,通过对医院3 579例颅脑创伤患者临床输血大数据纳入的46个特征进行筛选,最终纳入16个特征作为最佳特征子集。XGBoost算法模型预测结果显示特征加权选择的特征子集构建的模型的准确率、ROC曲线下面积、召回率和F1值均高于卡方算法、随机森林和逻辑回归特征选择。结论:特征加权选择方法可有效提取临床输血多维数据中的重要特征,可提升临床输血模型预测准确性,为构建输血预测机器学习模型和人工智能开发提供支持。  相似文献   

9.
采用自标注中文电子病历标准数据集,融合相似度算法与预训练模型并分别应用于实体映射的候选实体生成和实体消歧阶段,对不同相似度算法和预训练模型的性能进行比较分析。提出基于别名间相似性改进药物类实体映射效果的方法,结合Jaccard相似度算法与BERT预训练模型,高效实现海量中文电子病历实体映射任务。  相似文献   

10.
目的结合自然语言处理方法,研究可以有效抽取中医古籍中所含症状和药物文本实体信息的方法。方法以《金匮要略》为例,采用条件随机场(CRF)算法,先将文本进行分词处理,然后以词性、基于键值对的中医诊断标记集作为辅助特征,通过症状-药物BIO标签为训练特征来训练出模型,然后利用该模型对测试集文本进行自动标签标注。结果基于多特征CRF自动标注的结果准确率达到84.5%,召回率达到70.9%,F测度值达到77.1%。结论运用CRF方法加入词性、中医诊断标记集特征集进行训练得出的多特征模型,能有效提高CRF算法对中医古籍的实体抽取能力,生成的模型可用来自动化抽取中医古籍文本的症状药物实体信息。  相似文献   

11.
目的:探索基于血管超声报告进行自然语言处理并智能生成诊断提示的方法。方法:对血管超声报告采用Bi-LSTM-CRF模型进行分词及命名实体识别,根据专家指南构建知识图谱,通过查询实体及关系属性,实现超声诊断的智能建议。结果:Bi-LSTM-CRF模型识别了4类实体,其识别准确度均在90%以上,单个报告的处理速度在毫秒量级,同时构建包括4类关系的知识图谱。结论:自然语言处理结合知识图谱可以用于血管超声报告的智能诊断提示生成。  相似文献   

12.
利用实体识别、关系抽取、可视化分析等技术构建医学知识图谱,以期为知识服务系统提供知识的高效检索、组织和管理,为知识间关联关系的发现奠定基础。该图谱可提供力导向布局图及和弦图两种可视化展示百科知识的直观方式,应用于医药卫生知识服务系统平台取得很好的效果,系统“百科数据”访问量突破性增加,超过20%的用户关注并浏览知识图谱应用。  相似文献   

13.
基于真实中文电子病历与网络爬取数据,构建病历实体识别模型,确定实体关系,进行知识图谱可视化展现,搭建基于规则匹配的问答系统。探索适用于中文电子病历的知识图谱与知识体系构建方法,提高医院统计部门相关审核工作效率,为人工智能技术在医疗卫生行业应用奠定基础。  相似文献   

14.
目的:构建基于中文医疗知识图谱的智能问答系统,使人们通过人机交互的方式就能完成简单的自我诊疗.方法:通过词性标注的方法获取用户提出问句中的医疗实体,再利用结合基于共享层的卷积神经网络(SH-CNN)与词频-逆文本频率(TF-IDF)算法的混合算法来计算出系统中与问句语义最接近的问题模板.最后根据获取问题模板的问句类型以...  相似文献   

15.
基于语义解析和规则匹配融合的模型,利用少量的语义训练语料,以中文医疗知识图谱为知识基础,构建中文医疗问答系统,解决医疗领域中文语料缺乏且标注难度大的问题.该系统由语义解析模块(SPM)和答案查询模块(AQM)组成.其中,SPM由意图识别和命名实体识别组成,它们分别以BERT-TextCNN和BiLSTM-CRF模型为基...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号