共查询到16条相似文献,搜索用时 125 毫秒
1.
2.
3.
4.
《中国中医药图书情报杂志》2016,(5)
目的结合自然语言处理方法,研究可以有效抽取中医古籍中所含症状和药物文本实体信息的方法。方法以《金匮要略》为例,采用条件随机场(CRF)算法,先将文本进行分词处理,然后以词性、基于键值对的中医诊断标记集作为辅助特征,通过症状-药物BIO标签为训练特征来训练出模型,然后利用该模型对测试集文本进行自动标签标注。结果基于多特征CRF自动标注的结果准确率达到84.5%,召回率达到70.9%,F测度值达到77.1%。结论运用CRF方法加入词性、中医诊断标记集特征集进行训练得出的多特征模型,能有效提高CRF算法对中医古籍的实体抽取能力,生成的模型可用来自动化抽取中医古籍文本的症状药物实体信息。 相似文献
5.
6.
7.
目的/意义 充分挖掘中医医案中的文本信息,提高中医药信息化程度和中医医案症状术语抽取、关系抽取等下游任务的准确率。方法/过程 通过光学字符识别和爬虫技术获取大量中医医案数据并进行预处理,构建面向中医医案领域预训练数据集,使用BERT模型预训练方法,经过多轮训练得到首个面向中医领域专有预训练模型TcmYiAnBERT,并将该模型开源。结果/结论 中医领域专有预训练模型TcmYiAnBERT在中医命名实体识别任务中比未使用该模型的预训练模型F1值提高2.8个百分点。 相似文献
8.
9.
本文论述了通过后结构化技术对文本病历进行处理,改善计算机对文本病历的理解能力,解决基于文本病历难以开展大规模的医疗质控、临床决策支持、临床科研、医疗大数据应用的难题。该技术的重点是采用自动训练方法对大批量病历进行学习辅以人工审核校对构建一个医学语料库,在此基础上对需要抽取的病历进行句法分析、实体识别标注、信息抽取和组织,最终将抽取到的信息组成树状结构,以XML文件的格式进行存储。 相似文献
10.
目的/意义 研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据。方法/过程 提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采用双向长短期记忆人工神经网络提取实体特征,使用条件随机场进行序列预测。将人工标注的400份共计5万余字的医案按照3∶1划分为训练集和测试集,使用该模型识别中医医案中的身体部位、药物、症状、疾病4类命名实体。结果/结论 该模型在测试集F1值为84.81%,优于其他未嵌入部首的模型,表明该模型能够更有效地识别中医医案中的命名实体,更好地结构化医案。 相似文献
11.
12.
13.
Objectives Medical knowledge extraction (MKE) plays a key role in natural language processing (NLP) research in electronic medical records (EMR), which are the important digital carriers for recording medical activities of patients. Named entity recognition (NER) and medical relation extraction (MRE) are two basic tasks of MKE. This study aims to improve the recognition accuracy of these two tasks by exploring deep learning methods.Methods This study discussed and built two application scenes of bidirectional long short-term memory combined conditional random field (BiLSTM-CRF) model for NER and MRE tasks. In the data preprocessing of both tasks, a GloVe word embedding model was used to vectorize words. In the NER task, a sequence labeling strategy was used to classify each word tag by the joint probability distribution through the CRF layer. In the MRE task, the medical entity relation category was predicted by transforming the classification problem of a single entity into a sequence classification problem and linking the feature combinations between entities also through the CRF layer.Results Through the validation on the I2B2 2010 public dataset, the BiLSTM-CRF models built in this study got much better results than the baseline methods in the two tasks, where the F1-measure was up to 0.88 in NER task and 0.78 in MRE task. Moreover, the model converged faster and avoided problems such as overfitting.Conclusion This study proved the good performance of deep learning on medical knowledge extraction. It also verified the feasibility of the BiLSTM-CRF model in different application scenarios, laying the foundation for the subsequent work in the EMR field. 相似文献
14.
实验中医学是用现代实验方法和手段研究中医的一门科学.结合高等医学院校培养学生的要求和中医教学的特点,就中医实验教学在西医院校中医教学中实施的必要性、可行性进行分析. 相似文献
15.
王永炎 《北京中医药大学学报》2017,40(10):797-802
在后现代社会,有必要研讨如何于变化的环境中认知中医药学的科学性。从科学与人文的融合、象思维与概念思维的互动,分析了中医药学所具有的科学与人文的双重属性,及其独特的象思维理念。认为中医学理论不是唯唯物的而是以唯象为主体的,是非线性不确定的,强调人类本体学实体本体与关系本体整合,注重能量与信息的时空转换,谋求在复杂系统科学领域里开展中医中药科学问题与方法学的研究。提出在后现代社会,"以人为本"的医学价值观将引导科学与人文的整合,整体论与还原论的整合,象思维与概念思维的整合,系统性研究与描述性研究的整合,循证医学与叙事医学的整合,最终朝向西学东渐与东学西渐汇通,中医西医和合共进,实现统一的新医药学。 相似文献
16.
知识图谱技术促进了新药研发的进展,但国内研究起点晚且领域知识多以文本形式存储,图谱重用率低。因此,本研究基于多源异构的医药文本,设计了以Bert-wwm-ext预训练模型为基础,并融合级联思想的中文命名实体识别模型,从而减少了传统单次分类的复杂度,进一步提高了文本识别的效率。实验结果显示,该模型在自建的训练语料上的F1分数达0.903,精确率达89.2%,召回率达91.5%。同时,将模型应用于公开数据集CCKS2019上,结果显示该模型能够更好地识别中文文本中的医疗实体。最后,利用此模型构建了一个中文医药知识图谱,图谱包含13 530个实体,10 939个属性,以及39 247个相关关系。本研究所提出的中文医药实体识别与图谱构建方法,有望助力研究者加快医药知识新发现,从而缩短新药研发进程。 相似文献