首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 250 毫秒
1.
针对中文医疗文献中的中文词边界模糊、分词歧义导致传统深度学习方法难以获取词汇语义信息的问题,提出了一种融合嵌入字词特征的中文医疗命名实体识别模型.首先,针对词向量缺失边界特征的问题,将词向量与词性、词边界特征拼接融合,结合注意力机制捕获字符间潜在的依赖权重等特征和增强词汇向量;其次,将通过BERT模型获得的字符向量与增...  相似文献   

2.
目的/意义 改善中文电子病历命名实体识别模型的性能,更好地开展医疗信息的组织和挖掘。方法/过程 构建ERNIE-BiGRU-Attention-CRF中文电子病历命名实体识别模型,首先采用ERNIE1.0预训练模型生成具有语义特征的词向量,然后利用BiGRU捕获全局语义特征与语法结构特征,通过Attention机制进一步增强语义特征的捕获,最后连接CRF解码层输出全局概率最大的标签序列。结果/结论 在公开的医疗文本数据集CCKS2017开展对比实验、消融实验,利用生成的模型进行实例分析,取得较好的识别效果。  相似文献   

3.
阐述基于BiLSTM-CRF基准模型,融合词向量及词属性推理机制实现中文电子病历命名实体识别的方法,包括医学语料库构建与词向量训练、融合词属性推理机制等,分析实验结果,指出医学领域词向量及词属性推理机制的引入有助于提升中文电子病历命名实体识别效果。  相似文献   

4.
目的/意义 研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据。方法/过程 提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采用双向长短期记忆人工神经网络提取实体特征,使用条件随机场进行序列预测。将人工标注的400份共计5万余字的医案按照3∶1划分为训练集和测试集,使用该模型识别中医医案中的身体部位、药物、症状、疾病4类命名实体。结果/结论 该模型在测试集F1值为84.81%,优于其他未嵌入部首的模型,表明该模型能够更有效地识别中医医案中的命名实体,更好地结构化医案。  相似文献   

5.
在传统中文电子病历的命名实体识别任务中,针对医疗实体边界不清、实体嵌套、语句成分缺失、高度依赖人工提取特征等问题,提出基于词嵌入结合BiLSTM-CRF模型的中文电子病历命名实体识别模型。将电子病历文本数据集进行脱敏处理及序列标注等数据预处理,结合词嵌入匹配病历文本序列进行词向量化表示,利用BiLSTM神经网络对前后向病历文本进行空间语义建模,获取文本序列的语义特征,然后利用CRF预测实体标签输出。实验结果表明,改进后的BiLSTM-CRF模型显著提高了病历实体识别的准确率和召回率。  相似文献   

6.
探索一种中文消费者健康词的发现方法,阐述其构建过程,验证利用Word2vec进行消费者健康词表构建的可行性和合理性,为开发完整的中文消费者健康词表奠定基础。  相似文献   

7.
分别运用Word2vec和BP神经网络算法以及两者混合对300份长病历数据进行症状信息的分类抽取,旨在解决医学病历症状信息自动分类问题,结果表明采用两种方法混合处理能够得到更好的效果。  相似文献   

8.
目的:提出一种融合多维特征的医学知识图谱分步实体对齐方法,从电子病历和网络资源中抽取垂体瘤相关疾病、症状数据,进行实证研究。方法:首先进行尾实体对齐,通过训练Word2Vec和BERT模型获得实体的语义特征,使用三元组训练翻译模型得到实体结构特征,利用Jaccard相似度计算字符特征,利用分类模型进行特征学习和预测;然后进行头实体对齐,利用实体的属性相似性和结构相似性构建头实体对齐模型。结果:尾实体对齐模型的F1值为99.58%,头实体对齐模型的F1值为97.32%,说明所选择的特征可以很好地表示实体,模型具有良好的对齐效果。结论:目前关于医学知识图谱的实体对齐模型研究仍处于起步阶段,融合多维特征的医学知识图谱分步实体对齐方法是对现有医学知识图谱构建方法的重要补充。  相似文献   

9.
采用自标注中文电子病历标准数据集,融合相似度算法与预训练模型并分别应用于实体映射的候选实体生成和实体消歧阶段,对不同相似度算法和预训练模型的性能进行比较分析。提出基于别名间相似性改进药物类实体映射效果的方法,结合Jaccard相似度算法与BERT预训练模型,高效实现海量中文电子病历实体映射任务。  相似文献   

10.
介绍国内外电子病历命名实体识别研究现状,阐述基于注意力机制和膨胀卷积神经网络的电子病历命名实体识别模型构建方法、结构以及实验环境、具体设计和结果,实验表明该模型具有更好的命名实体识别效果。  相似文献   

11.
目的 提出一种基于Re-entity新分词方法的条件随机场(CRF)模型,并与双向长短记忆神经网络(BiLSTM)-CRF和Lattice-长短记忆神经网络(LSTM)进行比较。方法 比较了现有实体识别方法和模型后,针对2018年全国知识图谱与语义计算大会(CCKS2018)任务一“电子病历命名实体识别”,提出基于Re-entity的CRF、BiLSTM-CRF、Lattice-LSTM方法,并在不同语料库训练不同参数级别的字符向量集。分别将各方法引入神经网络模型中进行模型性能对比实验,最后分别基于句子级和篇级输入句长进行对比研究。结果 CRF模型在最优特征工程的结果下引入Re-entity方法后性能得到提高,句子级的Lattice-LSTM模型在该任务上取得了89.75%的严格F1-measure,优于CCKS2018任务一的最高结果(89.25%)。结论 基于Re-entity新分词方法的CRF模型可利用中文临床药物知识库有效提高电子病历中药物的识别率,Re-entity方法可改善数据预处理阶段分词导致的错误累加,Lattice结构可以更好地结合字符和词序列的潜在语义信息,同时句子级输入能有效提高神经网络模型的识别准确率。  相似文献   

12.
目的:针对当前电子病历录入中的便捷性与规范性的双重需求,尝试利用神经网络算法来挖掘病历文本的语言习惯和承接关系,以便嵌入病历录入系统,提高医生输入的效率和质量。方法:设计了基于大数据的电子病历录入推荐工具,对骨创伤科病历文本进行清洗构建训练集后做特征编码,采用基于深度学习的BiLSTM网络算法,学习专科专病的语义信息。结果:分别基于BERT特征、独热编码、词向量三种文本表示,针对过往病历数据建立BiLSTM模型,预测下一句文本,结果表明使用BERT预训练模型特征的BiLSTM模型F1-score达到75.23%,且具有实际应用的价值。在专科专病文本推荐的场景下,BERT特征优于独热编码和Word2Vec词向量。  相似文献   

13.
目的 构建hsa-microRNA-96-5p down慢病毒表达载体并对其进行鉴定。方法 根据hsa-miR-9-5p基因序列设计合成hsa-miR-96-5p-inhibition-a和hsa-miR-96-5p-inhibition-b,将合成后成对的引物干粉溶解于退火缓冲液中引物退火。将慢病毒GV280载体酶切产物通过T4DNA连接酶将双酶切线性化的载体和退火双链DNA连接。经菌落筛选,菌落PCR及测序鉴定,荧光法及药筛法测定病毒效价。结果 菌落PCR和测序验证成功构建了hsa-miR-96-5p down慢病毒载体,经荧光法及药筛法测定病毒效价为3×108TU/ml。结论 成功构建了hsa-miR-96-5p down慢病毒表达载体,为后续深入研究miR-9-5p在肺癌细胞中的生物学行为及机制提供了前期实验基础。  相似文献   

14.
ObjectiveClaims-based algorithms are used in the Food and Drug Administration Sentinel Active Risk Identification and Analysis System to identify occurrences of health outcomes of interest (HOIs) for medical product safety assessment. This project aimed to apply machine learning classification techniques to demonstrate the feasibility of developing a claims-based algorithm to predict an HOI in structured electronic health record (EHR) data.Materials and MethodsWe used the 2015-2019 IBM MarketScan Explorys Claims-EMR Data Set, linking administrative claims and EHR data at the patient level. We focused on a single HOI, rhabdomyolysis, defined by EHR laboratory test results. Using claims-based predictors, we applied machine learning techniques to predict the HOI: logistic regression, LASSO (least absolute shrinkage and selection operator), random forests, support vector machines, artificial neural nets, and an ensemble method (Super Learner).ResultsThe study cohort included 32 956 patients and 39 499 encounters. Model performance (positive predictive value [PPV], sensitivity, specificity, area under the receiver-operating characteristic curve) varied considerably across techniques. The area under the receiver-operating characteristic curve exceeded 0.80 in most model variations.DiscussionFor the main Food and Drug Administration use case of assessing risk of rhabdomyolysis after drug use, a model with a high PPV is typically preferred. The Super Learner ensemble model without adjustment for class imbalance achieved a PPV of 75.6%, substantially better than a previously used human expert-developed model (PPV = 44.0%).ConclusionsIt is feasible to use machine learning methods to predict an EHR-derived HOI with claims-based predictors. Modeling strategies can be adapted for intended uses, including surveillance, identification of cases for chart review, and outcomes research.  相似文献   

15.
ObjectiveIn a biomedical literature search, the link between a query and a document is often not established, because they use different terms to refer to the same concept. Distributional word embeddings are frequently used for detecting related words by computing the cosine similarity between them. However, previous research has not established either the best embedding methods for detecting synonyms among related word pairs or how effective such methods may be.Materials and MethodsIn this study, we first create the BioSearchSyn set, a manually annotated set of synonyms, to assess and compare 3 widely used word-embedding methods (word2vec, fastText, and GloVe) in their ability to detect synonyms among related pairs of words. We demonstrate the shortcomings of the cosine similarity score between word embeddings for this task: the same scores have very different meanings for the different methods. To address the problem, we propose utilizing pool adjacent violators (PAV), an isotonic regression algorithm, to transform a cosine similarity into a probability of 2 words being synonyms.ResultsExperimental results using the BioSearchSyn set as a gold standard reveal which embedding methods have the best performance in identifying synonym pairs. The BioSearchSyn set also allows converting cosine similarity scores into probabilities, which provides a uniform interpretation of the synonymy score over different methods.ConclusionsWe introduced the BioSearchSyn corpus of 1000 term pairs, which allowed us to identify the best embedding method for detecting synonymy for biomedical search. Using the proposed method, we created PubTermVariants2.0: a large, automatically extracted set of synonym pairs that have augmented PubMed searches since the spring of 2019.  相似文献   

16.
目的 研究脱水穿心莲内酯(DAL)在Caco-2细胞单层模型中的吸收机制。方法 观察DAL在Caco-2细胞单层模型中的双向转运,考察时间、DAL浓度、温度和P-糖蛋白(P-gp)抑制剂维拉帕米对DAL吸收的影响。采用LC/MS/MS方法检测DAL浓度,计算其表观渗透系数(Papp)。结果 DAL在Caco-2细胞模型中的双向转运,随时间和浓度的增加,DAL的吸收具有时间、浓度依赖性,未出现饱和趋势;不受温度和P-gp抑制剂维拉帕米的影响。结论 DAL在Caco-2细胞模型中的吸收主要是靠浓度扩散的被动转运。  相似文献   

17.
目的 研究穿心莲内酯在Caco-2细胞单层模型中的吸收机制。方法 观察穿心莲内酯在Caco-2细胞模型中的双向转运,考察时间、药物浓度、温度和抑制剂对穿心莲内酯吸收的影响。用LC/MS/MS检测药物浓度,计算其表观渗透系数(Papp)。结果 穿心莲内酯在Caco-2细胞模型中,随时间和浓度的增加,药物吸收呈饱和趋势,且受温度和碘乙酰胺影响,但不受外排抑制剂维拉帕米和MK-571的影响。结论 穿心莲内酯在Caco-2细胞中的吸收主要是由载体介导的主动转运。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号