首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
为了解生物医学文本挖掘技术在基因组注释方面的基本应用,以Web of Science(WOS)数据库中收录的关于生物医学文本挖掘技术在基因组注释方面的基本应用的文献作为来源文献,利用书目共现分析软件提取文献中的高被引论文,形成来源文献——高被引文献词篇矩阵,利用聚类软件对高被引论文进行同被引聚类分析,最后得到生物医学文本挖掘技术在基因组注释方面的基本应用,主要包括权威工具的使用、文本挖掘工具和算法的开发、文本挖掘工具的检验。  相似文献   

2.
目的:梳理美国癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)相关数据的收集、整理、组织、共享及应用情况,为建立及完善国家级大型的开放癌症基因组学相关数据资源提供参考。方法:系统调研TCGA计划的数据管理相关机构工作流程、数据共享利用等方面的解决方案和最佳实践。 结果:TCGA计划通过多中心合作,建立了组织样本采集、处理、质量控制、序列测定、特征分析、数据共享与研究应用等全链条的癌症基因组图谱数据管理流程,从所属癌症、数据类型、处理水平等角度对数据进行精细分类,并针对汇总数据和个体数据分别采取开放存取和受控访问两种共享机制,研究者们利用其共享数据开展了相关癌症特征基因的突变、扩增和缺失、以及受影响的信号通路等多方面研究。 结论:癌症基因组图谱计划的实践探索可为大规模癌症基因组学相关研究计划的实施提供数据管理方面的经验借鉴与参考。  相似文献   

3.
简要介绍肿瘤基因组数据的积累和基因组数据挖掘情况;结合现有的高通量技术与数据挖掘策略,以白血病为例,提出一套基于基因组数据研究的肿瘤精准诊断治疗和风险预测策略;最后总结肿瘤基因组数据挖掘研究面临的机遇与挑战。  相似文献   

4.
目的:通过构建抗癌药物基因组学知识表示模型,丰富药物、基因、疾病以及个性化用药等之间的语义关系,为临床医生精准用药、联合用药等提供参考依据,为药学科研人员开展新药研发、老药新用等研究提供理论支持,为癌症患者查询药物知识提供服务支撑。方法:对DrugBank、RxNorm、FDA药品说明书等药物基因组数据进行整合和抽取,在通用药物基因组学知识表示模型的基础上,涵盖药物、基因、疾病3个基本维度,并拓展个性化用药、药物副作用等知识维度,设计知识表示框架,确立相关实体类型,发现和定义实体与实体之间的语义关系。在构建好的抗癌药物基因组学知识表示模型的基础上,以黑色素瘤相关药物为例,对知识表示模型进行填充,并对实体和实体间语义关系进行可视化表达。结果:实现了药物、基因、疾病、个性化用药、药物副作用5类实体的概念抽取,定义了实体间的15种语义关系,构建了黑色素瘤药物基因组学相关的136个知识三元组。结论:面向抗癌药物精准用药的药物基因组学知识表示模型可以确定癌症用药与基因突变、人群、药物副作用之间的关联和推动药物基因组学知识在临床研究中的应用。  相似文献   

5.
生物信息学在医学研究中的应用进展   总被引:5,自引:0,他引:5  
杨咏梅  曲迅  曹玉美 《医学综述》2007,13(22):1681-1683
随着高通量技术的出现及其在疾病基因组、蛋白组学研究中的应用,生物信息学在解读基因组、转录组及蛋白质组学分析产生的海量数据中发挥着越来越重要的作用。生物信息学在致病基因寻找、药物有效靶点筛选等医学研究各领域的发展日益深入。现就生物信息学在基础医学、临床医学及药物开发研究中的应用进展进行综述。  相似文献   

6.
DNA微阵列技术是近年来发展起来的一种功能基因组学研究技术.利用DNA微阵列技术,可以从基因组水平上鉴定出相关的功能基因及其表达调控网络,有助于阐明这些基因的生物学功能及其机理.结合文本挖掘的相关研究结果.探讨了DNA微阵列技术的原理和特点,数据的分析和解释,基因的聚类方法和基于文献的DNA微阵列分析.通过基于文献的微阵列分析方法,找出隐舍的、具有语义关联的生物概念,并进行推理,发现隐性的新知识.具体阐述了基于统计、基于自然语言处理、基于关联规则挖掘,基于模式识别的4种分析方法.基于文本挖掘的DNA微阵列技术,有利于发现基因或蛋白质之间的相互作用关系,自动识别生物学名词,提高数据分析效率等.  相似文献   

7.
基因组水平的核苷酸变异会引起DNA序列的多态性 ,这就是学术界所称的单核苷酸多态性 (简称SNP)。这种多态性决定着人体是否易患癌症等疾病以及个体对药物的反应差异。因此 ,以SNP为对象的功能基因组学研究 ,已经成为国内外疾病基因组学研究的重点 ,并有望成为揭示常见病发病机制的希望所在。军事医学科学院贺福初院士领导的课题组对 72 4名肺癌患者多种基因的SNP数据进行了系统分析 ,结果发现CYP2A13基因的多态性对肺腺癌的发生风险有降低作用。研究人员对 6 0 3名乙肝患者的规模化分析发现 ,IL10RB基因的多态性能增加乙型肝炎慢性…  相似文献   

8.
人类基因组计划使生物医学的研究取得了前所未有的成就,在研究结果中得到了大量的生物医学实体,如基因、蛋白质、器官、疾病和药物等,但这些生物实体之间存在什么样的关系仍不完全清楚.作为生物医学研究成果载体的文献呈指数增长,已成为科研人员获取知识的瓶颈.文本挖掘能够解决信息超载问题,故对生物医学实体关系的挖掘流程和评价指标进行介绍,对生物医学文本挖掘在研究生物实体关系抽取中采用的基于统计的方法、基于自然语言处理的方法和基于模式匹配的方法进行了阐述,对各种方法进行了综合比较,同时介绍了国内外相关研究.  相似文献   

9.
临床基因组学主要研究基因组信息在临床中的应用,包括诊断、治疗决策、预测预后。在传统的算法和技术难以处理基因组学中复杂又庞大的数据时,人工智能的应用带来新的希望。目前,人工智能已参与到临床基因组学的多种任务中,如识别变异、变异分类、影像-遗传诊断、电子病历-基因诊断、药物作用及不良反应预测等。本文主要综述临床基因组中不同方面的人工智能应用。  相似文献   

10.
人类基因组测序工作的完成,标志着基因组学的研究已由结构基因组学迈向功能基因组学,即后基因时代[1-2].如何从海量的基因信息中挖掘基因功能,如何大规模研究人类约3万条基因的功能[3],尤其是基因的相互作用和调控关系,将成为研究现代生物学面临的最大挑战.  相似文献   

11.
基于美国环境健康领域开放科学数据,采用数据挖掘技术研究空气污染物、细颗粒物、气象条件、有毒物质等环境因素与肺癌、哮喘等疾病的关联分析方法,同时实现了关联分析在实践中的应用,为我国环境与疾病关联研究提供参考和借鉴。  相似文献   

12.
基于免费开放的PubMed文献数据集,利用文献的知识发现,通过挖掘文献中隐含的关联,构建了生物医学实体关联演化网络。它能帮助科研人员形成新的科学假设,分析关联网络的拓扑特征,从系统层面上研究科学文献富集的知识结构、相关性与发展规律,为文献的知识发现引入新的视角与方法,提高知识发现的效率。  相似文献   

13.
ObjectiveHigh-throughput electronic phenotyping algorithms can accelerate translational research using data from electronic health record (EHR) systems. The temporal information buried in EHRs is often underutilized in developing computational phenotypic definitions. This study aims to develop a high-throughput phenotyping method, leveraging temporal sequential patterns from EHRs.Materials and MethodsWe develop a representation mining algorithm to extract 5 classes of representations from EHR diagnosis and medication records: the aggregated vector of the records (aggregated vector representation), the standard sequential patterns (sequential pattern mining), the transitive sequential patterns (transitive sequential pattern mining), and 2 hybrid classes. Using EHR data on 10 phenotypes from the Mass General Brigham Biobank, we train and validate phenotyping algorithms.ResultsPhenotyping with temporal sequences resulted in a superior classification performance across all 10 phenotypes compared with the standard representations in electronic phenotyping. The high-throughput algorithm’s classification performance was superior or similar to the performance of previously published electronic phenotyping algorithms. We characterize and evaluate the top transitive sequences of diagnosis records paired with the records of risk factors, symptoms, complications, medications, or vaccinations.DiscussionThe proposed high-throughput phenotyping approach enables seamless discovery of sequential record combinations that may be difficult to assume from raw EHR data. Transitive sequences offer more accurate characterization of the phenotype, compared with its individual components, and reflect the actual lived experiences of the patients with that particular disease.ConclusionSequential data representations provide a precise mechanism for incorporating raw EHR records into downstream machine learning. Our approach starts with user interpretability and works backward to the technology.  相似文献   

14.
 目的  探讨多重PCR靶向富集结合高通量测序技术在结直肠癌 (colorectal cancer,CRC)中检测错配修复 (mismatch repair,MMR)基因种系突变的应用。方法  收集17例CRC患者和14例正常人的血液并提取基因组DNA;设计和优化寡聚核苷酸探针,使其能对5个基因MLHl、MSH2、PMS1、PMS2和MSH6的73个外显子序列进行有效的PCR扩增和富集;应用多重PCR技术靶向富集样本MMR基因的外显子序列;扩增产物进行文库构建和高通量测序,检测MLHl、MSH2、PMS1、PMS2和MSH6基因的突变情况。结果  31个样本共得到2.7Gb的数据,平均reads数为287 048,测序数据中平均82.18%可与参考序列进行比对,外显子序列平均覆盖度为99.9%,平均测序深度为2 282。在MMR基因的外显子区域共发现13种非同义单核苷酸变异 (single nucleotide variation,SNV)、2种同义 SNV,其中MSH6的c.G3205C:p.G1069R为未见报道SNV。检测结果经Sanger法测序验证,结果一致。结论  多重PCR靶向富集结合高通量测序技术是一套通量高、速度快、费用低、准确性高的MMR基因突变筛查方法。  相似文献   

15.
数据挖掘在教学管理中的应用研究   总被引:1,自引:0,他引:1  
数据挖掘是一种新的信息处理技术.文章在对数据挖掘进行概述的基础上,以某高校教务管理系统应用为例,说明在学校教学管理中,数据挖掘能从海量数据中找出有价值、有意义的数据,为教学管理的科学决策提供参考,既提高了教学管理工作的效率和质量,又减少了工作人员的工作量.  相似文献   

16.
ObjectiveResearch on pharmacovigilance from social media data has focused on mining adverse drug events (ADEs) using annotated datasets, with publications generally focusing on 1 of 3 tasks: ADE classification, named entity recognition for identifying the span of ADE mentions, and ADE mention normalization to standardized terminologies. While the common goal of such systems is to detect ADE signals that can be used to inform public policy, it has been impeded largely by limited end-to-end solutions for large-scale analysis of social media reports for different drugs.Materials and MethodsWe present a dataset for training and evaluation of ADE pipelines where the ADE distribution is closer to the average ‘natural balance’ with ADEs present in about 7% of the tweets. The deep learning architecture involves an ADE extraction pipeline with individual components for all 3 tasks.ResultsThe system presented achieved state-of-the-art performance on comparable datasets and scored a classification performance of F1 = 0.63, span extraction performance of F1 = 0.44 and an end-to-end entity resolution performance of F1 = 0.34 on the presented dataset.DiscussionThe performance of the models continues to highlight multiple challenges when deploying pharmacovigilance systems that use social media data. We discuss the implications of such models in the downstream tasks of signal detection and suggest future enhancements.ConclusionMining ADEs from Twitter posts using a pipeline architecture requires the different components to be trained and tuned based on input data imbalance in order to ensure optimal performance on the end-to-end resolution task.  相似文献   

17.
本文基于美国环境健康领域开放科学数据,采用数据挖掘技术研究空气污染物、细颗粒物、气象条件、有毒物质等环境因素与肺癌、哮喘等疾病的关联分析方法,同时实现了关联分析在实践中的应用,为我国环境与疾病关联研究提供参考和借鉴。  相似文献   

18.
数据挖掘技术在肝癌术后预测分析中的应用初探   总被引:1,自引:0,他引:1  
目的:考察数据挖掘技术对肝癌患者术后预测的效果。方法:采用数据挖掘技术中的神经网络方法在SAS软件上构建神经网络模型。利用该模型分析我校东方肝胆外科医院1990年1月1日入院至1995年12月31日出院的1457例肝癌患者的临床资料,检测其对肝癌患者术后复发的预测准确率。结果:从56个指标中筛选出有统计学意义的11个指标进入模型,经适当训练后在验证集和测试集上预测准确率均在80%以上。结论:数据挖掘技术可应用于肝癌术后预测分析,效果较为理想。在应用数据掺掘技术时应采用较大样本,同时还应根据资料类型选用适当的方法,反复尝试。  相似文献   

19.
目的:通过研究既往国内外慢性病诊疗数据库及相关数据挖掘技术中存在的局限性及不足,结合军队慢性疾病的特点及对军队训练、作战等的影响,提出建立新的综合性的军队慢性疾病诊疗数据库及相关的数据挖掘技术。方法:利用军队大型综合医院慢性疾病的现状与特点,以及军队慢性疾病诊疗资源丰富的优势,建立具有海量存贮特性的慢性疾病综合性的诊疗数据库,通过数据挖掘技术,实现对相应疾病进行统计查询的设计。结果:根据对部分常见慢性疾病诊疗数据库的研究分析,构建军队大型综合医院慢性疾病诊疗数据库系统,并基于数据库实施慢性疾病诊疗的数据挖掘。结论:对军队慢性疾病诊疗数据库实施数据挖掘及模型设计,较好地实现了信息技术智能化的转变,具有较好的医学临床诊疗领域应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号