首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于K近邻的蛋白质功能的预测方法   总被引:1,自引:0,他引:1  
蛋白质功能预测是后基因组时代研究的重要问题之一.利用蛋白质相互作用网络,提出了一种基于K近邻的蛋白质功能的注释方法,该方法首先计算待注释的蛋白质与所有已知功能的蛋白质间的注释环境相似度,选择其中最相似的K个蛋白质,将该K个蛋白质的功能注释进行加权平均,作为待注释的蛋白质最终的功能注释.在构建的芽殖酵母的两组大规模相互作用数据集上的测试表明,该方法能够有效的对蛋白质功能进行预测,在蛋白质功能预测性能上优于现有的一些方法.  相似文献   

2.
对现有已知药物的功能模式进行分析,可以帮助发现其可能的新应用,指导联合用药或预测药物的未知毒副作用.提出将药物化学结构信息和GO注释信息结合,分析药物功能模式相似度.药物化学结构和GO注释信息下载自DrugBank数据库,其中GO注释信息包括生物过程、分子功能和细胞定位等3个分支.计算现有4886种药物的功能模式相似度,并对其进行聚类分析.基于Tanimoto系数计算药物化学结构相似度,基于语义分析计算药物GO注释中3个分支的相似度.分别使用Logistic回归、算术均值、几何均值将上述4个药物相似度结合,得到反映多方信息的复合相似度.将一种药物与所有其他药物的相似度向量作为该药物的特征谱,对药物进行层次聚类.使用药物解剖学、治疗学及化学分类( ATC)的标准评价不同的相似度和聚类结果.结果显示:药物化学结构相似度与基于GO的3个分支的相似度均线性相关,表明药物的结构信息能在一定程度上反映功能信息;Logistic回归复合相似度能够很好地反映两个药物是否属于同一个ATC分类;基于GO注释生物过程分支语义相似度和几何均数复合相似度聚类结果与ATC分类第一层次强关联.所提出的方法结果可靠,可望用于辅助药物发现和预测不良反应.  相似文献   

3.
我们提出了一种新的肿瘤特征基因调控网络构建方法,首先用P-tree方法快速筛选肿瘤特征基因集;然后结合GO体系中对基因的注释信息与芯片数据信息对特征基因进行聚类;最后通过文献挖掘方法,以聚类获得的每个功能类中的基因为核心,建立肿瘤特征基因功能类网络模块.实验结果表明:本研究的方法明显提高了特征基因筛选速度,网络构建基于生物功能过程进一步细化,同时通过文献挖掘方法在网络中补充入大量与肿瘤特征基因发生直接或间接关系的基因,网络内容更加丰富与条理化.通过结合芯片数据,GO体系与相关文献中信息构建肿瘤特征基因调控网络能够构建更为细致、丰富,并针对具体调控过程的网络模块,为肿瘤的产生,发展与转移过程分析提供有效的指导.  相似文献   

4.
生物信息学在蛋白质结构与功能预测中的应用   总被引:15,自引:1,他引:14  
生物信息学是现代生命科学与信息科学、计算机科学、数学、统计学、物理学、化学等学科相互渗透而高度交叉形成的一门新兴前沿学科。随着人类基因组计划的完成,应用生物信息学技术预测蛋白质结构与功能将成为后基因组时代的一项重要任务。本文介绍了主要的蛋白质结构和序列数据库资源,在此基础上提出了一种高效的整合方法,并简述蛋白质结构与功能预测的基本方法、进展及其改进,展望了蛋白质预测技术的前景。  相似文献   

5.
目的 准确预测蛋白质结构类,为研究其空间结构及生物功能打下基础.方法 应用隐马尔可夫模型(HMM)预测蛋白质结构类,分别构建3-状态HMM和8-状态HMM.数据来源于Chou和Zhou构建的蛋白质数据集,分别包含有204条蛋白质序列和498条蛋白质序列,通过留一法预测其准确率.结果 所构建的3-状态HMM和8-状态HMM对全α类的预测准确率最高,尤其是3-状态HMM的预测准确率达到95%以上.与Chou数据集相比,Zhou数据集对于全β类和α/β类的预测准确率也有所提高,同时,总体预测率也提高了2%左右;但α+β类的预测准确率有所下降.结论 将整条蛋白质序列作为预测模型的输入信息所构建的HMM模型能有效地预测蛋白质的结构类.  相似文献   

6.
目的: 应用生物信息学预测先天性心脏病相关易感基因,为先天性心脏病的临床诊断和治疗提供理论依据。方法: 通过OMIM数据库获取已知的先天性心脏病相关易感基因。将已知的疾病相关易感基因作为"种子基因",利用蛋白质相互作用网络寻找邻近节点中富集了疾病相关易感基因的"种子基因",并视其邻居基因为候选的疾病相关易感基因。对已知的疾病相关易感基因进行GO、Pathway和Human Phenotype富集分析,并据此注释候选基因;运用文献挖掘法对候选基因进行验证性分析。结果: 通过OMIM共获取已知的先天性心脏病相关易感基因28个,发现邻近节点中富集了疾病相关易感基因的"种子基因"4个,得到候选的疾病相关易感基因20个,通过功能富集分析从中预测出新的先天性心脏病易感基因7个。文献挖掘发现这7个基因在心脏发育过程中均起着极其重要的作用。结论: 通过生物信息学分析发现7个候选基因与已知的先天性心脏病相关易感基因关系密切,提示该病的发生是多种基因相互作用的结果,为后续深化该病机制研究提供了有效的指导。  相似文献   

7.
蛋白质序列信息的提取与蛋白质结构预测   总被引:4,自引:0,他引:4  
蛋白质结构预测是生物信息学的一项重要任务.本文介绍了目前在蛋白质结构预测中,基于人工神经网络和小波分析蛋白质序列信息的提取方法.从蛋白质序列提取更多的生物学特征和机器学习相结合的方法将有效提高蛋白质结构预测的精度.  相似文献   

8.
蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面.本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维和57维的特征信息集,并尝试在Adaboost.M1算法中引入Multi-Agent多智能体融合的思想,提出了一种Ma-Ada多分类器融合算法.该算法作为蛋白质结构类的预测工具,充分挖掘了单分类器度量层信息以及各个单分类器之间的交互融合信息.实验结果表明,Ma-Ada算法在Z277、Z498、1189和D640四个蛋白质数据集的57维特征信息集上的分类率分别达到了91.3%、96.8%、85.3%和87.2%,在17维特征信息集上的分类率也分别达到了90.6%、95.8%、84.8%和88.3%.与其它蛋白质结构类预测方法的结果相比,本方法能够获得较好的分类率.  相似文献   

9.
蛋白质二级结构预测是蛋白质功能预测中一个很重要的环节.我们综合考虑了蛋白质序列中对氨基酸二级结构具有影响的因素,采用最大熵模型实现了对蛋白质二级结构的预测.将氨基酸之间的相互作用和氨基酸对于二级结构的倾向性作为特征函数,充分体现了蛋白质序列中氨基酸之间的短程和长程的相互作用的影响.最大熵模型整合了这些多源的信息,形成一个单一的概率模型.与现有的单序列预测方法相比,本文的方法取得了较高的预测准确率,预测结果表明它是一种实用的预测方法.  相似文献   

10.
蛋白质的亚细胞定位预测研究进展   总被引:1,自引:0,他引:1  
蛋白质处于特定的亚细胞位置上才能行使其功能,故研究亚细胞定位对了解蛋白质功能非常重要。随着后基因组时代的来临,蛋白质序列信息增长迅速,而利用实验手段分析蛋白亚细胞定位的不易大规模进行。近年来,通过提取蛋白质的各种特征信息,自动预测蛋白质的亚细胞定位的算法得到了较快的发展,本文拟从蛋白质特征信息的提取、预测算法和预测效果检验等方面,介绍蛋白质亚细胞定位预测领域中研究进展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号