首页 | 本学科首页   官方微博 | 高级检索  
     

基于支持向量回归方法的蛋白残基可溶性预测
引用本文:许文龙,李骜,王明会,江朝晖,冯焕清. 基于支持向量回归方法的蛋白残基可溶性预测[J]. 中国生物医学工程学报, 2007, 26(1): 1-5
作者姓名:许文龙  李骜  王明会  江朝晖  冯焕清
作者单位:1. 中国科学技术大学电子科学与技术系,合肥,230026
2. 北京工业大学生命科学和生物工程学院,北京,100022
基金项目:中国科技大学校科研和教改项目
摘    要:介绍了一种从蛋白质序列预测残基相对可溶性的新方法。该方法基于支持向量回归,并将序列局部信息作为输入。不同于先前的大部分预测方法仅对特定的蛋白残基相对可溶性进行状态分类,该方法预测了相对可溶性的连续值,从而比状态分类保留了蛋白质三维结构的更多信息。本研究对RS-126,Manesh-215和CB-513三个数据集进行了测试。通过比较不同的参数及窗宽模型来获得最佳结果,采用平均绝对误差、相关系数等参数来衡量预测效果,同时与多层反馈神经网络方法(RVP-Net)的实验结果比较,在3-fold情况下三个数据集预测结果的平均绝对误差均有降低,相关系数均有提高。另外,该算法采用了多序列比对作为输入,效果比单序列有所提高。采用该方法,对CB-513数据集平均绝对误差可以达到16.8%、相关系数为0.562,而用RVP-Net方法分别为18.8%和0.480。这些结论表明支持向量回归方法是蛋白质序列分析的一种有效工具。

关 键 词:相对可溶性  支持向量机  机器学习  蛋白质结构预测  生物信息学
文章编号:0258-8021(2007)01-0001-05
收稿时间:2005-05-08
修稿时间:2006-11-13

Prediction of Relative Solvent Accessibility Using Support Vector Regression
XU Wen-Long,LI Ao,WANG Ming-Hui,JIANG Zhao-Hui,FENG Huan-Qing. Prediction of Relative Solvent Accessibility Using Support Vector Regression[J]. Chinese Journal of Biomedical Engineering, 2007, 26(1): 1-5
Authors:XU Wen-Long  LI Ao  WANG Ming-Hui  JIANG Zhao-Hui  FENG Huan-Qing
Abstract:In this work a novel method was proposed to predict the relative solvent accessibilities of residues from protein primary sequences.This method was based on support vector regression(SVR) and used the local information of the particular residue for prediction as input.Three data sets,RS-126,Manesh-215 and CB-513,were collected and used to evaluate prediction performance.With 3fold cross validation test,the average of mean absolute error(MAE) and correlation coefficient(CC) for different data set were consistently better than a previous method called RVP-Net which was based on a multilayer feed-forward neural network.In addition,we used multiple sequence alignment as input information and obtained a prediction result of 16.8% for MAE and 0.562 for CC,which was superior to that obtained with single sequence input.The results demonstrate the efficiency of this method and that the support vector regression is a useful tool for proteomics prediction analysis.
Keywords:relative solvent accessibility    support vector machine    machine learning   protein structure prediction  bioinformatics
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号