首页 | 本学科首页   官方微博 | 高级检索  
检索        

基于分组重量编码和特征选择技术预测外膜蛋白
引用本文:南重汉,邹凌云.基于分组重量编码和特征选择技术预测外膜蛋白[J].第三军医大学学报,2013,35(13):1366-1370.
作者姓名:南重汉  邹凌云
作者单位:1. 解放军第3医院传染结核病防治所,陕西 宝鸡,721006
2. 400038重庆,第三军医大学基础医学部微生物学教研室,重庆市微生物工程实验室
基金项目:重庆市自然科学基金,第三军医大学科研创新基金,the Natural Science Foundation of Chongqing,the Innovative Foundation of Third Military Medical University
摘    要:目的建立新的机器学习模型,从蛋白质数据集或全基因组蛋白质序列中预测外膜蛋白。方法采用分组重量编码和氨基酸组成计算蛋白质序列特征,采用F-score方法反向选择特征,采用支持向量机算法建立分类模型,在1 087条蛋白质序列构成的数据集上进行测试,评价预测模型的敏感性、特异性和预测精度,在多个细菌的全基因组蛋白质中预测外膜蛋白。结果新的序列组合编码方法与SVM相结合,区分外膜蛋白和α螺旋跨膜蛋白、球状蛋白、非外膜蛋白的准确度分别达到94.7%、96.4%和94.6%,经特征选择之后,分类准确度分别提高到95.7%、96.9%和95.9%,且在基因组数据集中的预测结果与已知事实相符度高。结论该方法预测准确度优于其他基于序列特征的预测方法,可用于在基因组序列中预测和筛选新的外膜蛋白。

关 键 词:外膜蛋白  分组重量编码  特征选择  支持向量机

Prediction of outer membrane proteins with encoding based on grouped weight and feature selection techniques
Nan Chonghan,Zou Lingyun.Prediction of outer membrane proteins with encoding based on grouped weight and feature selection techniques[J].Acta Academiae Medicinae Militaris Tertiae,2013,35(13):1366-1370.
Authors:Nan Chonghan  Zou Lingyun
Institution:1Institute of Infectious TB Prevention,No.3 Hospital of PLA,Baoji,Shaanxi Province,721006;2Department of Microbiology,Chongqing Laboratory of Microbial Engineering,College of Basic Medical Sciences,Bioinformatics Center,Third Military Medical University,Chongqing,400038,China)
Abstract:
Keywords:outer membrane protein  encoding based on grouped weight  feature selection  support vector machine
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号