首页 | 本学科首页   官方微博 | 高级检索  
检索        

运用近邻传播聚类分析进行SELDI-TOF蛋白质谱特征选择
引用本文:杨合龙,祝磊,韩斌,厉力华,郑智国,孟旭莉.运用近邻传播聚类分析进行SELDI-TOF蛋白质谱特征选择[J].中国生物医学工程学报,2013,32(1):14-20.
作者姓名:杨合龙  祝磊  韩斌  厉力华  郑智国  孟旭莉
作者单位:1. 杭州电子科技大学生命信息与仪器工程学院,杭州,310018
2. 浙江省肿瘤研究所,杭州,310022
基金项目:国家自然科学基金(60801054,60801055);国家杰出青年基金(60788101)
摘    要:针对如何有效分析高通量SELDI-TOF质谱数据以及筛选与肿瘤相关的蛋白质位点,提出一种基于近邻传播聚类分析的特征选择方法.首先利用t-test对SELDI数据进行初筛,然后利用近邻传播聚类分析以及零空间LDA对数据进行降维和去相关处理,最后采用SVM-RFE进行特征选择,筛选出与肿瘤判别相关的蛋白质位点.利用SVM、KNN、NB及J4.8等4个分类器,估算算法的分类性能.结果表明,在卵巢癌公共数据集OC-WCX2a和OC-WCX2b以及浙江省肿瘤医院乳腺癌数据集BC-WCX2a上显示该算法,在上述3个数据集中分类率分别达到96.43%、99.66%、90.88%,敏感性分别达到97.00%、100%、96.17%,特异性分别达到95.85%、99.08%、81.92%,并分别挑选出与肿瘤判别相关的10个蛋白位点.所提出的算法能够获得较好的分类率,有效提取出具有较好判别效果的蛋白质谱位点,有助于癌症的辅助诊断.

关 键 词:蛋白质质谱  近邻传播聚类分析  特征选择  生物标志物

Feature Selection and Sample Classification for SELDI-TOF Mass Spectrometry Data Based on Affinity Propagation Clustering
YANG He-Long , ZHU Lei , HAN Bin , LI Li-Hua , ZHENG Zhi-Guo , MENG Xu-Li.Feature Selection and Sample Classification for SELDI-TOF Mass Spectrometry Data Based on Affinity Propagation Clustering[J].Chinese Journal of Biomedical Engineering,2013,32(1):14-20.
Authors:YANG He-Long  ZHU Lei  HAN Bin  LI Li-Hua  ZHENG Zhi-Guo  MENG Xu-Li
Institution:1(Collage of Life Information Science & Instrument Engineering,Hangzhou Dianzi University,Hangzhou 310018,China) 2(Zhejiang Cancer Institute,Hangzhou 310022,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号