微阵列数据中的先验信息对基于LASSO变量选择方法影响的模拟研究北大核心CSCD |
| |
引用本文: | 陈江鹏彭斌文雯唐小静文小焱胡珊.微阵列数据中的先验信息对基于LASSO变量选择方法影响的模拟研究北大核心CSCD[J].中国卫生统计,2015(3):407-409. |
| |
作者姓名: | 陈江鹏彭斌文雯唐小静文小焱胡珊 |
| |
作者单位: | 1.重庆医科大学公共卫生与管理学院卫生统计与信息管理教研室400016; |
| |
基金项目: | 国家自然科学基金(81373103);重庆市科委基础与前沿研究计划项目(cstc2013jcyj A10009) |
| |
摘 要: | 目的探讨微阵列数据中的先验信息对基于LASSO变量选择方法的影响。方法设置真实模型后,逐步融合先验信息,采用R、MATLAB软件编程,模拟比较先验信息对LASSO,group LASSO(简称为g LASSO)中的non-overlap group LASSO(简称为nog LASSO)和overlap group LASSO(简称为og LASSO)变量选择的影响。结果经典的LASSO、og LASSO变量选择方法在处理模拟微阵列数据时具有较好的预测精度(AUCLASSO=0.8915≈AUCog LASSO=0.8923>AUCnog LASSO=0.8396,MSEnog LASSO=0.1358>MSEog LASSO=0.0975≈MSELASSO=0.0928),LASSO可解释性最强(平均入选模型基因数分别为21.52、111.95、101.01)。nog LASSO在处理基因通路信息时,当X295]被错分至第19个通路后,尽管未改变其效应值,但入选模型次数大为减少,预测精度下降较为明显,而og LASSO表现更稳健。结论融合微阵列数据中的先验信息并未提高基于LASSO变量选择方法的预测性能及效率,经典的LASSO变量选择方法仍为处理微阵列数据的有效方法。
|
关 键 词: | 变量选择 LASSO算法 模拟 |
本文献已被 维普 等数据库收录! |
|