首页 | 本学科首页   官方微博 | 高级检索  
检索        

AIC结合最优子集法构建logistic回归模型在预测2型糖尿病并发末梢神经病变中的应用
引用本文:李长平,职心乐,刘晓红,崔壮,魏风江,柯慧,李妍,马骏.AIC结合最优子集法构建logistic回归模型在预测2型糖尿病并发末梢神经病变中的应用[J].中国卫生统计,2010,27(6).
作者姓名:李长平  职心乐  刘晓红  崔壮  魏风江  柯慧  李妍  马骏
基金项目:全国统计科学研究计划项目,天津医科大学公共卫生学院基金
摘    要:目的 研究如何快速有效地进行变量的筛选,建立起准确可靠的logistic回归预测模型;针对小样本的特性,如何对模型的泛化能力(即预测性能)进行可靠的评价;并在数据集来源于分离抽样时,对模型进行过抽样的调整,使调整后的结果适用于人群预测疾病发生的可能性.方法 以2型糖尿病并发末梢神经病变数据为例,采用最优子集法与AIC信息准则相结合对变量进行快速方便的筛选,并采用Monte Carlo模拟抽样的方法(具体为10~100次的3~10折分层交叉验证法)对模型的泛化能力作出评价和比较.结果 采用最优子集法与AIC信息准则相结合建立的logistic回归模型,准确率为79.6%,ROC面积为0.8802,经分层交叉验证法验证,泛化能力优于用一般筛选变量方法建立的模型;用先验概率对后验概率进行过抽样的调整,使调整后的结果适用于人群预测疾病发生的可能性.结论 建立logistic回归预测模型时,应根据实际情况,尽量尝试多种筛选变量的建模策略,在小样本情况下,若欲对模型的泛化能力做出可靠的评价,可采用分层交叉验证的方法;当样本来源方式为分离抽样时,若研究目的 为建立预测模型,则应采用先验概率对后验概率进行调整.

关 键 词:logistic回归  交叉验证法  过抽样  糖尿病并发末梢神经病变

Combining the Best Subset Method with the Akike Information Criterion to Built Logistic Regression in Predictiving Peripheral Neuropathy in Type 2 Diabetes Mellitus
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号