AIC结合最优子集法构建logistic回归模型在预测2型糖尿病并发末梢神经病变中的应用 |
| |
引用本文: | 李长平,职心乐,刘晓红,崔壮,魏风江,柯慧,李妍,马骏. AIC结合最优子集法构建logistic回归模型在预测2型糖尿病并发末梢神经病变中的应用[J]. 中国卫生统计, 2010, 27(6) |
| |
作者姓名: | 李长平 职心乐 刘晓红 崔壮 魏风江 柯慧 李妍 马骏 |
| |
基金项目: | 全国统计科学研究计划项目,天津医科大学公共卫生学院基金 |
| |
摘 要: | 目的 研究如何快速有效地进行变量的筛选,建立起准确可靠的logistic回归预测模型;针对小样本的特性,如何对模型的泛化能力(即预测性能)进行可靠的评价;并在数据集来源于分离抽样时,对模型进行过抽样的调整,使调整后的结果适用于人群预测疾病发生的可能性.方法 以2型糖尿病并发末梢神经病变数据为例,采用最优子集法与AIC信息准则相结合对变量进行快速方便的筛选,并采用Monte Carlo模拟抽样的方法(具体为10~100次的3~10折分层交叉验证法)对模型的泛化能力作出评价和比较.结果 采用最优子集法与AIC信息准则相结合建立的logistic回归模型,准确率为79.6%,ROC面积为0.8802,经分层交叉验证法验证,泛化能力优于用一般筛选变量方法建立的模型;用先验概率对后验概率进行过抽样的调整,使调整后的结果适用于人群预测疾病发生的可能性.结论 建立logistic回归预测模型时,应根据实际情况,尽量尝试多种筛选变量的建模策略,在小样本情况下,若欲对模型的泛化能力做出可靠的评价,可采用分层交叉验证的方法;当样本来源方式为分离抽样时,若研究目的 为建立预测模型,则应采用先验概率对后验概率进行调整.
|
关 键 词: | logistic回归 交叉验证法 过抽样 糖尿病并发末梢神经病变 |
Combining the Best Subset Method with the Akike Information Criterion to Built Logistic Regression in Predictiving Peripheral Neuropathy in Type 2 Diabetes Mellitus |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|