一种基于树的集成学习方法新思路在中老年人消化系统疾病相关因素研究中的应用 |
| |
引用本文: | 张蕊,郭维恒,王世伟,冯彦成,王添,郭志旺,王立芹.一种基于树的集成学习方法新思路在中老年人消化系统疾病相关因素研究中的应用[J].中国卫生统计,2023(2):242-245. |
| |
作者姓名: | 张蕊 郭维恒 王世伟 冯彦成 王添 郭志旺 王立芹 |
| |
作者单位: | 1. 河北医科大学公共卫生学院流行病与卫生统计学教研室;2. 河北省环境与人群健康重点实验室;3. 西安医学院公共卫生学院流行病与卫生统计学教研室 |
| |
摘 要: | 目的 本研究借鉴深度森林(deep forest)的思想,提出一种基于树的集成学习方法新思路,为以后相关的研究提供分析策略和思路。方法 使用2015年中国健康与养老追踪调查数据库,筛选与消化系统疾病有关的变量,通过“人工地”建立多层随机森林模型,对人群进行分类,再分别建立模型筛选变量,通过计算评价指标评价模型效果,从而选择更优的模型解释与消化系统疾病相关的变量。结果 本研究发现通过建立多层随机森林模型对人群分为两类后,再分别建立模型,各评价指标都有很大幅度提高。另外对两类人群分别构建随机森林模型后,根据变量重要性评分筛选出与消化系统疾病有关的重要变量,再建立logistic模型,结果显示,一类人群筛选出15个有统计学意义的变量,其中有13个危险因素,OR值由1.871至35.917,关联最强的是关节炎和风湿病,其次为肾脏疾病、过去一个月生过病、头痛或者颈部痛、胸背部或者腰臀部疼痛、心脏病等;2个保护因素为晚上的睡眠时间、血红蛋白值。另一类人群筛选出的相关变量与第一类人群大部分相同,但作用相反,OR值由0.067至0.771,并且对第一类人群危害最大的因素对第二类保护也最大。结论 对于病...
|
关 键 词: | 消化系统疾病 集成学习 胃病相关因素 随机森林 |
|
|