共查询到20条相似文献,搜索用时 15 毫秒
1.
何贤英赵志温兴煊公为洁黄波张晋昕 《中国卫生统计》2015,(2):275-277
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。 相似文献
2.
《中国卫生统计》2015,(2)
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。 相似文献
3.
4.
《中国卫生统计》2017,(4)
目的探讨双界点OR值最大法logistic回归在中小学生登革热知识提高幅度的影响因素研究中的应用。方法基于多阶段分层整群随机抽样的广州市中小学生登革热相关知识传播效果的干预研究的调查数据,建立中小学生登革热知识提高幅度影响因素的双界点OR值最大法logistic回归模型,与采用连续型变量法、中位数法、单界点P值最小法的logistic回归模型比较模型拟合效果,探讨双界点OR值最大法logistic回归的优势。结果纳入干预效果评估的共1311人,三年级299名,五年级331名,初二321名,高二360名。以高二数据为例,双界点OR值最大法logistic回归纳入的自变量为知识基线得分、干预方式、登革热病例数;其模型的拟合效果最好,且对于自变量分界点的划分更合理,能够更好地筛选出与结局有关联的影响因素。结论双界点OR值最大法logistic回归适用于中小学生登革热知识提高幅度影响因素的研究。中小学生的登革热知识的干预效果受多个因素的影响,应开展有针对性的健康教育。 相似文献
5.
《中国卫生统计》2016,(4)
目的遗传关联研究中高维数据与日俱增。本文探讨基于岭估计、LASSO和弹性网的广义线性模型在遗传关联研究的应用及软件实现,为高维关联分析提供方法学参考。方法介绍惩罚广义线性模型原理及软件实现方法,并采用模拟的连锁平衡和连锁不平衡的SNPs关联研究数据,以惩罚logistic模型例证R软件glmnet包对广义线性模型的拟合。结果对连锁平衡和连锁不平衡SNPs模拟数据,LASSO与弹性网均给出稀疏解,较好地选择有关联SNPs而剔除无关联变量;而岭估计把所有变量都保留在模型中,模型复杂度高但相应的解释度未增加。结论 LASSO和弹性网可对高维遗传关联数据进行有效降维,筛选变量的同时提供参数估计,从而降低模型的复杂度。R软件的glmnet包灵活拟合各类惩罚广义线性模型,可在高通量遗传关联分析中推广应用。 相似文献
6.
目的介绍广义相加模型(GAM)识别非线性相关及其在医学统计建模中的应用。方法应用SAS软件PROC GAM模块识别实例数据结局变量与自变量之间的非线性相关,通过比较考虑该非线性相关和不考虑该非线性相关时多元线性回归和logistic回归模型的拟合和预测效果,阐明GAM识别非线性相关在统计建模中的重要性。结果与不考虑非线性相关的模型相比,考虑非线性相关的模型拟合和预测效果更优。结论合理使用GAM,在模型中纳入非线性成分,可改善回归模型的建模效果和预测精度。 相似文献
7.
目的 探索自回归差分移动平均(autoregressive integrated moving average,ARIMA)季节乘积模型在预测儿童肺炎门急诊人次的应用,为合理利用医疗资源提供科学依据。 方法 收集乌鲁木齐市两家三级甲等医院2011-2016年儿童肺炎逐月门急诊人次数据,使用R 3.4.1软件进行模型的识别、参数估计与检验,建立ARIMA季节乘积模型对2011年1月-2016年6月儿童肺炎逐月门急诊人次进行拟合,并利用2016年7-12月数据计算预测值与实际值的平均预测相对误差来评价预测效果。 结果 ARIMA(0,1,2)(1,1,0)12模型是拟合儿童肺炎门急诊人次的最佳预测模型,平均相对误差为9.82%。 结论 ARIMA 季节乘积模型有较好的拟合和短期预测效果,能为医院合理利用医疗资源提供参考依据。 相似文献
8.
目的 比较随机生存森林模型、梯度提升模型、极限梯度提升模型与Cox比例风险回归模型对生存数据的区分度性能,为生存分析方法的应用提供参考。方法 基于基准实验框架,选择SEER数据库、TCGA数据库、R软件包共13个数据集,分别构建三种机器学习模型与Cox模型,以嵌套交叉验证获得Harrell’s C-index作为模型区分度性能评价指标,采用秩和检验比较模型间性能。结果 各数据集的C-index主要集中在0.6~0.75之间。单数据集的结果不全相同,各模型C-index差异仅在部分数据集有意义,且没有一致结论;四种方法的性能在所有数据集、高删失率数据集、低删失率数据集等不同组数据集间的C指数差异均无统计学意义。结论 在不同场景下的生存数据分析中,三种机器学习模型区分度性能与传统Cox模型相近。 相似文献
9.
10.
11.
干旱地区伤寒副伤寒与气象因素关系的BP神经网络模型 总被引:9,自引:0,他引:9
目的应用人工神经网络的原理和方法,探讨在干旱灾害条件下影响伤寒副伤寒流行的关键气象因子,建立旱灾地区传染病疫情的BP神经网络模型,并评价模型的拟合效果.方法利用Matlab 6.5软件对人工神经网络BP模型进行构建、训练及模拟.结果伤寒副伤寒发病率回代平均误差率和R2分别为0.84%和0.9999,自变量对输出的贡献量分析结果显示,平均蒸发量和平均气压对于伤寒副伤寒发病率影响最大.结论伤寒副伤寒与气象因素关系的 BP神经网络模型拟合效果较好,有进一步研究的价值. 相似文献
12.
13.
14.
15.
目的 探讨多水平生存分析中的Cox比例风险模型右在职业性肺癌危险因素量化评价中的应用。方法 以云南锡业总公司劳动防护研究所提供的高危人群队列的随访资料为例,拟合3个水平的截断数据的多重成员Cox模型,并分析各水平的随机效应及其与肺癌发生间的关系。结果 模型结果显示,云锡所属单位中“马拉格锡矿”与其他单位有不同的致癌随机效应,个体因素也与肺癌的发生有关。结论 多水平生存分析对于处理具有系统层次结构的 相似文献
16.
17.
18.
19.
20.
目的探讨乘法季节回归求和移动平均模型(ARIMA)在安徽省手足口病发病预测中应用,为手足口病预防控制提供参考。方法根据2009-2014年安徽省手足口病的周发病数据,运用R 3.0.2软件拟合乘法季节性ARIMA模型,并对2015年1~52周发病数进行预测。结果安徽省手足口病预测中最优模型为ARIMA(1,1,1)(0,1,1)52模型,残差统计量检验差异无统计学意义(Box-Ljung=0.004,P=0.950),提示残差为白噪声,模型拟合值和实际值平均绝对误差率为11.32%,2015年1~52周预测值和实际值平均绝对误差率为25.10%。结论建立的乘法季节性ARIMA模型能较好地拟合安徽省手足口病变动趋势,模型预测效果较好,可用于安徽省手足口病短期预测。 相似文献