首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。  相似文献   

2.
目的提出logistic回归中连续型自变量离散化为二分类变量时的双界点OR值最大化分类法(简称双界点OR值最大法),通过模拟研究评价该法与其他离散化方法的模型拟合效果,并用实例数据进行验证。方法应用R软件中的"Smei Par"包对连续型自变量与logitπ间是否呈单调变化性进行判定;对不满足单调变化关系的自变量,采用连续型变量法(或称原始取值法)、中位数法、单界点P值最小法、双界点OR值最大法对原始数据进行处理后,分别拟合logistic回归模型;从拟合优度、变异的解释程度方面评价模型拟合效果。结果模拟数据和实例数据分析结果均可见,双界点OR值最大法相对于单界点P值最小法能够更合理地反映影响因素和结局的关联,并且与连续型变量法和中位数分类法相比其模型拟合优度、变异的解释程度效果更好。结论在拟合logistic回归模型时,若连续型自变量与logitπ之间呈非单调变化关系时,建议使用双界点OR值最大法对数据进行离散化。  相似文献   

3.
目的探讨当logitπ与连续型自变量之间呈线性关系时,采用原始值法和中位数截断法拟合logistic回归模型的差异。方法以成组设计病例对照研究为背景产生模拟数据,应用R软件"Smei Par"软件包对logitπ与连续型自变量间函数关系进行判断,进而采用原始值法和中位数截断法分别拟合logistic回归模型。结果原始值法较中位数截断法能够更好地拟合logistic回归模型。结论当logitπ与连续型自变量间呈线性关系时,建议采用原始值法。  相似文献   

4.
目的探讨双界点OR值最大法logistic回归在中小学生登革热知识提高幅度的影响因素研究中的应用。方法基于多阶段分层整群随机抽样的广州市中小学生登革热相关知识传播效果的干预研究的调查数据,建立中小学生登革热知识提高幅度影响因素的双界点OR值最大法logistic回归模型,与采用连续型变量法、中位数法、单界点P值最小法的logistic回归模型比较模型拟合效果,探讨双界点OR值最大法logistic回归的优势。结果纳入干预效果评估的共1311人,三年级299名,五年级331名,初二321名,高二360名。以高二数据为例,双界点OR值最大法logistic回归纳入的自变量为知识基线得分、干预方式、登革热病例数;其模型的拟合效果最好,且对于自变量分界点的划分更合理,能够更好地筛选出与结局有关联的影响因素。结论双界点OR值最大法logistic回归适用于中小学生登革热知识提高幅度影响因素的研究。中小学生的登革热知识的干预效果受多个因素的影响,应开展有针对性的健康教育。  相似文献   

5.
目的遗传关联研究中高维数据与日俱增。本文探讨基于岭估计、LASSO和弹性网的广义线性模型在遗传关联研究的应用及软件实现,为高维关联分析提供方法学参考。方法介绍惩罚广义线性模型原理及软件实现方法,并采用模拟的连锁平衡和连锁不平衡的SNPs关联研究数据,以惩罚logistic模型例证R软件glmnet包对广义线性模型的拟合。结果对连锁平衡和连锁不平衡SNPs模拟数据,LASSO与弹性网均给出稀疏解,较好地选择有关联SNPs而剔除无关联变量;而岭估计把所有变量都保留在模型中,模型复杂度高但相应的解释度未增加。结论 LASSO和弹性网可对高维遗传关联数据进行有效降维,筛选变量的同时提供参数估计,从而降低模型的复杂度。R软件的glmnet包灵活拟合各类惩罚广义线性模型,可在高通量遗传关联分析中推广应用。  相似文献   

6.
目的介绍广义相加模型(GAM)识别非线性相关及其在医学统计建模中的应用。方法应用SAS软件PROC GAM模块识别实例数据结局变量与自变量之间的非线性相关,通过比较考虑该非线性相关和不考虑该非线性相关时多元线性回归和logistic回归模型的拟合和预测效果,阐明GAM识别非线性相关在统计建模中的重要性。结果与不考虑非线性相关的模型相比,考虑非线性相关的模型拟合和预测效果更优。结论合理使用GAM,在模型中纳入非线性成分,可改善回归模型的建模效果和预测精度。  相似文献   

7.
目的 探索自回归差分移动平均(autoregressive integrated moving average,ARIMA)季节乘积模型在预测儿童肺炎门急诊人次的应用,为合理利用医疗资源提供科学依据。 方法 收集乌鲁木齐市两家三级甲等医院2011-2016年儿童肺炎逐月门急诊人次数据,使用R 3.4.1软件进行模型的识别、参数估计与检验,建立ARIMA季节乘积模型对2011年1月-2016年6月儿童肺炎逐月门急诊人次进行拟合,并利用2016年7-12月数据计算预测值与实际值的平均预测相对误差来评价预测效果。 结果 ARIMA(0,1,2)(1,1,0)12模型是拟合儿童肺炎门急诊人次的最佳预测模型,平均相对误差为9.82%。 结论 ARIMA 季节乘积模型有较好的拟合和短期预测效果,能为医院合理利用医疗资源提供参考依据。  相似文献   

8.
目的 比较随机生存森林模型、梯度提升模型、极限梯度提升模型与Cox比例风险回归模型对生存数据的区分度性能,为生存分析方法的应用提供参考。方法 基于基准实验框架,选择SEER数据库、TCGA数据库、R软件包共13个数据集,分别构建三种机器学习模型与Cox模型,以嵌套交叉验证获得Harrell’s C-index作为模型区分度性能评价指标,采用秩和检验比较模型间性能。结果 各数据集的C-index主要集中在0.6~0.75之间。单数据集的结果不全相同,各模型C-index差异仅在部分数据集有意义,且没有一致结论;四种方法的性能在所有数据集、高删失率数据集、低删失率数据集等不同组数据集间的C指数差异均无统计学意义。结论 在不同场景下的生存数据分析中,三种机器学习模型区分度性能与传统Cox模型相近。  相似文献   

9.
目的介绍潜在特质模型的原理、方法和技术,探讨潜在特质模型在疾病易感性评价中的应用。方法以出生缺陷数据为实例,采用R 2.5.1软件的Ltm包例证潜在特质模型的构建和分析原理。结果通过对出生缺陷数据进行潜在特质模型拟合,潜在特质得分能够很好地预测评估其发病危险。结论潜在特质模型用于疾病患病风险评价有很好的效果。  相似文献   

10.
目的 了解新农合肺癌患者医疗费用构成及影响因素,为控制医疗费用增长、减轻患者经济负担提供参考依据.方法 用SPSS 25.0统计软件对数据进行统计分析,采用单因素分析和多元逐步回归拟合通径模型对医疗费用的影响因素进行分析.结果 肺癌患者人均医疗费用29 537.13元(中位数为13 946.89元),其中药品类费用占比...  相似文献   

11.
干旱地区伤寒副伤寒与气象因素关系的BP神经网络模型   总被引:9,自引:0,他引:9  
目的应用人工神经网络的原理和方法,探讨在干旱灾害条件下影响伤寒副伤寒流行的关键气象因子,建立旱灾地区传染病疫情的BP神经网络模型,并评价模型的拟合效果.方法利用Matlab 6.5软件对人工神经网络BP模型进行构建、训练及模拟.结果伤寒副伤寒发病率回代平均误差率和R2分别为0.84%和0.9999,自变量对输出的贡献量分析结果显示,平均蒸发量和平均气压对于伤寒副伤寒发病率影响最大.结论伤寒副伤寒与气象因素关系的 BP神经网络模型拟合效果较好,有进一步研究的价值.  相似文献   

12.
目的以全国居民健康素养监测调查问卷(2016年版)为例,用免费开源的R软件,对问卷数据进行不同题型判分、各分量指标得分计算及素养判断、基本情况编码转换等数据整理,并提供完整的R代码。实践证明,使用R软件实现问卷数据整理过程的程序化及其可复制性,对于各级监测样本的数据复核与汇总合并有特别意义,对监测点的数据分析人员也具有参考价值。  相似文献   

13.
  目的   应用自回归求和滑动平均(autoregressive integrated moving average, ARIMA)模型对全球新型冠状病毒肺炎(coronavirus disease 2019, COVID-19)发病人数进行预测, 为各国提出的防控策略与措施提供参考和评价依据。   方法   收集2020年2月22日-3月19日各国(意大利、西班牙、德国、法国等)COVID-19每日累计确诊人数, 用SPSS 17.0和R 3.6.1软件拟合ARIMA模型, 对5日前数据进行回带评价拟合效果, 同时利用该模型预测各国后10日数据。   结果   ARIMA模型预测值和实际值动态趋势基本一致, 实际值在预测值的95% CI内。   结论   ARIMA模型能够较好的对全球COVID-19发病人数进行预测, 在指导疫情防控方面有实际意义。  相似文献   

14.
目的探讨时间序列分析在空气污染健康影响研究领域的应用与软件实现,为我国相关工作提供实用的操作方法参考。方法利用美国芝加哥市1987年至2000年大气污染与死亡数据,分别采用广义线性模型、广义相加模型,并结合分布滞后模型,介绍时间序列分析的基本理论与R软件实现步骤。结果时间序列分析可在R软件中方便实现。结论 R软件为时间序列分析在空气污染流行病学研究中的应用提供了相对成熟的软件包,在实际研究中值得推广。  相似文献   

15.
目的 探讨多水平生存分析中的Cox比例风险模型右在职业性肺癌危险因素量化评价中的应用。方法 以云南锡业总公司劳动防护研究所提供的高危人群队列的随访资料为例,拟合3个水平的截断数据的多重成员Cox模型,并分析各水平的随机效应及其与肺癌发生间的关系。结果 模型结果显示,云锡所属单位中“马拉格锡矿”与其他单位有不同的致癌随机效应,个体因素也与肺癌的发生有关。结论 多水平生存分析对于处理具有系统层次结构的  相似文献   

16.
目的 探讨分式多项式模型在流行病学资料分析尤其是处理连续型自变量时的应用.方法 通过研究癌症病人特征与病情是否减轻之间的关系的示例分析说明模型的实际应用.结果 该模型可以揭示癌症病人特征与病情间复杂非线性关系,且可以得出模型的表达式和常用的联系强度指标比值比的大小.结论 分式多项式模型可以有效地处理连续型自变量对结果变量的影响,并能通过灵活多样的方式对结果进行表达.  相似文献   

17.
目的比较校正生存曲线图在SPSS、Stata和R软件中实现方法的异同,指导临床医师实现校正生存曲线图的绘制与解释。方法利用欧洲血液和骨髓移植学会注册数据,展示SPSS、Stata和R统计软件实现校正生存曲线的操作过程和结果,详细解析不同统计软件采用的校正方法。结果 SPSS、Stata所提供的校正生存曲线绘制方法默认为均值法,R软件提供的逆概率加权法对生存曲线有更好的校正作用。结论不同统计软件在实现生存曲线校正时采用了不同的方法,研究者需要知悉这些方法差异,建议选用R软件中提供的逆概率加权法,可以得到更为合理的校正后生存曲线。  相似文献   

18.
目的探讨联合脆弱模型在含有终止事件的临床复发事件数据分析中的应用及R软件的实现。方法收集肺癌患者复发数据(多次住院),构建联合脆弱模型,拟采用最大惩罚似然估计(MPnLE)进行模型的参数估计,并评估肺癌患者个体内多次复发间的相关性以及复发事件与终止事件(死亡)间的相关性。结果联合脆弱模型分别评估了协变量对疾病复发进程与死亡进程的效应,同时也考虑了多次复发与死亡的相关性,结果解释合理,软件实现方便。结论联合脆弱模型可以充分挖掘含终止事件的肺癌患者复发数据所蕴含的信息,也可用于其他肿瘤患者预后因素的分析,为临床诊断和治疗提供统计学支持。  相似文献   

19.
张连生  杨洁  向安莉 《中国卫生统计》2012,29(1):105-106,109
目的探讨多群组结构方程模型在医学心理学研究中的应用及其在AMOS软件上实现的程序。方法运用AMOS16.0软件,建立留守儿童的分性别类型的心理健康因素结构模型,计算性别类型模型的拟合指数和回归系数。结果多群组结构模型的拟合指数结果显示,各类型模型的拟合优度较好,但是拟合指数和回归系数有所不同。结论多群组结构方程模型应用过程中应该遵循一定的准则和使用条件,从而为研究提供合理的理论依据。  相似文献   

20.
目的探讨乘法季节回归求和移动平均模型(ARIMA)在安徽省手足口病发病预测中应用,为手足口病预防控制提供参考。方法根据2009-2014年安徽省手足口病的周发病数据,运用R 3.0.2软件拟合乘法季节性ARIMA模型,并对2015年1~52周发病数进行预测。结果安徽省手足口病预测中最优模型为ARIMA(1,1,1)(0,1,1)52模型,残差统计量检验差异无统计学意义(Box-Ljung=0.004,P=0.950),提示残差为白噪声,模型拟合值和实际值平均绝对误差率为11.32%,2015年1~52周预测值和实际值平均绝对误差率为25.10%。结论建立的乘法季节性ARIMA模型能较好地拟合安徽省手足口病变动趋势,模型预测效果较好,可用于安徽省手足口病短期预测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号