首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
本文目的是介绍第三种提高回归模型拟合优度的策略,即校正均值变换与其他变量变换。具体方法包括以下几个方面:①对多值名义自变量采取"校正均值变换";②对定量自变量引入派生变量,包括"对数变换""平方根变换""指数变换""平方变换""立方变换"和"交叉乘积变换"的结果;③对定量因变量分别采取"对数变换""平方根变换""指数变换""倒数变换"和"Logistic变换";④构建回归模型时,在假定"包含截距项"与"不含截距项"的条件下,分别采取"前进法""后退法"和"逐步法"筛选自变量。得到了如下结论:①对定量因变量和自变量不做变量变换时,回归模型的拟合优度非常低;②根据资料所具备的条件,对定量因变量采取不同的变量变换方法,其回归模型的拟合优度是不同的;③对多值名义自变量进行"校正均值变换"是合理的,且有助于提高回归模型拟合优度;④对定量自变量引入派生变量是非常有价值的;⑤假定回归模型中不含截距项有助于提高回归模型的拟合优度。  相似文献   

2.
本文目的是介绍第二种提高回归模型拟合优度的策略,即算术均值变换与其他变量变换。具体方法包括以下几个方面:①对多值名义自变量采取"算术均值变换";②对定量自变量引入派生变量,包括"对数变换""平方根变换""指数变换""平方变换""立方变换"和"交叉乘积变换"的结果;③对定量因变量分别采取"对数变换""平方根变换""指数变换""倒数变换"和"Logistic变换";④构建回归模型时,在假定"包含截距项"与"不含截距项"的条件下,分别采取"前进法""后退法"和"逐步法"筛选自变量。得到了如下结论:①对定量因变量和自变量不做变量变换时,回归模型的拟合优度非常差;②根据资料所具备的条件,对定量因变量采取不同的变量变换方法,其回归模型的拟合优度是不同的;③对多值名义自变量进行"算术均值变换"是合理的,且有助于提高回归模型拟合优度;④对定量自变量引入派生变量是非常有价值的;⑤假定回归模型中不含截距项有助于提高回归模型的拟合优度。  相似文献   

3.
本文目的是介绍第一种提高回归模型拟合优度的策略,即哑变量变换与其他变量变换。具体方法包括以下几个方面:①对多值名义自变量采取"哑变量变换";②对定量和有序自变量引入派生变量,包括"对数变换""平方根变换""指数变换""平方变换""立方变换"和"交叉乘积变换"的结果;③对定量因变量分别采取"对数变换""平方根变换""指数变换""倒数变换"和"Logistic变换";④构建回归模型时,在假定"包含截距项"与"不含截距项"的条件下,分别采取"前进法""后退法"和"逐步法"筛选自变量。得到了如下几个结论:①对定量因变量和自变量不做变量变换时,回归模型的拟合优度非常差;②根据资料所具备的条件,对定量因变量采取不同的变量变换方法,其回归模型的拟合优度是不尽相同的;③对多值名义自变量进行"哑变量变换"是常规的做法,但存在不足之处;④对定量自变量引入派生变量是非常有价值的;⑤假定回归模型中不含截距项有助于提高回归模型的拟合优度。  相似文献   

4.
本文的目的是介绍m∶n配对设计二值资料一水平多重Logistic回归分析方法。首先,介绍了需要了解的基本概念;其次,介绍了构建此类回归模型的基本原理;最后,通过一个实例介绍了使用SAS实现计算的全过程。在此过程中,获得了如下四点启示:其一,有必要确保所获得的科研资料是值得分析的;其二,有必要基于定量自变量产生派生变量;其三,有必要同时采用"逐步法""前进法"和"后退法"筛选自变量;其四,有必要采用多种方法评价不同回归模型对资料的拟合优度。  相似文献   

5.
本文目的是介绍第四种提高回归模型拟合优度的策略,即优化计分变换与其他变量变换。具体方法包括以下几个方面:①第一,对多值名义自变量采取"优化计分变换";②对有序自变量分别采取"单调变换"与"优化计分变换";③对定量自变量分别采取"样条变换"和"单调样条变换";④对定量因变量分别采取"样条变换""单调样条变换"和"BOX-COX变换"。全部变量变换方法组合起来共12种,共创建了12个多重非线性回归模型。依据"拟合优度评价指标"的取值,从12个回归模型中挑选出一个,即本文中的"模型1",其"均方误差平方根=0.30935、R~2=0.9586、调整R~2=0.9527"。结合本期科研方法专题同类文章的结果和结论,得出提高回归模型拟合优度的策略主要在于以下四点:①应对"定量因变量""定量自变量"和"多值有序自变量"采取合适的变量变换方法;②在拟合回归模型的过程中,应尽可能多地引入派生变量;③应假定回归模型中不含截距项;④在构建回归模型的过程中,应尽可能多地使用筛选自变量的策略,如"前进法""后退法"和"逐步法"。  相似文献   

6.
本文目的是分析一个已知真实情况的资料,比较适应性回归分析与非适应性回归分析建模的效果。结论如下:当资料中存在与因变量确有关系的自变量时,ADAPTIVEREG过程具有较好的甄别能力;REG过程具有较好的甄别能力,但需要满足一定条件,即采用"前进法"或"逐步法"筛选自变量,同时还需要"假定模型包含截距项"。当资料中不存在与因变量确有关系的自变量时,ADAPTIVEREG过程几乎完全失去了甄别能力;REG过程具有较好的甄别能力,但需要满足一定条件,即采用"前进法"筛选自变量,同时还需要"假定模型包含截距项"。若研究者基于"基本常识"和"专业知识"确定的自变量都与因变量有关系,对因变量进行Logistic变换,并且,假定回归模型中不含截距项时,会在回归模型中保留非常多的自变量。  相似文献   

7.
本文目的是介绍主成分回归分析的概念、作用以及用软件实现计算的方法。先对自变量进行主成分分析,然后将主成分变量视为新的自变量,再进行多重线性回归分析。通过不引入和引入派生变量以及采取不同的策略筛选自变量,可以获得多个合格的多重线性回归模型。在回归模型自由度接近相等时,基于残差方差最小、复相关系数最大为评价指标,从众多回归模型中优中选优。得出的经验为:应慎用主成分回归分析。  相似文献   

8.
本文目的是介绍基于经典统计思想实现多重线性回归分析的方法。首先,概述基于经典统计思想、贝叶斯统计思想和机器学习统计思想建立多重线性回归模型的基本思路;然后以实际问题为例,全面呈现了多重线性回归分析所需要完成的主要任务;最后,总结多重线性回归分析的适用场合及注意事项。结果表明:产生派生变量、进行自变量筛选和共线性诊断、进行异常点诊断等内容是进行多重线性回归分析的主要任务。在多因素试验或观察性研究中,只要结果变量为计量变量,比较常用且有效的做法是进行多重线性回归分析,应尽可能少用单因素差异性分析。  相似文献   

9.
本文目的是介绍非配对设计二值资料多水平多重logistic回归模型的构建与求解方法。首先介绍模型的有关概念及模型的构建原理,基于实例使用SAS软件对列联表资料进行分析,以proc glimmix和proc nlmixed过程构建和求解模型,并对相关结果进行解释和比较。  相似文献   

10.
本文目的是系统全面地总结和归纳经典统计中的回归模型及其合理选用的要领。具体方法是先按因变量的性质分为定量因变量与定性因变量两大类,再分别按自变量所具备的不同前提条件,并基于经典统计思想构建相应的回归模型。初步结果为:在定量因变量的场合下,经典回归模型大致有16种不同情形;而在定性因变量的场合下,经典回归模型大致有6种不同情形。总之,在构建经典回归模型时,应当依据因变量的性质和自变量所具备的前提条件,选择最合适的回归模型,才能达到比较理想的统计分析目的。  相似文献   

11.
The logistic regression analysis of psychiatric data   总被引:6,自引:0,他引:6  
Logistic regression is presented as the statistical method of choice for analyzing the effects of independent variables on a binary dependent variable in terms of the probability of being in one of its two categories vs the other. The method, which must be applied by computer, is illustrated on data from the DSM-III field trials. The dependent variable is treatment with behaviourally-oriented psychotherapy vs treatment with psychoanalytically-oriented psychotherapy, and the independent variables are several patient and clinician characteristics. Like ordinary multiple regression, the method is shown capable of analyzing categorical as well as continuous independent variables. Unlike ordinary multiple regression when applied to binary data, logistic regression analysis necessarily yields estimated probabilities that lie between 0 and 1. The measure of association derived from logistic regression analysis, the odds ratio, is defined. Methods for making inferences about it are presented and illustrated.  相似文献   

12.
本文目的是介绍多值有序资料多水平多重logistic回归分析方法。此法是在层次结构数据的基础上,构建多值有序因变量随一组自变量变化而变化的回归模型。具体的做法如下:①先介绍有关的基本概念;②呈现待分析的数据结构;③扼要介绍回归模型的构建与求解;④详细介绍如何使用SAS的GLIMMIX和NLMIXED两个过程来拟合此回归模型,并对相关结果进行解释和比较;⑤讨论多水平结构数据下拟合累积logistic回归模型时需注意的问题。  相似文献   

13.
罗艳虹  胡良平 《四川精神卫生》2019,32(2):101-104,109
本文目的是通过分析一个带有8个噪声变量的数据集,揭示适应性回归模型的实际应用价值。在数据集包含两个自变量与因变量有密切数量联系的前提条件下,适应性回归模型受噪声变量的影响接近于零;在数据集包含一个自变量与因变量有密切数量联系的前提条件下,适应性回归模型受噪声变量的影响较大,其分析结果出现了一定程度的"失真";在数据集包含零个自变量与因变量有密切数量联系的前提条件下,适应性回归模型受噪声变量的影响非常大,其分析结果是完全不可信的。得出的结论是:适应性回归分析模型不是万能的,其结果的可信度取决于数据集中是否真正包含"客观存在的规律性"。  相似文献   

14.
本文目的是介绍非配对设计多值有序资料一水平多重logistic回归模型的构建与求解方法。本文详细介绍了构建累积logistic回归模型的原理和具体方法,并结合实例介绍如何使用SAS软件中的LOGISTIC过程来拟合此回归模型,并对逐步回归法的输出结果进行了解释;其次讨论了有关构建累积logistic回归模型的过程中自变量筛选、模型评价以及拟合模型时需注意的问题。  相似文献   

15.
本文目的是介绍复杂抽样调查设计二值资料多重logistic回归分析方法。通过一个实例,利用八种不同的分析策略(不考虑抽样设计和抽样权重、考虑抽样设计不考虑抽样权重、不考虑抽样设计考虑抽样权重、同时考虑抽样设计和抽样权重以及分别不考虑与考虑派生变量)对数据进行建模。对所得结果进行比较得出如下结论:在对复杂抽样设计资料进行统计分析的过程中,同时考虑抽样设计和抽样权重可以得到符合数据内部变量间依赖关系真实情况的结论。此外,本研究还介绍了采用SAS软件中SURVEYLOGISTIC过程对复杂抽样调查数据进行多重Llogistic回归分析的详细步骤。  相似文献   

16.
Regression analyses are perhaps the most widely used statistical tools in medical research. Centring in regression analyses seldom appears to be covered in training and is not commonly reported in research papers. Centring is the process of selecting a reference value for each predictor and coding the data based on that reference value so that each regression coefficient that is estimated and tested is relevant to the research question. Using non-centred data in regression analysis, which refers to the common practice of entering predictors in their original score format, often leads to inconsistent and misleading results. There is very little cost to unnecessary centring, but the costs of not centring when it is necessary can be major. Thus, it would be better always to centre in regression analyses. We propose a simple default centring strategy: (1) code all binary independent variables +1/2; (2) code all ordinal independent variables as deviations from their median; (3) code all 'dummy variables' for categorical independent variables having m possible responses as 1 - 1/m and -1/m instead of 1 and 0; (4) compute interaction terms from centred predictors. Using this default strategy when there is no compelling evidence to centre protects against most errors in statistical inference and its routine use sensitizes users to centring issues.  相似文献   

17.
Although many nosologists advocate the autonomy of borderline personality disorder (BPD), its heterogeneity led to demands that it be absorbed into the affective disorder spectrum. This study attempted to determine if (a) BPD and affective disorders overlapped and (b) if BPD characteristics were differentially associated with specific Axis I, DSM-III diagnoses. Forty-three BPD inpatients were rated retrospectively on 29 variables, including BPD characteristics from Gunderson's diagnostic interview for borderlines (DIB). chi 2 analyses were performed for each of 28 variables in 56 contingency tables whose independent variables were dysthymia/other Axis I diagnoses or depression/no depression. BPD inpatients with dysthymia had more impaired occupational functioning and greater use of splitting. Also, depressed BPDs were in general more dependent, empty and bored, and suicidal.  相似文献   

18.
本文目的是介绍非配对设计多值名义资料一水平多重logistic回归分析的基本原理、建模策略及注意事项。结合实例,应用SAS 9.4构建未经变量筛选和经变量筛选的多值名义资料多重logistic回归模型。通过回归分析的计算结果可知,同一变量的回归系数在不同logit函数中存在代数关系。多值名义多重logistic回归分析可以用来处理结果变量为多值名义变量的回归建模问题,并可以结合SAS实现对自变量的筛选,以获得简洁的回归模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号