共查询到18条相似文献,搜索用时 140 毫秒
1.
本文目的是介绍第三种提高回归模型拟合优度的策略,即校正均值变换与其他变量变换。具体方法包括以下几个方面:①对多值名义自变量采取"校正均值变换";②对定量自变量引入派生变量,包括"对数变换""平方根变换""指数变换""平方变换""立方变换"和"交叉乘积变换"的结果;③对定量因变量分别采取"对数变换""平方根变换""指数变换""倒数变换"和"Logistic变换";④构建回归模型时,在假定"包含截距项"与"不含截距项"的条件下,分别采取"前进法""后退法"和"逐步法"筛选自变量。得到了如下结论:①对定量因变量和自变量不做变量变换时,回归模型的拟合优度非常低;②根据资料所具备的条件,对定量因变量采取不同的变量变换方法,其回归模型的拟合优度是不同的;③对多值名义自变量进行"校正均值变换"是合理的,且有助于提高回归模型拟合优度;④对定量自变量引入派生变量是非常有价值的;⑤假定回归模型中不含截距项有助于提高回归模型的拟合优度。 相似文献
2.
本文目的是介绍第二种提高回归模型拟合优度的策略,即算术均值变换与其他变量变换。具体方法包括以下几个方面:①对多值名义自变量采取"算术均值变换";②对定量自变量引入派生变量,包括"对数变换""平方根变换""指数变换""平方变换""立方变换"和"交叉乘积变换"的结果;③对定量因变量分别采取"对数变换""平方根变换""指数变换""倒数变换"和"Logistic变换";④构建回归模型时,在假定"包含截距项"与"不含截距项"的条件下,分别采取"前进法""后退法"和"逐步法"筛选自变量。得到了如下结论:①对定量因变量和自变量不做变量变换时,回归模型的拟合优度非常差;②根据资料所具备的条件,对定量因变量采取不同的变量变换方法,其回归模型的拟合优度是不同的;③对多值名义自变量进行"算术均值变换"是合理的,且有助于提高回归模型拟合优度;④对定量自变量引入派生变量是非常有价值的;⑤假定回归模型中不含截距项有助于提高回归模型的拟合优度。 相似文献
3.
本文目的是介绍第一种提高回归模型拟合优度的策略,即哑变量变换与其他变量变换。具体方法包括以下几个方面:①对多值名义自变量采取"哑变量变换";②对定量和有序自变量引入派生变量,包括"对数变换""平方根变换""指数变换""平方变换""立方变换"和"交叉乘积变换"的结果;③对定量因变量分别采取"对数变换""平方根变换""指数变换""倒数变换"和"Logistic变换";④构建回归模型时,在假定"包含截距项"与"不含截距项"的条件下,分别采取"前进法""后退法"和"逐步法"筛选自变量。得到了如下几个结论:①对定量因变量和自变量不做变量变换时,回归模型的拟合优度非常差;②根据资料所具备的条件,对定量因变量采取不同的变量变换方法,其回归模型的拟合优度是不尽相同的;③对多值名义自变量进行"哑变量变换"是常规的做法,但存在不足之处;④对定量自变量引入派生变量是非常有价值的;⑤假定回归模型中不含截距项有助于提高回归模型的拟合优度。 相似文献
4.
本文的目的是介绍m∶n配对设计二值资料一水平多重Logistic回归分析方法。首先,介绍了需要了解的基本概念;其次,介绍了构建此类回归模型的基本原理;最后,通过一个实例介绍了使用SAS实现计算的全过程。在此过程中,获得了如下四点启示:其一,有必要确保所获得的科研资料是值得分析的;其二,有必要基于定量自变量产生派生变量;其三,有必要同时采用"逐步法""前进法"和"后退法"筛选自变量;其四,有必要采用多种方法评价不同回归模型对资料的拟合优度。 相似文献
5.
本文目的是介绍第四种提高回归模型拟合优度的策略,即优化计分变换与其他变量变换。具体方法包括以下几个方面:①第一,对多值名义自变量采取"优化计分变换";②对有序自变量分别采取"单调变换"与"优化计分变换";③对定量自变量分别采取"样条变换"和"单调样条变换";④对定量因变量分别采取"样条变换""单调样条变换"和"BOX-COX变换"。全部变量变换方法组合起来共12种,共创建了12个多重非线性回归模型。依据"拟合优度评价指标"的取值,从12个回归模型中挑选出一个,即本文中的"模型1",其"均方误差平方根=0.30935、R~2=0.9586、调整R~2=0.9527"。结合本期科研方法专题同类文章的结果和结论,得出提高回归模型拟合优度的策略主要在于以下四点:①应对"定量因变量""定量自变量"和"多值有序自变量"采取合适的变量变换方法;②在拟合回归模型的过程中,应尽可能多地引入派生变量;③应假定回归模型中不含截距项;④在构建回归模型的过程中,应尽可能多地使用筛选自变量的策略,如"前进法""后退法"和"逐步法"。 相似文献
6.
本文目的是分析一个已知真实情况的资料,比较适应性回归分析与非适应性回归分析建模的效果。结论如下:当资料中存在与因变量确有关系的自变量时,ADAPTIVEREG过程具有较好的甄别能力;REG过程具有较好的甄别能力,但需要满足一定条件,即采用"前进法"或"逐步法"筛选自变量,同时还需要"假定模型包含截距项"。当资料中不存在与因变量确有关系的自变量时,ADAPTIVEREG过程几乎完全失去了甄别能力;REG过程具有较好的甄别能力,但需要满足一定条件,即采用"前进法"筛选自变量,同时还需要"假定模型包含截距项"。若研究者基于"基本常识"和"专业知识"确定的自变量都与因变量有关系,对因变量进行Logistic变换,并且,假定回归模型中不含截距项时,会在回归模型中保留非常多的自变量。 相似文献
7.
本文目的是介绍主成分回归分析的概念、作用以及用软件实现计算的方法。先对自变量进行主成分分析,然后将主成分变量视为新的自变量,再进行多重线性回归分析。通过不引入和引入派生变量以及采取不同的策略筛选自变量,可以获得多个合格的多重线性回归模型。在回归模型自由度接近相等时,基于残差方差最小、复相关系数最大为评价指标,从众多回归模型中优中选优。得出的经验为:应慎用主成分回归分析。 相似文献
8.
本文目的是介绍基于经典统计思想实现多重线性回归分析的方法。首先,概述基于经典统计思想、贝叶斯统计思想和机器学习统计思想建立多重线性回归模型的基本思路;然后以实际问题为例,全面呈现了多重线性回归分析所需要完成的主要任务;最后,总结多重线性回归分析的适用场合及注意事项。结果表明:产生派生变量、进行自变量筛选和共线性诊断、进行异常点诊断等内容是进行多重线性回归分析的主要任务。在多因素试验或观察性研究中,只要结果变量为计量变量,比较常用且有效的做法是进行多重线性回归分析,应尽可能少用单因素差异性分析。 相似文献
9.
10.
11.
The logistic regression analysis of psychiatric data 总被引:6,自引:0,他引:6
Logistic regression is presented as the statistical method of choice for analyzing the effects of independent variables on a binary dependent variable in terms of the probability of being in one of its two categories vs the other. The method, which must be applied by computer, is illustrated on data from the DSM-III field trials. The dependent variable is treatment with behaviourally-oriented psychotherapy vs treatment with psychoanalytically-oriented psychotherapy, and the independent variables are several patient and clinician characteristics. Like ordinary multiple regression, the method is shown capable of analyzing categorical as well as continuous independent variables. Unlike ordinary multiple regression when applied to binary data, logistic regression analysis necessarily yields estimated probabilities that lie between 0 and 1. The measure of association derived from logistic regression analysis, the odds ratio, is defined. Methods for making inferences about it are presented and illustrated. 相似文献
12.
13.
本文目的是通过分析一个带有8个噪声变量的数据集,揭示适应性回归模型的实际应用价值。在数据集包含两个自变量与因变量有密切数量联系的前提条件下,适应性回归模型受噪声变量的影响接近于零;在数据集包含一个自变量与因变量有密切数量联系的前提条件下,适应性回归模型受噪声变量的影响较大,其分析结果出现了一定程度的"失真";在数据集包含零个自变量与因变量有密切数量联系的前提条件下,适应性回归模型受噪声变量的影响非常大,其分析结果是完全不可信的。得出的结论是:适应性回归分析模型不是万能的,其结果的可信度取决于数据集中是否真正包含"客观存在的规律性"。 相似文献
14.
15.
本文目的是介绍复杂抽样调查设计二值资料多重logistic回归分析方法。通过一个实例,利用八种不同的分析策略(不考虑抽样设计和抽样权重、考虑抽样设计不考虑抽样权重、不考虑抽样设计考虑抽样权重、同时考虑抽样设计和抽样权重以及分别不考虑与考虑派生变量)对数据进行建模。对所得结果进行比较得出如下结论:在对复杂抽样设计资料进行统计分析的过程中,同时考虑抽样设计和抽样权重可以得到符合数据内部变量间依赖关系真实情况的结论。此外,本研究还介绍了采用SAS软件中SURVEYLOGISTIC过程对复杂抽样调查数据进行多重Llogistic回归分析的详细步骤。 相似文献
16.
Regression analyses are perhaps the most widely used statistical tools in medical research. Centring in regression analyses seldom appears to be covered in training and is not commonly reported in research papers. Centring is the process of selecting a reference value for each predictor and coding the data based on that reference value so that each regression coefficient that is estimated and tested is relevant to the research question. Using non-centred data in regression analysis, which refers to the common practice of entering predictors in their original score format, often leads to inconsistent and misleading results. There is very little cost to unnecessary centring, but the costs of not centring when it is necessary can be major. Thus, it would be better always to centre in regression analyses. We propose a simple default centring strategy: (1) code all binary independent variables +1/2; (2) code all ordinal independent variables as deviations from their median; (3) code all 'dummy variables' for categorical independent variables having m possible responses as 1 - 1/m and -1/m instead of 1 and 0; (4) compute interaction terms from centred predictors. Using this default strategy when there is no compelling evidence to centre protects against most errors in statistical inference and its routine use sensitizes users to centring issues. 相似文献
17.
Although many nosologists advocate the autonomy of borderline personality disorder (BPD), its heterogeneity led to demands that it be absorbed into the affective disorder spectrum. This study attempted to determine if (a) BPD and affective disorders overlapped and (b) if BPD characteristics were differentially associated with specific Axis I, DSM-III diagnoses. Forty-three BPD inpatients were rated retrospectively on 29 variables, including BPD characteristics from Gunderson's diagnostic interview for borderlines (DIB). chi 2 analyses were performed for each of 28 variables in 56 contingency tables whose independent variables were dysthymia/other Axis I diagnoses or depression/no depression. BPD inpatients with dysthymia had more impaired occupational functioning and greater use of splitting. Also, depressed BPDs were in general more dependent, empty and bored, and suicidal. 相似文献
18.