首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 62 毫秒
1.
目的由于疾病,特别是肿瘤的识别模型,其分型准确度对疾病的治疗和预后具有重要意义,因而,本研究探讨了基于基因表达谱的疾病分型识别模型建模方法。方法结合白血病基因表达谱数据分析,利用偏最小二乘判别分析(PLS-DA)对利用基因微阵列数据予以建立白血病分型模型,并与Golub等提出的建模方法相对照,比较它们的判别效果。结果基于偏最小二乘判别分析的白血病识别模型的拟合准确度和预测准确度均达到100%。结论研究表明,基于偏最小二乘判别分析的模型明显提高了白血病的分型正确率,无论是拟合精度,还是预测精度,均高于Golub等提出的方法。  相似文献   

2.
目的 探究判别分析驱动的微阵列数据之降维策略.方法 3步降维策略.即首先采用"单变量检验FDR控制"结合"相关矩阵差值综合评分法"的预选维;其次采用PCA、PLS等方法作进一步降维;最后用逐步判别的思想筛选.结果 以Alon等的结肠癌数据为例展示了该3步降维策略在判别分析过程中的应用,组内回代错误率为9.68%,弃一法交叉验证的错误率为11.29%.结论 本文提出的"初步选维→进一步降维→逐步判别筛选"的3步降维策略对于后续的微阵列数据判别分析是实用、可行的.  相似文献   

3.
武海滨  张涛  赵发林  李康 《中国卫生统计》2013,30(4):517-520,524
目的探讨基于偏最小二乘线性判别分析的遗传算法特征筛选性能,并将其应用于高维代谢组学数据。方法通过模拟试验验证基于偏最小二乘线性判别分析的遗传算法特征筛选能力,同时应用于卵巢良恶性肿瘤鉴别的代谢组学数据特征筛选分析。结果模拟实验显示,基于偏最小二乘线性判别分析的遗传算法对信息变量的筛选能力明显优于偏最小二乘变量投影重要性指标;代谢组学数据分析显示,使用遗传算法筛选出的变量能够获得更低的误差率,该方法筛得的变量具有更大的概率包含了与某种生物学结果相关的代谢物。结论基于偏最小二乘线性判别分析的遗传算法作为一种优化技术,在小样本条件下对高维数据的特征筛选具有较好的效果。  相似文献   

4.
目的探讨相对最小二乘法在理化检验中的应用。方法举例说明相对最小二乘法计算的直线回归方程回归分析的标准系列的最低浓度理论值与测量值的相对差值总和与最小二乘法的区别。结果相对最小二乘法计算的直线回归方程回归分析的标准系列的最低浓度理论值与测量值的相对差值总和均小于最小二乘法。结论建议在理化分析中用相对最小二乘法替换最小二乘法计算直线回归方程式绘制标准曲线代表标准系列计算被测物质含量。  相似文献   

5.
目的探究差异表达驱动的微阵列数据之降维策略。方法本文提出permutation检验和99.99%的下单侧可信区间相结合的策略用于"维度粗筛",HotellingT2检验结合逐步筛选的策略用于寻求组间差异表达的"局部变量组合"。结果以"正常成年男子和精子运动能力低下者精子蛋白表达差异研究"之实例展示了该降维策略的实际应用效果,结果发现了"十个蛋白组合"在组间差异表达。结论本文提出差异表达驱动的微阵列数据降维策略是实用可行的。  相似文献   

6.
目的 比较两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类分析的效果,比较不同差异基因选取方法对分类结果的影响.方法 利用NCI60等4个肿瘤基因表达数据库,通过4种不同方法选取差异表达基因,在此基础上,用两种基于偏最小二乘的方法行多分类分析.一是偏最小二乘线性判别,首先运用偏最小二乘法行降维,再利用降维得到的成分作为输入变量作线性判别分析;二是偏最小二乘判别分析,利用偏最小二乘回归直接进行分类.分类效果采用留一法和10倍交叉验证法进行评价.结果 偏最小二乘判别分析的分类效果略优于偏最小二乘降维后的线性判别.以变量重要性指标选取差异表达基因时分类效果较好,其次是SAM法.结论 在对肿瘤基因表达数据行多分类分析时,偏最小二乘法既是一种高效的降维方法,也是一种实用的分类方法.  相似文献   

7.
目的探讨高维生物学数据的多阶段组合降维策略。方法以微阵列数据的判别分析为例,采用实际数据和模拟数据相结合的方法,提出"初步选维→进一步降维"的两阶段组合降维策略,并与后续的"判别→验证"相结合,形成了"选维→降维→判别→验证"的判别分析思路。以后续判别分析的预测效果、预测结果的稳定性与敏感性等为指标,对2种单一降维(PCA,PLS)方法和4种组合降维方法(PCA+SIR、PCA+SAVE、PLS+SIR和PLS+SAVE)进行了考察。结果从判别模型的预测效果、预测结果的稳定性及敏感性来看,PLS优于PCA,PLS+SIR/SAVE的组合降维效果更佳。结论用t计分法选维,以"PLS+SIR/SAVE"法进行降维的两阶段组合降维策略,对于微阵列数据判别分析,是实用的、可行的。  相似文献   

8.
折扣最小二乘法及其应用   总被引:1,自引:0,他引:1  
统计预测的方法很多,各种预测方法都有一定的局限性,预测结果的正确与否,一方面取决于数据的准确性,另一方面也取决于预测方法及数学模型的确定。本文通过用折扣最小二乘法预测出院病人日均费用来说明这一方法的应用。计算步骤与方法所谓折扣最小二乘法,即在预测中,根据“近大远小”的预测原则,将普通最小二乘法加以改进的一种方法。用折扣最小二乘法的准则为:拟合误差的平方和S=∑m-1t=0αrte2t=min(1)其中e2t为t时刻的拟合误差的平方,即:e2t=(yt-^yt)2;α为折扣系数,0<α<1;rt为折扣指数。若时间数列有t期资料,则令…  相似文献   

9.
目的研究用于处理解释变量与反应变量之间非线性关系或复杂关系的一种基于核函数的回归方法:核偏最小二乘回归。方法运用Monte-Carlo模拟方法,对核偏最小二乘回归的模型拟合效果和预测效果予以分析。结果模拟试验结果表明:核偏最小二乘回归估计性能均较高。结论核偏最小二乘回归是基于核函数的非线性回归方法,模型构建基于样本,而非解释变量空间,该方法特别适合于处理医学研究中各种类型资料,能够有效地处理解释变量与反应变量之间的非线性关系或复杂关系等方面。  相似文献   

10.
偏最小二乘回归的原理及应用   总被引:8,自引:0,他引:8  
[目的]探讨偏最小二乘回归的理论及其应用。[方法]应用医学实例计算,对偏最小二乘回归与主成分回归及一般最小二乘回归进行比较。[结果]偏最小二乘回归对数据的拟合度优于主成分回归和一般最小二乘回归法。[结论]偏最小二乘回归适用于处理有多重共线性的资料,当解释变量个数多、样本量少时尤为有效,是稳健的数据“软”建模的统计方法。  相似文献   

11.
偏最小二乘回归的离群点检测方法   总被引:2,自引:2,他引:2  
目的本文研究了偏最小二乘回归中四种重要且常用的离群点检测图示方法:偏F检验、残差图与正态分位数图、主成份图(T/T图)与T2椭圆、样本点贡献图.方法通过实例分析了各种方法的优点和不足.结果离群点的检测与分离将有助于模型拟合精度和预测精度的提高.结论研究表明必须综合运用这些方法,并结合原始数据,才能取得比较好的检测效果.  相似文献   

12.
目的 应用偏最小二乘法,并结合Fisher精确检验实现原发性肝癌细胞遗传学异常区域的识别.方法 利用Chen等发布在SMD上的原发性肝癌基因表达数据库,运用偏最小二乘法中的变量投影重要性(Variable mportance in the Project,VIP)指标筛选肝癌异常表达基因,根据基因在染色体上的定位,计算每条染色体上的上调、下调基因以及正常表达基因,运用Fisher精确检验识别有统计学意义的细胞遗传学异常区域.结果 得到基因表达增强区域7个(1q,5q,6p,8q,12q,17q,20q),表达下调区域为8个(4q,8p,9p,12p,13q,16q,17p,21q),15个异常区域已全部由实验方法证实.结论 与传统的实验方法和一些预测算法相比,偏最小二乘法结合Fisher精确检验能够有效、快速地识别染色体基因异常表达区域,灵敏度有了较大提高.  相似文献   

13.
微阵列数据的多重比较   总被引:3,自引:2,他引:1  
目的 介绍阳性结果错误率(FDR)及相关控制方法在微阵列数据多重比较中的应用。方法 用BH、BL、BY和ALSU四种FDR控制程序比较了3226个基因在两组乳腺癌患者中的表达差异。结果 四个程序在各自实用的范围内均将FDR控制在0.05以下,检验效能由大到小的顺序为:ALSU〉BH〉BY〉BL。ALSU程序因引入m0的估计,更为合理。不仅提高了检验效能,同时又较好地控制了假阳性错误。结论 在微阵列数据的比较中必须考虑FDR的控制,同时又要考虑提高检验效能。多重比较中,控制FDR比控制总Ⅰ型错误率(FWER)检验效能高,且更为实用。  相似文献   

14.
In this paper, we analyze optimal risk adjustment for direct risk selection (DRS). Integrating insurers' activities for risk selection into a discrete choice model of individuals' health insurance choice shows that DRS has the structure of a contest. For the contest success function (csf) used in most of the contest literature (the Tullock‐csf), optimal transfers for a risk adjustment scheme have to be determined by means of a restricted quantile regression, irrespective of whether insurers are primarily engaged in positive DRS (attracting low risks) or negative DRS (repelling high risks). This is at odds with the common practice of determining transfers by means of a least squares regression. However, this common practice can be rationalized for a new csf, but only if positive and negative DRSs are equally important; if they are not, optimal transfers have to be calculated by means of a restricted asymmetric least squares regression. Using data from German and Swiss health insurers, we find considerable differences between the three types of regressions. Optimal transfers therefore critically depend on which csf represents insurers' incentives for DRS and, if it is not the Tullock‐csf, whether insurers are primarily engaged in positive or negative DRS. Copyright © 2016 John Wiley & Sons, Ltd.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号