首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
目的探讨随机森林模型和决策树模型在肝硬化并发上消化道出血患者预后评估中的应用。方法利用logistic回归方法从肝硬化住院患者病历资料中筛选出与并发上消化道出血有关联的变量;以筛选出的变量作为输入变量,以是否出血作为结局变量,分别建立随机森林、决策树和传统logistic回归模型,通过受试者工作特征曲线(ROC)来评价三种模型的性能。结果 logistic回归、决策树和随机森林模型在测试集中的准确率分别为81.5%、75.1%和88.9%,三种模型的ROC曲线下面积(AUC)分别为0.854、0.720和0.909;在随机森林模型的变量重要性评分中,血糖、胆固醇、血清钾、总蛋白、碱性磷酸酶、尿素氮等指标得分较高,提示这些指标或有临床意义。结论随机森林模型在肝硬化上消化道出血患者的预后评估中具有较高的应用价值。  相似文献   

2.
目的 分析影响上海市嘉定区农村居民就诊单位选择的因素,并探讨logistic回归分析和决策树(CHAID法)相结合的方法的应用。方法 采用多分类无序反应变量的logistic回归分析和决策树(CHAID法)相结合的方法,用似然比检验比较模型之间的优劣,确定最佳模型。结果 影响嘉定区农村居民选择就诊单位的主要因素是保健制度、年龄、恩格尔系数、性别、看病距离、职业以及保健制度和文化程度的交互作用。结论 决策树提供解释变量类别的重新划分和因素之间的相互作用的信息,logistic模型提供因素的主效应作用以及对交互作用是否存在的检验信息,两者结合,可以更加全面地挖掘出对目标变量有影响的因素及因素之间的交互作用。  相似文献   

3.
目的 探讨应用关联规则(association rules)挖掘技术筛选对疾病表型相关的基因SNP位点的分析方法.方法 应用关联规则挖掘技术,从中国肺癌病例对照研究的核苷酸切除修复通路(nucleotide exicision repair,NER)基因SNP位点筛选与肺癌有关联的SNP位点及其组合,作为logistic回归模型的待选解释变量作进一步确认性研究.结果 发现与肺癌易感性可能相关的基因变异位点,并且发现位点ERCC1-rs3212951和ERCC1-rs3212955之间可能存在交互作用.结论 关联规则挖掘技术可以作为疾病相关的SNP位点及交互作用的初筛手段,有效地找到肺癌等复杂性状疾病相关的基因多态位点和交互作用项.  相似文献   

4.
目的 探讨内皮型一氧化氮合酶(eNOS)基因第7外显子G894T变异与超重在高血压患病中的意义。方法 在人群中筛检出未经药物系统治疗的116例高血压患者及136名血压正常者为研究对象;运用PCR-限制性片段长度多态性检测G894T变异;用相加模型分析G894T变异与超重之间的交互作用;用人群归因危险度百分比(PAR%)反映人群中的病因分值。结果 G894T变异与超重对高血压患病具有正交互作用;归因交互效应为1.99;归因交互效应百分比为30.76%;纯因子间归因交互效应百分比为36.38%。用多元logistic回归分析调整年龄、性别、吸烟指数及饮酒指数后,G894T变异与超重对高血压患病仍具有正交互作用。调整上述混杂因素后,归因交互效应为2.85;归因交互效应百分比为39.97%;纯因子间归因交互效应百分比为46.49%。在给定条件下计算的PAR%约为15%。结论 eNOS基因第7外显子G894T变异与超重之间的交互作用在该研究人群高血压患病中具有重要意义;在仅仅对具有G894T。变异与超重同时存在的部分人群中控制超重可明显降低一般人群高血压的患病率。  相似文献   

5.
目的比较潜在类别模型和主成分法在稀有变异遗传关联研究中的统计性能。方法利用GAW17数据库,通过集合策略将同一基因中的稀有变异合并成一个新变量,以基因为分析单位,分别运用潜在类别模型和主成分法构建常见变异和集合后稀有变异的分类潜变量或主成分,再应用线性回归模型分析基因对定量性状的整体效应,评价两种方法的I类错误和效能。结果潜在类别模型的I类错误(0.040~0.085)均不高于主成分法(0.040~0.190)。对强效应的稀有变异和常见变异,即使存在多个无关联稀有变异,潜在类别模型也能很好地分类且效能(1.000)不低于主成分法(0.990~1.000);但稀有或常见变异效应弱时主成分法效能(0.635)高于潜在类别模型(0.200)。对多数非关联基因,潜在类别模型不收敛。结论和主成分法类似,潜在类别模型也可和稀有变异的集合策略结合,通过构建遗传变异数据的分类潜变量,进行稀有变异的遗传关联研究。分析定量性状时两法均可识别较强效应的稀有变异和常见变异。人群中遗传变异分布无异质性时,潜在类别模型常不收敛,提示遗传变异和性状无关联。  相似文献   

6.
目的探究高血压家族史与受教育程度交互作用对高血压患病的影响。方法采用多阶段整群随机抽样方法,于2016年对昆山市18~69岁常住居民进行问卷调查与体格检查。样本数据通过复杂加权后估计高血压患病率。采用非线性混合模型估计交互作用指数(Synergy Index,S)、交互作用相对超额危险度(Relative Excess Risk of Interaction,RERI)及归因交互效应百分比(The Attributable Proportion Due to Interaction,AP)来评价相加交互作用。结果有效调查8 529人,加权后高血压患病率为16.28%(95%CI:15.18%~17.37%),其中男性为19.47%(95%CI:17.72%~21.22%),女性为13.59%(95%CI:12.21%~14.97%)。不仅有高血压家族史(OR=1.12,95%CI:1.11~1.14)和低教育程度(OR=1.09,95%CI:1.07~1.12)与高血压患病存在统计学关联;且两者相乘交互效应的参数估计值有统计学意义(P=0.0002)。未发现低教育程度和有高血压家族史相加交互作用与高血压患病有统计学关联(RERI=-0.636,95%CI:-1.236~-0.037;AP=-0.333,95%CI:-0.712~0.046;S=0.589,95%CI:0.331~1.048)。结论昆山市常住居民中高血压较为流行,有高血压家族史和低教育程度与高血压患病存在关联,未发现两者相加交互作用与高血压患病有统计学关联。  相似文献   

7.
目的研究潜在类别因子模型(latent class factor model,LCFM)在基于通路的稀有变异遗传关联研究中的应用,并和潜在类别模型(latent class model,LCM)进行比较。方法选取遗传分析工作组17(genetic analysis workshop 17,GAW17)中的VEGF通路变异数据及其200次模拟表型数据进行分析。将通路下基因中的稀有变异集合为一个新变量,和常见变异一起拟合LCM和LCFM,再调整年龄、性别和吸烟状态后分别拟合潜在类别及潜在类别因子对模拟表型Q1或Q4的线性回归模型(200次),并分别计算两种方法的统计效能和I类错误。结果 LCM将通路作为整体,统计效能为1.000,I类错误为0.030。LCFM将通路中的8个基因构造成三个因子,因子1和因子2含强效应基因,因子3含弱效应基因,其统计效能分别为0.980,1.000,0.595;I类错误分别为0.045,0.040,0.070。结论 LCFM比LCM更适宜分析通路数据。LCFM不仅能对通路中多基因信息降维,且能够根据后验概率从多个维度对人群分类,而且能估计因子载荷以反映基因间的关联强弱,为进一步的生物学机制研究提供线索。  相似文献   

8.
目的针对维吾尔族人群体检数据,探索与分析代谢综合征可能的影响因素以及因素间的交互作用,以挖掘体检信息,为疾病预防提供参考。方法采用关联规则方法,筛选出代谢综合征相关因素的强关联条,作为logistic回归模型的待选解释变量,构建模型分析影响因素以及因素间的交互作用。结果男性与女性代谢综合征患病率分别为10.98%和4.78%。当最小支持度为1.2%,最小置信度为80%时,按性别分别筛选出15条强关联规则。女性代谢综合征的相关因素有统计学意义(P0.05)的分别为年龄、胰腺及甲状腺影像学检测、尿蛋白、亚硝酸盐与甲状腺检测的交互效应、窦性心律与尿蛋白交互效应等;男性代谢综合征的相关因素有统计学意义(P0.05)的分别为年龄、尿蛋白、血尿素氮/肌酐、脂肪肝、心血管疾病家族史、家族史与血沉K值交互效应等。结论关联规则挖掘技术与logistic回归模型相结合,获得因素与疾病的关联强度,为疾病的早期发现、诊断及预防提供有益线索。  相似文献   

9.
目的探讨AGT基因第二外显子编码M235T变异与腰臀比异常及其交互作用对原发性高血压的影响。方法对从青岛市4个社区中筛检出的、未经药物系统治疗的235例原发性高血压病人及240例正常血压者进行调查,用聚合酶链反应-限制性片段长度多态性(PCR-RFLP)方法检测M235T变异;应用相加模型分析M235T变异与腰臀比异常的交互作用。结果高血压组T等位基因频率(46.81%)及腰臀比异常率(69.79%)高于对照组(分别为37.71%,47.92%),差别有统计学意义(χ2=8.677,23.433,P0.01)。AGT基因M235变异与腰臀比异常具有正交互作用。用多因素分析调整年龄、性别、体质指数、饮酒、吸烟、血脂等因素后,M235T基因变异与腰臀比异常的协同效应指数(S)为1.945,归因交互效应(AB)为1.022,归因交互效应百分比(AP%)为32.91%,纯因子间AP为48.55%。结论 AGT基因第二外显子编码M235T变异与原发性高血压有关,AGT基因M235T变异与腰臀比异常具有正交互作用,控制腰臀比异常可以降低居民原发性高血压患病的危险性。  相似文献   

10.
目的评估肥胖和代谢因子在高尿酸血症(HUA)与高血压前期关联中的中介效应。方法采用多阶段分层整群随机抽样方法抽取福州市5个区(县)30个镇(街)90个村(居委会)共9 399人, 最终纳入研究4 754人。采用线性回归模型分析HUA与肥胖和代谢因子的关联, 单因素和多因素logistic回归模型分析HUA、肥胖和代谢因子与高血压前期的关联, 采用因果中介效应模型分析肥胖和代谢因子对HUA与高血压前期相关性的中介效应。结果在调整混杂因素后, HUA与TC、TG、HDL-C、LDL-C、BMI、腰围、肌酐、尿素氮均显著相关(P<0.001);HUA、腰围、BMI和TG与高血压前期均显著相关(P<0.001);腰围、BMI和TG对HUA与高血压前期的关联均有中介效应, OR值(95%CI)分别为1.018(1.007~1.027)、1.010(1.002~1.018)、1.010(1.003~1.017)(P<0.001), 中介比例分别为7.76%、4.31%和4.31%;TC、HDL-C、LDL-C、肌酐和尿素氮对两者关联无中介效应(P>0.05)。结论腰围、BM...  相似文献   

11.
目的探讨决策树和logistic回归在超重危险因素分析中的应用效果,分析出影响超重的危险因素,为超重的防治提供依据。方法采用1∶1病例对照研究方法,选取符合超重标准的518名超重者和518名对照,应用SPSS 16.0中logistic回归和决策树CHAID算法建立预测模型,利用受试者工作曲线(ROC)评价两个预测模型的效果。结果 logistic回归筛选出两个危险因素:年龄大、食盐量大,而女性是保护因素。除上述3个因素外,决策树模型还分析出吸烟、饮酒也是超重的危险因素,决策树模型对训练样本和测试样本超重风险预测准确率分别为70.0%和74.9%。决策树模型的灵敏度为(85.6%)、约登指数(55.6%)、正确分类百分比(74.9%)均高于logistic回归预测模型(57.9%,45.4%,72.7%),特异度(70.0%)低于logistic回归预测模型(87.5%)。决策树模型ROC曲线下面积稍大于logistic回归模型(0.720 vs 0.670,Z=1.784,P=0.038)。结论采用CHAID法建立超重相关因素模型是可行的,其预测结果可为超重的防治提供依据。倡导居民健康生活方式,戒烟限酒、低盐饮食、适当体育锻炼将有效控制超重及相关疾病的发生。  相似文献   

12.
原发性高血压(esential hypertension,EH)是一种由遗传与环境因素共同导致的复杂疾病,具有高度的遗传异质性。自1992年首个高血压基因关联研究报道以来,许多高血压的易感基因研究相继开展。肾素-血管紧张素-醛固酮系统(renin-angiotensin-aldosterone system,RAAS)在血压调节中发挥重要作用,而该系统基因多态性与EH关系的研究结果各有差异。本文首先对该系统中4个关键基因多态性以及多态性与EH研究结果进行汇总分析,其次介绍了基因与基因、基因与环境的交互作用的研究进展。尽管目前对RAAS系统基因多态性与EH的关系研究层出不穷,但是至今未能找出对EH起主要作用的共同基因,究其原因可能是因为遗传异质性、种族差异、地区差别等诸多复杂因素的影响。  相似文献   

13.
目的通过分析武陵山片区人群候选基因MTHFR、CBS、ALDH2易感位点多态性、饮食习惯偏好以及两者的交互作用与H型高血压的发病关联,从而揭示H型高血压的流行病学危险因素。方法 2020年10—12月,将875例研究对象分为对照组、单纯高血压组以及单纯高同型半胱氨酸血症(hyperhomocysteine, HHcy)组以及H型高血压组。通过问卷调查获得一般资料,抽取血样本进行生化指标检测,同时对MTHFR、CBS、ALDH2基因对应的易感位点rs1413355、rs6586283以及rs190914158进行测序,分析上述位点多态性与H型高血压的相关性,并采用二分类logistic回归以及线性优势比模型计算饮食习惯与基因分型对H型高血压形成的交互作用。结果武陵山片区人群中rs1413355、rs190914158位点变异均与HHcy有关,但与血压异常无相关性,rs190914158位点变异与胰岛素抵抗以及血脂水平异常有相关性。多因素logistic回归分析显示,在作为独立变量时,易感位点以及饮食习惯均不能导致H型高血压,rs190914158位点突变和腌制饮食偏好之间的交互作用仍然为发病的危险因素,且与线性优势比模型计算结果吻合。结论武陵山片区人群候选基因ALDH2 rs190914158位点变异可能导致包括同型半胱氨酸在内的多种代谢障碍,并且与腌制饮食偏好在促成H型高血压发病过程中存在交互作用。  相似文献   

14.
目的当核心家系中无父母信息时,经典的传递不平衡检验(TDT)已不再适用,本文针对患病-未患病同胞家系数据,提出相应的关联分析方法,并校正协变量的影响。方法我们把家系中的受累同胞作为病例,未受累同胞作为匹配的对照,建立非均衡的条件logistic回归模型或分层Cox回归模型。我们把模型应用到96个华人原发性高血压核心家系的基因定位数据,分析校正协变量后ACE的I/D多态性、钠盐摄入水平与高血压的关系。结果 ACE与高血压的关联性受到钠盐摄入量高低的影响,ACE与钠盐摄入程度存在交互作用,较高的钠盐摄入患者其ACE的I/D多态性与高血压的关联性更强。结论条件logistic回归模型或分层Cox回归模型能校正协变量的影响,有效分析基因的主效应和基因与协变量的交互作用。  相似文献   

15.
  目的  分析湖北省成年人高血压糖尿病共患病(hypertension-diabetes comorbidity,HDC)状况及其预警指标,为HDC的预防控制提供科学依据。  方法  采用多阶段分层抽样法,从湖北省11个地区抽取≥18岁的居民作为研究对象,对其进行问卷调查,采用Logistic回归分析模型和决策树模型分析HDC的预警指标,并用受试者工作曲线(receiver operating characteristic calve,ROC)评价两种模型的预测效果。  结果  Logistic回归分析模型及决策树模型分析结果均显示,工作强度、吸烟、婚姻、性别、BMI和年龄均是HDC的有效预警指标(均有P < 0.05)。Logistic回归分析模型ROC曲线下面积大于决策树模型(0.967 vs. 0.933, Z=9.199,P<0.001)。  结论  Logistic回归分析模型预测能力优于决策树模型。但有必要将两种模型结合应用于HDC预警指标的预测。通过Logistic回归分析模型筛选出有意义的主效应预警指标,然后采用决策树模型进一步分析指标间的交互作用,为HDC的防控提供参考依据。  相似文献   

16.
目的采用随机森林算法探讨急性ST段抬高型心肌梗死(STEMI)患者经皮冠状动脉介入治疗(PCI)术后无复流风险因素。方法回顾性分析2013年1月至2019年6月期间某院行直接PCI术的急性STEMI患者的临床资料。收集患者入院时的一般资料、相关检验指标以及PCI术后情况等。应用随机森林算法和多因素logistic回归分析对风险因素进行分析。结果收集352例符合纳入标准的行直接PCI术的急性STEMI患者,其中63例无复流,289例有复流。构建随机森林模型,使用C-index进行评估,训练集C-index为0.980,测试集C-index为0.840,模型预测效力尚可,筛选出变量平均血小板体积/淋巴细胞比率(MPVLR)、病变长度、高血压、发病到球囊扩张时间(PBT)、淋巴细胞计数(LYM)、血小板/淋巴细胞比率(PLR),进一步行多因素logistic回归表明MPVLR、高血压、PBT、LYM、PLR为影响急性STEMI患者直接PCI术后无复流的风险因素。结论通过随机森林分析筛选出了急性STEMI患者直接PCI术后无复流风险因素,结合logistic回归分析,MPVLR、高血压、PBT、LYM、PLR为影响急性STEMI患者直接PCI术后无复流的风险因素,可为医务人员快速简单地进行风险分析、及早干预提供依据。  相似文献   

17.
王福成    齐平  蒋剑军  黄永  杨晓玲 《现代预防医学》2020,(13):2310-2313
目的 针对铜陵市天桥社区居民体检数据中多因素、有效样本有限的情况,挖掘与分析高血压影响因素与因素间的交互效应,为高血压干预提供参考。方法 选取2017年该社区801例体检数据为研究对象,采用随机森林方法,筛选出重要性评分较大的特征,代入logistic完全二次回归模型,逐步回归分析影响因素及因素间的交互效应。结果 随机森林模型准确率83.67%,特征重要性前10项为年龄、糖尿病、锻炼频率、体质指数、总胆固醇、吸烟情况、饮酒情况、中心性肥胖、甘油三酯、血尿素氨。Logistic完全二次回归模型准确率84.17%,输出2条主效应、8条二次交互效应。主效应中有统计学意义(P<0.05)的特征有年龄、锻炼频率,二次交互效应中有统计学意义(P<0.05)的特征有年龄、糖尿病、体质指数、总胆固醇、吸烟情况、饮酒情况、甘油三酯、血尿素氨。结论 随机森林与logistic完全二次回归模型相结合,解决了经典方法难以从多因素、样本有限的数据中挖掘交互效应的问题,获得高血压影响因素与因素间的交互效应,为高血压干预提供有益的指导。  相似文献   

18.
人类基因组计划的完成预示着生命科学研究进入基因组时代,基因组流行病学是利用流行病学方法研究基因组遗传变异在疾病发生发展中的作用.随着国际人类单体型计划(HapMap)的推进和高通量基因型检测技术的成熟,全基因组关联研究(genome-wide association study,GWAS)成为基因组流行病学高效的研究策略.GWAS利用高通量的基因型检测平台,在全基因组范围内同时研究几十万甚至上百万个SNP,在较大样本量的研究对象中筛选与疾病或性状相关的SNP位点,并利用一个或多个独立人群进行验证,最终确定与疾病或性状表型相关SNP位点.  相似文献   

19.
目的分析先天性心脏病中TBX5基因、MTHFR基因与环境因素的交互作用。方法回顾性分析2012年12月至2015年5月山东大学齐鲁儿童医院就诊的单纯先天性心脏病患儿150例。应用单因素和多因素非条件logistic回归模型分析环境因素与先天性心脏病的关系并计算OR(95%CI),利用多因子降维法(MDR)进行交互作用分析。结果妊娠高血压综合征和孕期情绪状态是先天性心脏病可能的环境危险因素,基因-基因交互作用MDR模型筛选中,1阶与2阶交互作用最佳预测模型交叉验证一致性均不高,基因-环境交互作用MDR模型筛选中,最优交互模型是孕母情绪状态、MTHFR基因rs1801133位点多态与TBX5基因rs883079位点多态,该模型的拟合均衡准确性为0.685,检测均衡准确性为0.613,交叉验证一致性为10/10。TBX5基因rs883079、MTHFR基因rs1801133和rs1801131位点可能与先天性心脏病存在关联,MTHFR和TBX5基因可能存在交互作用,但交互作用不明显。结论孕母情绪状态MTHFR基因和TBX5基因在先天性心脏病中具有显著交互效应,可增加先天性心脏病的发病风险。  相似文献   

20.
目的分析高尿酸与性别对老年人群血脂异常的交互作用。方法本研究为横断面研究, 2021年在江苏昆山周庄镇选取≥65岁的常住居民开展横断面调查, 包括体格检查、血吸虫病感染史、血液生化检测(血糖、血脂、肌酐、尿酸透明质酸、γ-谷氨酰转肽酶)等。多因素logistic回归分析诸因素与血脂异常的关联;采用交互作用指数(S)、交互作用相对超额危险度(RERI)及归因交互效应百分比(AP)评价高尿酸和女性交互作用对血脂异常的关联;采用限制性立方样条回归模型分析血尿酸水平与血脂异常关联强度剂量反应关系。结果≥65岁人群血脂异常率为31.9%(1 450/4 536);男性和女性血脂异常率分别为23.7%(517/2 180)和39.6%(933/2 356), 血脂异常率在性别之间的差异有统计学意义(χ2=131.38, P<0.001)。多因素回归分析显示, 女性、高腰围、超重肥胖、高血压、糖尿病、肾小球滤过率偏低、γ-谷氨酰转肽酶偏高、尿酸肌酐比值偏高、中性粒细胞与淋巴细胞比值偏低与血脂异常之间的关联差异均有统计学意义(均P<0.05)。高尿酸水平(OR=1.09, 95%CI:1....  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号