首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
摘要:目的 采用随机森林算法分析体检人群肾结石的影响因素。方法 自体检人群中选取955例肾结石患者和1670例未患肾结石者,收集各项生化指标,先利用随机森林方法进行降维,再用传统的Logistic回归对降维后的变量进行分析。结果 经随机森林算法筛出8个重要性得分最高且错误率最低的变量纳入经典Logistic回归模型进行分析,最终进入Logistic回归模型的变量有性别、年龄、体质指数、收缩压、低密度脂蛋白、总胆红素。结论 肾结石的发病与性别、年龄及人体多项生化指标有关。  相似文献   

2.
目的应用随机森林和支持向量机算法处理乳腺癌基因数据,筛选三阴性和非三阴性乳腺癌的差异基因,为临床应用提供更多的参考靶点。方法使用TCGA乳腺癌基因数据,通过t检验和随机森林进行降维处理,然后使用支持向量机、支持向量机递归特征消除法、随机森林进行变量重要性排序,将随机森林和支持向量机与向前变量选择法结合进行模型预测并完成最终变量筛选,通过Holdout验证评价模型效果。结果数据经t检验的FDR降维后剩余18702个基因,经随机森林降维后剩余6326个基因;对降维后经三种方法排序的数据建立预测模型,获得各模型约登指数等评价指标;对排序结果中靠前的基因进行文献搜索,发现大部分基因和三阴性乳腺癌的转移或者预后有关。结论针对高维基因表达数据进行变量选择,使用t检验的FDR进行降维、随机森林对变量进行排序筛选、支持向量机进行预测效果最佳;通过检索重要性排序靠前基因发现大多数与三阴性乳腺癌有关,但某些靠前基因与三阴性乳腺癌无文献研究,建议研究这些基因与三阴性乳腺癌的相关性。  相似文献   

3.
目的分析拟行肝胆胰外科大手术的老年患者的营养状态与衰弱、肌肉衰减症的相关性。方法选择2020年12月至2022年9月在北京医院肝胆胰外科连续入组的拟行肝胆胰外科大手术的老年住院患者144例。应用营养风险筛查2002量表进行营养风险筛查, 采用全球营养领导层诊断营养不良标准进行营养不良诊断, 采用Fried氏衰弱表型5项量表评估衰弱, 应用亚洲肌肉衰减症工作组2019标准进行肌肉衰减症评估。分析营养状态、衰弱、肌肉衰减症患病率和重叠率, 以及营养状态对衰弱和肌肉衰减症的影响。结果患者平均年龄(70.10±7.44)岁, 营养风险发生率73.6%(106/144), 营养不良发生率68.1%(98/144), 其中重度营养不良34.7%(50/144);衰弱发生率20.8%(30/144), 肌肉衰减症发生率35.4%(51/144)。营养风险、重度营养不良、肌肉衰减症及衰弱的患病率随年龄增长呈上升趋势, 但随体重指数增加呈下降趋势。肌肉衰减症与营养不良的重叠患病率为35.4%(51/144), 衰弱与营养不良的重叠患病率为19.4%(28/144), 肌肉衰减症与衰弱的重叠患病率为14....  相似文献   

4.
目的 将随机森林算法用于类风湿性关节炎病例对照研究的高维甲基化数据的分析,并探讨应用效果。方法 实例数据来自基因表达数据库(gene expression omnibus,GEO),检索号为GSE42861,包含354名病例、335名对照,本文选取类风湿性关节炎相关基因区域所在的第9号染色体,共纳入2 433个胞嘧啶-磷酸-鸟嘌呤双核苷酸(cytosine-phosphate-guanine pairs of nucleotides,CpGs)位点。利用随机森林计算变量的重要性评分并排序;对排序后的变量进行逐步随机森林过程,寻找最有可能与结果存在关联的变量子集;对降维后的变量子集进行逐步Logistic回归。结果 逐步随机森林筛选出80个重要的CpG位点,Logistic回归模型中有13个位点具有统计学意义。纳入这些位点建立Logistic回归模型,该模型的预测正确率达88.29%。结论 随机森林算法可以大大减少噪音变量,提高检验效能,适用于高维甲基化数据分析。  相似文献   

5.
目的 利用随机森林算法对农村地区≥50岁男性的艾滋病歧视现状及其影响因素进行分析,提出针对性反歧视干预措施。方法 2021年8—12月,采用艾滋病知识问卷、中文版Zelaya艾滋病歧视量表对彭州市3个乡镇240名听说过艾滋病的中老年男性进行面对面访谈式问卷调查。使用随机森林算法对变量进行重要性排序并降维,将筛选后的变量纳入有序logistic回归。结果 在240名农村中老年男性中,平均年龄(66.01±8.42)岁,艾滋病知识知晓率为29.6%,艾滋病歧视总得分均值为(3.00±0.68)分,在歧视各维度中,耻辱偏见得分最高。艾滋病知识知晓率与艾滋病歧视总得分呈负相关(r=-0.203,P=0.002)。随机森林算法显示,变量数为5时袋外估算误差率最低,依次为艾滋病知识得分、个人月收入、年龄、居住情况、文化程度。有序logistic回归分析显示,艾滋病知识得分低(OR=0.762,95%CI:0.672~0.863)、60岁及以上年龄组(OR=1.927,95%CI:1.029~3.534)、独居(OR=2.902,95%CI:1.089~7.736)、小学及以下者(OR=2.036,...  相似文献   

6.
武颂文  石一  雷静  赵巧 《现代预防医学》2023,(20):3724-3728+3741
目的 分析围绝经期综合征的影响因素,为其疾病防治提供参考。方法 通过滚雪球法对陕西省468例45~60岁女性进行在线问卷调查,采用随机森林算法对围绝经期综合征影响因素的重要性进行排序并降维,将选择的变量集纳入Ordinal logistic回归分析模型,分析影响因素的方向和OR值。结果 随机森林算法显示,OOB误差率最低时的变量数为5,居于前5的变量依次是体力活动水平、年龄、月经状况、自评健康状况和生育次数。Ordinal logistic回归分析显示,与低体力活动相比,中等(OR=0.251,95%CI:0.142~0.433)、高(OR=0.008,95%CI:0.004~0.016)体力活动水平;与自评健康状况不满意相比,自评健康一般(OR=0.614,95%CI:0.402~0.953)、满意(OR=0.412,95%CI:0.233~0.735),是围绝经期综合征的保护因素(P均小于0.05)。与月经状况正常相比,月经紊乱(OR=2.592,95%CI:1.611~4.203)、绝经(OR=2.573,95%CI:1.453~4.575);与生育0次相比,生育2次(OR=2....  相似文献   

7.
肌肉衰减症是一种与增龄相关的老年退行性疾病,是导致老年人日常活动受限、摔倒、骨折、住院的重要因素。2016年世界卫生组织已将肌肉衰减症列入国际疾病分类表(ICD-10-CM,代码M62.84)。SARC-F量表是近年来建立起来的一种肌肉衰减症筛查工具,能快速的对肌力和肌功能进行评估,无需依赖于昂贵的仪器设备测量肌肉质量,具有廉价、简便的优势。本文旨在介绍SARC-F量表及其筛查效果和局限性,以促进SARC-F量表的应用和发展。  相似文献   

8.
目的 探索随机生存森林在大规模测序肺癌随访研究资料中的降维效果,为进一步建立预后预测模型提供依据.方法 利用随机生存森林法对120位肺癌患者399个单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点进行降维分析,筛选出重要性评分较高且错分率较低的SNPs子集,再对该子集建立多元Cox比例风险模型,并利用交叉验证法评价模型的预测效果.结果 随机生存森林法筛选出25个重要的SNPs,控制临床协变量(临床分期、是否手术、组织病理学类型)的多元Cox比例风险模型显示有4个位点有统计学意义.交叉验证结果表明,该模型的平均准确度达83.63%.结论 对高维关联性研究数据利用随机生存森林法先去噪降维,再作进一步分析,有助于后续预后预测模型的建立.  相似文献   

9.
目的:利用空间分析描述流动矿工结核病健康教育空间分布与空间聚类,再利用随机森林模型和logistics有序回归筛选影响流动矿工人口结核病健康教育的因素,加强流动矿工人口的结核病管理。方法:基于2017年全国流动人口动态监测调查数据,使用全局和局部空间自相关描绘结核病健康教育空间分布格局,使用随机森林算法对影响因素进行重要性排序并降维,将筛选后的变量纳入有序logistic回归。结果:在1165流动矿工人口中共计545(46.78%)人接受结核病健康教育,矿工中男性比重较大,年龄大部分集中于30~50岁。流动矿工的结核病健康教育水平较高的地区分布在四川、陕西和山西。通过全局空间自相关分析,显示流动矿工接受结核病健康教育的分布具有一定空间集聚特征。随机森林模型显示,变量数为10时袋外估算误差率最低,依次为年龄,教育,和谁来往,就业身份,居住意愿,和谁流动,周劳动时间,性别,婚姻,参保情况。有序logistics回归分析显示,小学及以下(OR=1.585,95%IC:0.074~0.847)、无固定雇主的雇员(0.538,95%IC:-1.225~-0.016)、家庭型或团体性迁移(0.71...  相似文献   

10.
目的 基于机器学习算法探讨阿尔兹海默病发病的脂蛋白及代谢物影响因素。方法 从ADNI数据库中选取2012年诊断结果为正常(cognitive normal,CN)和阿尔兹海默病(Alzheimer disease,AD)的研究对象共314例,收集其脂蛋白及代谢物数据。采用随机森林、lasso回归、XGboost算法三种方法对变量进行重要性排序及筛选。利用三种方法筛选出的变量,结合研究人群的性别、年龄、婚姻状况构建随机森林模型,预测影响AD发病的重要因素。结果 三种方法共筛选出12个脂蛋白及代谢物变量,结合研究人群的年龄、性别、婚姻状况共15个变量被纳入随机森林模型。模型的准确率为84.13%、灵敏度为93.75%、特异度为53.33%、Kappa值为0.518 3、AUC(95%CI)为0.735(0.600~0.871)。根据随机森林模型中Mean Decrease Accuracy和Mean Decrease Gini两指标分别筛选出的排名前五的变量中均包含以下四个变量:大极低密度脂蛋白中的磷脂与总脂质之比(L_VLDL_PL_PCT)、年龄(AGE)、乳糜微粒和极大极低密度脂蛋白...  相似文献   

11.
  目的  调查西藏日喀则市18岁以上世居居民高血压患病率,探究不同影响因素与高血压发病率之间的关联程度。  方法  采用问卷调查和实地血压测量的方法收集到日喀则市391位居民的年龄、文化程度、职业、吸烟、饮酒、体重指数(body mass index,BMI)、盐摄入量等信息。数据分析采用SPSS的Logistic回归分析模型进行统计处理。  结果  391份调查问卷显示,高血压患病率为38.36%,其中男性患病率为39.91%,女性患病率为36.52%。多因素Logistic回归模型分析结果显示,与日喀则居民高血压相关的危险因素包括年龄、BMI、吸烟、饮酒,其中年龄、BMI、吸烟与高血压成正相关,饮酒与高血压呈负相关。  结论  在日喀则地区世居居民中,年龄、BMI、吸烟这三种因素均为高血压的危险因素,饮酒则为高血压的保护因素。  相似文献   

12.
  目的  分析18~69岁普通人群24 h尿钠与肥胖的相关性。  方法  2013-2014年在山东省和江苏省4个项目县,采用多阶段整群随机抽样的方法,选取2 400名18~69岁调查对象进行问卷调查、体格测量和24 h尿液收集。采用多因素线性回归和Logistic回归模型分析尿钠和肥胖的关系。  结果  最终纳入分析的2 275名研究对象肥胖率19.1%(95%CI:17.4%~20.6%),24 h尿钠为(166.4±71.5)mmol/d。肥胖、按腰围身高比(waist-to-height ratio,WHtR)计算的向心性肥胖人群24 h尿钠水平高于非肥胖人群,差异均有统计学意义(均有P < 0.05)。多元线性回归分析调整相关因素后,24 h尿钠与体重指数(body mass index,BMI)、腰围(waist circumference,WC)和WHtR呈正相关关系。多因素Logistic回归分析结果显示,调整年龄、性别、教育程度、吸烟、饮酒、身体活动、高血压和糖尿病后,与尿钠水平最低组相比,尿钠水平最高组患肥胖、向心性肥胖(按WC计算)、向心性肥胖(按WHtR计算)风险的OR(95%CI)值分别为1.61(1.18~2.20)、2.01(1.39~2.89)和1.47(1.15~1.89)。  结论  24 h尿钠与肥胖呈正相关,高钠摄入是肥胖的重要危险因素。  相似文献   

13.
  目的  针对2015年山西省糖尿病调查数据,利用最大最小爬山(max-min hill-climbing, MMHC)算法构建糖尿病相关因素的贝叶斯网络模型,探索糖尿病及其相关因素间的网络关系,通过网络模型推理反映各影响因素对糖尿病的影响程度。  方法  采用单因素及多因素Logistic回归分析模型对2015年山西省≥18岁居民的糖尿病调查数据进行变量初筛,再以MMHC算法构建贝叶斯网络模型,参数估计采用极大似然估计法。  结果  2015年山西省糖尿病的检出率是9.5%。经Logistic回归分析模型对变量进行筛选后,年龄、职业、日均摄油量、高血压、高脂血症、BMI和心率被纳入贝叶斯网络模型;贝叶斯网络模型结果显示:年龄、高脂血症、高血压与糖尿病直接相关,BMI通过影响高脂血症与糖尿病间接相关,日均摄油量通过影响BMI和高脂血症与糖尿病间接相关。  结论  贝叶斯网络模型能很好地揭示糖尿病及其相关因素间复杂的网络关系,在分析疾病相关因素上具有较好的适用性和应用前景。  相似文献   

14.
  目的  了解学龄前儿童超重肥胖现状及其影响因素,为预防和控制乌鲁木齐市学龄前儿童超重肥胖的发生提供参考依据。  方法  采用分层整群抽样方法,于2021年10—12月抽取乌鲁木齐市10所幼儿园1 897名学龄前儿童,通过对身高、体重的测量了解学龄前儿童超重肥胖现状,应用一般资料调查问卷、学龄前儿童饮食行为量表、学龄前儿童照护人喂养行为量表、3~6岁儿童家庭养育环境量表、学龄前儿童体力活动问卷等分析其相关因素。  结果  学龄前儿童超重肥胖检出率为31.21%(592名),其中超重率为19.50%(370名),肥胖率为11.70%(222名)。儿童超重肥胖检出率在不同年龄、性别、儿童饮食习惯(喜食肉类)、父亲体质量指数、母亲体质量指数、母亲孕前体质量指数间差异均有统计学意义(χ2值分别为19.63,28.75,9.45,18.21,18.45,19.36,P值均 < 0.05)。多因素Logistic回归分析显示,性别、儿童饮食习惯、父亲体质量指数、母亲孕前体质量指数、过饱响应、外因性进食、主动进食能力、体重担忧、饮食行为限制、体力活动、家庭体力活动环境是学龄前儿童超重肥胖的相关因素(OR值分别为0.52,1.43,1.51,1.44,0.69,0.74,1.35,1.71,0.81,0.96,1.10,P值均 < 0.05)。  结论  乌鲁木齐市学龄前儿童超重肥胖问题严峻,应加强教育、控制饮食、科学锻炼,以防止儿童超重肥胖的发生。  相似文献   

15.
  目的  探讨成年人BMI、腰围与睡眠质量的联合作用对高血压患病风险的影响。  方法  采用便利抽样法,于2020年10月12日―2020年12月18日对十堰市3 195名成年居民进行问卷调查。采用Logistic回归分析模型分析BMI、腰围与睡眠质量对高血压患病的联合作用。  结果  高血压患病率为18.22%。多因素Logistic回归分析模型分析显示,以BMI正常且睡眠质量好的组为对照组,体重过轻且睡眠质量好的组、超重且睡眠质量好的组、全身型肥胖且睡眠质量好的组、体重过轻且睡眠质量差的组、BMI正常且睡眠质量差的组、超重且睡眠质量差的组、全身型肥胖且睡眠质量差的组高血压患病风险分别是对照组的4.049倍、1.172倍、4.625倍、4.581倍、1.166倍、5.476倍和8.230倍。以腰围正常且睡眠质量好的组为对照组,腹型肥胖且睡眠质量好的组、腰围正常且睡眠质量差的组、腹型肥胖且睡眠质量差的组高血压患病风险分别是对照组的4.017倍、3.074倍和7.495倍。  结论  睡眠质量差和全身型肥胖或腹型肥胖共存会增加高血压的患病风险,提示睡眠质量差的人群控制BMI和腰围有利于高血压的预防。  相似文献   

16.
目的 探讨青岛市城区居民高血压患病的危险因素,并对各因素进行定量评价分析.方法 利用中国慢性病前瞻性研究项目(China Kadoorie Biobank,CKB)青岛项目点基线调查数据,采用多因素Logistic回归分析模型,分析青岛市城区30~79岁居民高血压患病的危险因素,计算各因素危险分数和个体发病风险.结果 ...  相似文献   

17.
  目的  探讨高血压、超重/肥胖及二者相加交互作用对糖尿病的影响,为预防糖尿病提供依据。  方法  采用多阶段整群随机抽样方法,于2015年9-11月对8 991名居民进行问卷调查、医学体检及采集静脉血。基于复杂抽样构建Logistic回归分析模型及线性回归模型对数据进行统计分析,应用相加模型分析高血压及超重/肥胖对糖尿病患病的交互作用。  结果  Logistic回归分析模型结果显示高血压和超重/肥胖是40岁及以上居民糖尿病的危险因素。相加模型结果显示,高血压和超重/肥胖对糖尿病存在协同作用,OR值为4.45(95% CI: 2.75~7.20)。交互作用对FPG及糖化血红蛋白的影响也大于单独高血压或超重/肥胖人群。  结论  高血压、超重/肥胖是广东省40岁及以上人群糖尿病的独立危险因素,高血压伴有超重/肥胖对糖尿病患病存在相加交互作用。  相似文献   

18.
  目的  探索上海市50岁以上残疾人群高血压及糖尿病的患病率,共病情况及风险因素。  方法  采用整群抽样方法对上海市某残疾人定点健康保健医院,2018年2月-2018年12月的6 195例50岁以上残疾人的健康体检信息进行回顾性调查分析,内容包含研究对象一般人口学信息、残疾类型、残疾等级、高血压和糖尿病患病情况及血液生化检测指标。研究对象按高血压和糖尿病患病人数分为三级,采用有序多分类Logistic回归分析模型对研究对象高血压和糖尿病共病的风险因素进行分析。  结果  6 195例残疾人的年龄为(63.9±6.9)岁,男性3 313人,占比53.5%;肢体残疾3 735人,占比60.3%。高血压标准化患病率为48.0%,糖尿病标准化患病率为13.4%。高血压及糖尿病共病者565人,占比9.12%。按共病分类比较,性别、年龄、文化程度、残疾类型、BMI、TG、胆固醇、尿酸及肌酐水平差异有统计学意义(均有P < 0.05)。有序多分类Logistic回归分析结果显示,男性、高龄、肢体残疾、超重或肥胖、TG超标、尿酸及肌酐水平异常是残疾人高血压及糖尿病共病的风险因素。  结论  残疾人群高血压及糖尿病共病患病率较高,尤其是肢体残疾的患者。应关注体重、脂代谢、尿酸等指标的变化,针对不同残疾类型制定精准的防控策略。  相似文献   

19.
  目的  了解内蒙古地区学生肥胖现状及其与饮食、运动、心理等方面的关系,为制定该地区学生肥胖干预措施提供科学依据。  方法  采用分层整群随机抽样方法,抽取内蒙古自治区全部12个盟市、103个旗县区的186 649名学生。按中国学龄儿童青少年超重与肥胖筛查标准对调查对象进行分组,采用χ2检验进行单因素分析,采用多因素非条件Logistic回归模型筛选肥胖有关因素。  结果  学生总体肥胖率为18.54%,男生肥胖率为22.04%,女生为14.99%。多因素Logistic回归分析结果显示,监测点(OR=0.79)、性别(OR=0.61)、每日吃油炸食品次数(OR=1.08)、每周每日运动超过60 min>2 d(OR=0.89)、是否每天吃早餐(OR=0.86)、每日喝饮料次数(OR=1.12)、吸烟(OR=0.87)、饮酒(OR=1.07)、每日吃水果次数(OR=1.07)、每日看电视≥2 h(OR=1.06)、睡眠时间(OR=0.93)以及学段可能与学生肥胖有关(P值均 < 0.05)。  结论  内蒙古地区学生总体肥胖率较高,学生肥胖的发生与饮食运动行为、生活习惯及心理因素有关。应采取针对性干预措施控制学生肥胖的发生。  相似文献   

20.
  目的  了解北京市延庆区初中生糖代谢异常现状及其影响因素。  方法  采用分层整群随机抽样的方法在延庆区抽取4所初中的2 493名在校生进行问卷调查、体格检查和空腹毛细血管血糖筛查。  结果  糖尿病、空腹血糖受损、糖代谢异常患病率分别为2.5%、11.4%、13.9%。不同年龄、不同年级、不同地区、超重、肥胖、向心性肥胖、高血压的初中生糖代谢异常患病情况差异均有统计学意义(均有P < 0.05);多因素非条件Logistic回归模型分析显示,城区、向心性肥胖、高血压与中学生糖代谢异常的危险呈正相关;每天吃早餐与中学生患糖代谢异常的危险呈负相关。  结论  北京市延庆区初中生糖代谢异常患病率较高,城区、向心性肥胖、高血压和每天吃早饭是该地初中生糖代谢异常的影响因素。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号