首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 327 毫秒
1.
摘要:目的 采用随机森林算法分析体检人群肾结石的影响因素。方法 自体检人群中选取955例肾结石患者和1670例未患肾结石者,收集各项生化指标,先利用随机森林方法进行降维,再用传统的Logistic回归对降维后的变量进行分析。结果 经随机森林算法筛出8个重要性得分最高且错误率最低的变量纳入经典Logistic回归模型进行分析,最终进入Logistic回归模型的变量有性别、年龄、体质指数、收缩压、低密度脂蛋白、总胆红素。结论 肾结石的发病与性别、年龄及人体多项生化指标有关。  相似文献   

2.
目的 研究河南省65岁及以上老年人群阿尔兹海默病患病现状及影响因素,探索新的干预方式。方法 随机多阶段分层整群抽样方法抽取老年人群,采用自编问卷收集其基本信息,利用简明社区阿尔兹海默病筛查量表-老人测试部分和Alzheimer disease(AD8)问卷筛查疑似人群,再由临床医师作出诊断,影响因素分析采用logistic回归分析。结果 本次调查有效问卷7 326例。共发现老年阿尔兹海默病患者443例,老年阿尔兹海默病患病率6.05%,通过logistic回归分析,发现年龄、文化程度、家庭月收入水平、健康状况、业余爱好等因素对阿尔兹海默病患病有影响(P<0.05),其中年龄当中,相对于≥80岁人群,65~69岁(χ2 = 18.585,P<0.01)、70~79岁(χ2 = 13.183,P<0.01)是老年阿尔兹海默病的保护性因素,且随着年龄增长有减弱趋势;健康状况中,相对于认为自身健康问题较差的,健康(χ2 = 13.906,P<0.01)是老年阿尔兹海默病的保护性因素;爱好数量可以多选。经过分析得出,相对于爱好数量大于等于2项,爱好数量为1项(χ2 = 4.051,P<0.05)和0项(χ2 = 9.118,P<0.01)为老年阿尔兹海默病的危险性因素,且0项OR值(1.781)大于1项的(1.259)。结论 河南省65岁及以上老年人群阿尔兹海默病患病情况不容乐观,其影响因素复杂多样,在干预过程中,各地应根据本地区具体情况作出针对性措施。  相似文献   

3.
目的 本研究借鉴深度森林(deep forest)的思想,提出一种基于树的集成学习方法新思路,为以后相关的研究提供分析策略和思路。方法 使用2015年中国健康与养老追踪调查数据库,筛选与消化系统疾病有关的变量,通过“人工地”建立多层随机森林模型,对人群进行分类,再分别建立模型筛选变量,通过计算评价指标评价模型效果,从而选择更优的模型解释与消化系统疾病相关的变量。结果 本研究发现通过建立多层随机森林模型对人群分为两类后,再分别建立模型,各评价指标都有很大幅度提高。另外对两类人群分别构建随机森林模型后,根据变量重要性评分筛选出与消化系统疾病有关的重要变量,再建立logistic模型,结果显示,一类人群筛选出15个有统计学意义的变量,其中有13个危险因素,OR值由1.871至35.917,关联最强的是关节炎和风湿病,其次为肾脏疾病、过去一个月生过病、头痛或者颈部痛、胸背部或者腰臀部疼痛、心脏病等;2个保护因素为晚上的睡眠时间、血红蛋白值。另一类人群筛选出的相关变量与第一类人群大部分相同,但作用相反,OR值由0.067至0.771,并且对第一类人群危害最大的因素对第二类保护也最大。结论 对于病...  相似文献   

4.
目的探讨平凉市老年痴呆(AD)的患病现状和影响因素,旨在为早期预防和控制老年性痴呆提供新的思路和手段。方法采用随机整群抽样方法对平凉市60岁以上的老年人进行问卷调查,使用多因素Logistic回归建立老年性痴呆的发病模型,分析影响患者发病的因素。结果调查结果显示,平凉市60周岁以上的老年人群AD患者有281例,发病率为19.68%,将老年人是否患有AD作为因变量,将性别(男)、年龄(60岁)、婚姻状况(良好)、文化程度(文盲)、有亲属遗传史、爱好运动等单因素分析有关联的因素作为自变量,Logistic回归分析结果显示性别、婚姻状况不良、文化程度低、有遗传史为AD的危险因素,爱好运动为AD的保护因素。结论平凉市老年性痴呆病的发比率偏高,主要与老年人年性别、婚姻状况差、文化程度低、有遗传史等因素有关,可根据上述因素给予相应的支持,有效的预防和控制AD发生。  相似文献   

5.
目的 探讨Lasso Logistic回归模型在乳腺癌高风险人群筛查利用相关因素研究中的应用。方法 基于健康风险评估模型筛选乳腺癌高风险人群,利用Lasso Logistic回归模型进行变量选择,通过交叉验证选择模型中的最优调和参数λ,再建立传统Logistic回归模型分析筛查利用情况的影响因素。结果 经健康风险评估模型筛选后,共纳入771名乳腺癌高风险人群,乳腺癌筛查利用率为72.1%。交叉验证选择的最优λ为0.044,经Lasso Logistic回归模型进行变量筛选后纳入的自变量为年龄、文化程度、既往乳腺疾病史和乳房自检行为,赤池信息准则(akaike information criterion,AIC)和贝叶斯信息准则(bayesian information criterion,BIC)分别为762.44和785.68,均低于传统Logistic回归模型(762.73,804.55)。结论 Lasso Logistic回归模型可用于乳腺癌高风险人群筛查利用情况相关因素研究。年龄、文化程度、既往乳腺疾病史和乳房自检行为影响乳腺癌高风险人群的筛查利用情况。  相似文献   

6.
目的 将随机森林算法用于类风湿性关节炎病例对照研究的高维甲基化数据的分析,并探讨应用效果。方法 实例数据来自基因表达数据库(gene expression omnibus,GEO),检索号为GSE42861,包含354名病例、335名对照,本文选取类风湿性关节炎相关基因区域所在的第9号染色体,共纳入2 433个胞嘧啶-磷酸-鸟嘌呤双核苷酸(cytosine-phosphate-guanine pairs of nucleotides,CpGs)位点。利用随机森林计算变量的重要性评分并排序;对排序后的变量进行逐步随机森林过程,寻找最有可能与结果存在关联的变量子集;对降维后的变量子集进行逐步Logistic回归。结果 逐步随机森林筛选出80个重要的CpG位点,Logistic回归模型中有13个位点具有统计学意义。纳入这些位点建立Logistic回归模型,该模型的预测正确率达88.29%。结论 随机森林算法可以大大减少噪音变量,提高检验效能,适用于高维甲基化数据分析。  相似文献   

7.
目的 分析湖南省成年居民常见慢性病共患现状及其影响因素,为制定慢性病防治措施提供依据。方法 采用2018年湖南省慢性病及其危险因素监测数据,该调查采用多阶段分层整群随机抽样的方法,最终选取有效样本7 452人。采用SAS 9.4软件进行Kruskal-Wallis秩和检验,对满足比例优势假定条件的变量采用比例优势logit模型进行分析,对不满足比例优势假定条件的变量采用有序logit模型补充的偏比例优势模型进行分析。结果 7 452名调查对象7种常见慢性病中患0、1、2、3种及以上的加权比例为35.8%、32.9%、20.2%、11.1%,调查人群慢性病加权共患率为31.3%。不同年龄、性别、婚姻状况、文化程度、吸烟情况、饮酒情况、睡眠障碍情况、蔬果和红肉摄入情况人群慢性病患病种数差异均有统计学意义(P<0.01)。比例优势logit模型分析结果显示,与女性相比,男性慢病共患的可能性更大(OR=1.71,95%CI:1.50~1.95);与18~<45岁年龄组相比,45~<60岁年龄组(OR=2.42,95%CI:2.13~2.75)、60~<70岁年龄组(OR...  相似文献   

8.
目的探讨随机森林模型和决策树模型在肝硬化并发上消化道出血患者预后评估中的应用。方法利用logistic回归方法从肝硬化住院患者病历资料中筛选出与并发上消化道出血有关联的变量;以筛选出的变量作为输入变量,以是否出血作为结局变量,分别建立随机森林、决策树和传统logistic回归模型,通过受试者工作特征曲线(ROC)来评价三种模型的性能。结果 logistic回归、决策树和随机森林模型在测试集中的准确率分别为81.5%、75.1%和88.9%,三种模型的ROC曲线下面积(AUC)分别为0.854、0.720和0.909;在随机森林模型的变量重要性评分中,血糖、胆固醇、血清钾、总蛋白、碱性磷酸酶、尿素氮等指标得分较高,提示这些指标或有临床意义。结论随机森林模型在肝硬化上消化道出血患者的预后评估中具有较高的应用价值。  相似文献   

9.
目的 探索阿尔茨海默病(AD)发病年龄分布特征及其影响因素。方法 基于阿尔茨海默病神经影像学倡议2005-2022年的追踪数据,选取基线认知状态正常(CN)或轻度认知功能障碍(MCI),且随访期间进展成AD者为研究对象。采用单因素分析和多元线性回归探索性别、种族、ApoE ε4基因携带数、家族史、受教育年限和婚姻状况等因素对AD发病年龄的影响。结果 由CN或MCI进展成AD者共405名,基线年龄为(74.0±6.9)岁。AD发病年龄为(76.6±7.5)岁,男性较女性晚1.9岁。多元线性回归分析显示ApoE ε4基因携带数每增加1个,AD发病年龄早0.344岁。基线认知状态为MCI者,其AD发病年龄比CN者早4.007岁。受教育年限对AD发病年龄影响无统计学意义(P>0.05)。结论 携带ApoE ε4基因、基线认知状态为MCI者,AD发病年龄可能更早。  相似文献   

10.
目的了解柳城县吸毒人群艾滋病毒感染特点,为制定进一步的吸毒人群艾滋病防治措施提供依据。方法抽取柳城县辖区内的吸毒者进行调查,比较分析吸毒者的性别、年龄、民族、受教育程度、年收入、婚姻状况。结果共调查286名吸毒者,静脉吸毒率为62.9%,HIV感染率为28.3%。注射吸毒与性别、婚姻状况、职业、吸毒年限、首次吸毒年龄、性行为有关;最近半年共用器具注射吸毒与性别、婚姻状况、教育程度、是否住自己的房子、吸毒年限、性行为、安全套使用情况有关;HIV抗体阳性与婚姻状况、教育程度、是否住自己的房子、吸毒年限、性行为、安全套使用情况有关。结论本地区吸毒人群HIV感染特点多由于共用器具感染引起,且与婚姻状况、教育程度、是否住自己的房子、吸毒年限、性行为、安全套使用有关,另外与性别也有可能存在一定关系,因此在进行HIV防治过程中因对这些特点制定相对应的措施,可能会取得更好的效果。  相似文献   

11.
甘标  朱凯星  许美振 《职业与健康》2014,(17):2442-2444
目的调查广州市海珠区居民高血压的患病现状及其影响因素,为高血压的防制提供依据。方法采用多阶段分层随机整群抽样方法,于2012年对海珠区年满15岁及以上常住居民共6313人进行问卷调查和健康检查(身高、体重、腰围、臀围、血压、血脂等的测量)。描述该地区不同性别、不同年龄的高血压患病率,利用单因素χ2检验和非条件多因素logistic回归模型筛选高血压患病的影响因素。结果高血压粗患病率为25.1%(标化率15.1%)。单因素分析有统计学意义的因素包括性别、婚姻状况、年龄、文化程度、体重指数(BMI)、腰臀比(WHR)、血脂水平、糖尿病、吸烟、咸淡口味和锻炼(P〈0.05)等。logistic回归分析结果显示,年龄、文化程度、脑血管病家族史、BMI、WHR、血脂水平、糖尿病和咸淡口味是高血压的影响因素(P〈0.05),OR值分别为1.089、0.873、1.721、1.753、1.167、1.601、2.016和1.259。结论广州市海珠区15岁及以上居民高血压患病率接近全国居民平均水平,已成为危害居民健康的首要因素。应采取全人群预防与高危人群干预相结合的防治策略,加强对中老年、文化程度低、超重朋巴胖、口味较成、高脂血症和糖尿病人群的健康教育。  相似文献   

12.
目的 对2013—2015年北京市成人被动吸烟现况及其人群特征进行分析,为对该人群制定避免被动吸烟措施提供依据。方法 采用分层4阶段抽样方法抽取北京市≥18岁成年居民进行问卷调查,内容包括基本信息(年龄、性别、家庭所在地、文化程度、婚姻状况、职业等)、吸烟、被动吸烟情况。采用描述流行病学方法进行分析。结果 2013—2015年共调查北京市成年居民11 437人,总吸烟率为28.7%(95%CI:28.0%~29.6%)。不同年龄、性别间吸烟率差异有统计学意义(均P<0.01),18~24岁为10.3%,55岁后达高峰(34.4%)后开始略有下降。8 149名从不吸烟者中定义1和定义2被动吸烟率分别为13.5%、17.2%。不同性别和年龄成年居民被动吸烟率差异均有统计学意义(均P<0.01),女性被动吸烟率明显高于男性;55岁前被动吸烟率随着年龄上升而增加,55岁后开始下降,到75~101岁组最低。被动吸烟率在不同年龄、文化程度、职业、婚姻状况男性居民中差异有统计学意义(均P<0.01),不同年龄、文化程度、职业、城乡、婚姻状况女性居民中差异有统计学意义(均P<0.01)。结论 北京市成年居民被动吸烟率较高,但低于全国及其他地区水平,青中年、女性、个体工商职业人群是被动吸烟的主要人群。  相似文献   

13.
目的 探讨2000-2015年中国≥60岁人群老年期痴呆患病率情况。方法 通过系统检索中国知网数据库、万方数据库、维普中文科技期刊数据库和PubMed等中英文数据库中有关老年期痴呆患病率的研究文献,检索时间为2000-2015年。采用R软件进行Meta分析。结果 共纳入25篇文献,总调查人数为76 980人,其中患者4 295例;经Meta分析,老年期痴呆患病率为5.15%(95%CI:4.21%~6.09%);亚组分析显示,老年期痴呆患病率女性(6.08%)高于男性(4.10%),年龄越大者患病率越高(60~64岁至≥85岁年龄人群老年期痴呆患病率从1.01%升至23.60%),阿尔茨海默病患病率(3.56%)高于脑血管性痴呆患病率(1.11%),文盲人群患病率(8.74%)高于非文盲人群(3.17%),非在婚人群患病率(6.83%)高于在婚人群(3.95%)。结论 中国≥60岁人群老年期痴呆患病率较高,年龄、性别、文化水平和婚姻状况可能影响老年期痴呆的发生。  相似文献   

14.
目的 了解新疆维吾尔自治区阿合奇县居民高血压患病现状,探讨不同特征人群患高血压危险因素,为该地区居民提出有效的慢性病防空措施。方法 选取2020年新疆克孜勒苏柯尔克孜自治州阿合奇县健康检查的居民资料,抽取≥18岁常住居民作为调查对象,统计高血压的患病率,分析阿合奇县居民高血压患病流行情况及其影响因素。结果 共纳入新疆维吾尔自治区阿合奇县≥18岁常住居民健康检查数据24 008份,其中高血压患者共5 502例,总患病率为22.9%,男性患病3 072例(25.8%)高于女性患病2 430例(20.1%);不同性别、年龄、民族、文化程度、职业、婚姻状况、家族史、中心型肥胖、体质指数、锻炼频率、饮食习惯、吸烟状况及饮酒频率的居民高血压患病率比较,差异均有统计学意义(均P<0.05)。多因素logistic回归分析显示,性别、年龄、文化程度、职业、婚姻状况、中心型肥胖、体质指数,锻炼频率及饮食习惯均是人群患高血压的影响因素。结论 阿合奇县高血压患病率处于较低水平,发病与多种因素有关。应加强健康教育力度,普及健康知识,倡导健康生活方式,达到早发现早预防早治疗的目的。  相似文献   

15.
目的 探讨加权随机森林和代价敏感支持向量机模型在慢性心衰死亡风险评估中的应用。方法 利用AUC-RF自变量筛选方法选出与心衰死亡的相关因素,将选出的变量作为输入变量,预后有无死亡作为结局变量构建传统随机森林、支持向量机、logistic回归、加权随机森林和代价敏感支持向量机分类预测模型。结果 AUC-RF筛选出的变量中有中枢系统疾病史、肾功能不全史、心包积液、BMI、中性粒细胞比值、肾小球滤过率、N端前脑钠肽等指标重要度较高,提示这些指标或有临床意义。评价指标有灵敏度、特异度、准确度、G-means、F-measure和AUC值,logistic模型评价指标的中位数分别为:78.46%、63.19%、81.4%、0.6933、0.467和0.7003;加权随机森林评价指标分别为:78.08%、82.74%、85.96%、0.8086、0.4853和0.8109;代价敏感支持向量机评价指标分别为:75.38%、72.49%、88.8%、0.7402、0.4749和0.7940。结论 加权随机森林模型对心衰患者预后死亡预测性能较高,该模型有助于临床医生识别心衰死亡危险因素,具有较高应用价值...  相似文献   

16.
目的分析近三年凤阳县不同人群艾滋病知识与来源途径特征,为探索有针对性的宣传教育提供依据。方法采用整群抽样的方法,抽取凤阳县2011~2013初中、高中、农村居民、城镇居民及流动人口共6 000人进行艾滋病知识、态度、行为和知识来源途径等进行问卷调查。分析艾滋病知识与来源途径变化趋势。结果近三年调查人群艾滋病知识知晓率分别为60.54%、64.33%、71.69%,除高中生外,其他人群知晓率均有上升趋势。各年度不同性别之间艾滋病知晓率有统计学意义(P〈0.05)。调查对象主要知识来源途径为:电视、报刊书籍和网络。不同性别、年龄组和文化程度人群艾滋病知识来源途径的获得率差异均有统计学意义(P〈0.01)。多因素分析显示婚姻状况、知识来源途径数、文化程度等为知晓的促进因素,而性别为阻碍因素。结论应针对不同的人群,采用不同的宣传方式以提高宣传教育的效果。  相似文献   

17.
目的应用随机森林和支持向量机算法处理乳腺癌基因数据,筛选三阴性和非三阴性乳腺癌的差异基因,为临床应用提供更多的参考靶点。方法使用TCGA乳腺癌基因数据,通过t检验和随机森林进行降维处理,然后使用支持向量机、支持向量机递归特征消除法、随机森林进行变量重要性排序,将随机森林和支持向量机与向前变量选择法结合进行模型预测并完成最终变量筛选,通过Holdout验证评价模型效果。结果数据经t检验的FDR降维后剩余18702个基因,经随机森林降维后剩余6326个基因;对降维后经三种方法排序的数据建立预测模型,获得各模型约登指数等评价指标;对排序结果中靠前的基因进行文献搜索,发现大部分基因和三阴性乳腺癌的转移或者预后有关。结论针对高维基因表达数据进行变量选择,使用t检验的FDR进行降维、随机森林对变量进行排序筛选、支持向量机进行预测效果最佳;通过检索重要性排序靠前基因发现大多数与三阴性乳腺癌有关,但某些靠前基因与三阴性乳腺癌无文献研究,建议研究这些基因与三阴性乳腺癌的相关性。  相似文献   

18.
目的 生物学年龄(Biological age, BA)可以更有效的判断个体真正的衰老状态,精准预测BA有助于为老年个体早期制定有针对性的预防措施,目前关于老年人分亚群对生物学年龄与生化指标相关性研究较少。利用机器学习算法计算宁夏地区老年人的生物学年龄,并识别相关生物化学指标分亚群进行分析。方法 纳入2020年宁夏地区老年人健康体检者共4 060名作为研究对象,采集空腹静脉血、尿液检测生物化学指标,利用随机森林(Random Forest, RF)算法筛选与BA相关的生物学指标,计算生物学年龄,并对RF算法的预测精度进行评估。结果 在老年人的不同亚群(低龄、中龄、高龄)中,各年龄段生物学指标在生物学年龄的重要性各有不。研究采用平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)、相关系数(Coefficient of association,R2)进行模型的效能评估。结论 利用随机森林计算老年人生物学年龄并分析相关指标,可以更加精准定位老年人中高危人群及对健康老龄化有一定的指导。  相似文献   

19.
苟玉婷  蒙艺 《现代预防医学》2021,(21):3889-3892
目的 了解中国成年人肥胖流行现状以及锁定肥胖的高危人群,为肥胖的预防干预工作提供指导。 方法 从2018年中国家庭追踪调查(CFPS2018)提取所需数据,运用SPSS 19.0 统计软件进行统计学处理,肥胖的群体差异检验,等级变量采用秩和检验,二分类变量采用〖XC小五号.EPS;P〗检验;肥胖的影响因素检验采用多因素logistic回归。 结果 研究样本2 854例,肥胖占比7.1%。肥胖患病率在不同教育程度(Z=-2.29,P=0.02)、不同性别(χ2=10.10,P<0.001)以及不同婚姻状况(χ2=5.62,P=0.02)的群体分布有统计学意义。其中,男性及有伴侣的群体是肥胖高危人群。同时,受教育程度、性别和婚姻状况是肥胖的直接影响因素。 结论 积极有效的肥胖干预工作应该:(1)减重资源向男性肥胖倾斜;(2)针对有伴侣的群体开展家庭式的肥胖干预,缓解肥胖的婚姻状况差异;(3)在社区开展健康知识普及活动缓解教育水平不同带来的肥胖差异。  相似文献   

20.
目的 了解广州市2014-2015年人群脊髓灰质炎(脊灰)中和抗体(Neutralizing Antibody,NA)水平,为科学评估疾病发生风险及疫苗免疫效果、及时调整脊灰免疫策略提供依据。方法 采用分层随机抽样方法,从全市6个区抽取0~ 49岁人群,采集静脉血标本,用微量中和试验测定脊灰NA。结果 全市共抽取629人。脊灰Ⅰ、Ⅱ、Ⅲ型抗体阳性率分别为95.55%、90.30%、95.07%,抗体几何平均滴度(Geometric Mean Titer,GMT)分别为1∶67.63、1∶28.22、1∶65.64。不同户籍、性别抗体阳性率差异无统计学意义。不同年龄组、地区、免疫史人群抗体GMT差异有统计学意义。结论 广州市人群对脊灰具有免疫屏障,可有效应对脊灰野病毒的传播并防止脊灰疫苗衍生病毒的循环。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号