首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
目的 基于机器学习算法构建冠心病风险评估模型,并比较极限梯度上升(eXtreme Gradient Boosting,XGBoost)模型和逻辑回归(Logistic Regression, LR)在预测冠心病患病风险中的效能,为冠心病的诊断提供计算机辅助方法。方法 通过对kaggle社区上发布的冠心病数据集进行预处理后,将特征变量纳入logistic和XGBoost模型中,对其查准率、召回率、ROC曲线下面积(AUC)进行对比,以验证模型性能。结果 XGBoost模型相对于传统的logistic回归模型预测性能更优,其中,年龄、性别、血糖水平、身体质量指数和收缩压为冠心病的主要危险因素。结论 冠心病风险预测模型能为冠心病早期预防控制及诊断提供参考依据。  相似文献   

2.
目的:利用统计学和机器学习方法,探究2型糖尿病并发症的影响因素,构建2型糖尿病并发症预测模型,对并发症的发生进行预测,为2型糖尿病并发症的预防和早期筛查提供理论参考。方法:以国家人口健康科学数据中心2009年的2型糖尿病患者数据为研究对象,对性别、年龄、尿常规检查和生化检查等信息进行单因素和多因素logistic回归分析,并构建XGBoost模型,进行2型糖尿病并发症的预测。结果:单因素和多因素Logistic回归模型与XGBoost模型显示,2型糖尿病并发症的发生与14项影响因素具有相关关系,模型预测准确率为82.85%。结论:模型预测的效果良好,具有一定的参考价值。  相似文献   

3.
目的 建立基于机器学习的慢性阻塞性肺疾病(简称慢阻肺)患者合并肺癌风险的预测模型,探索慢阻肺患者罹患肺癌的高风险因素,为早期发现慢阻肺患者肺癌发病风险提供智能预警奠定基础。方法 回顾分析2010年—2021年就诊于大连医科大学附属第二医院的共154例患者,其中慢阻肺组99例,慢阻肺合并肺癌组55例。患者均进行胸部高分辨率电子计算机断层扫描(high resolution computed tomography,HRCT)及肺功能测试。主要分析:(1)两组患者的年龄、体重指数(body mass index,BMI)、吸烟指数等基本信息、实验室检查结果、肺功能及胸部HRCT定量参数之间的差异是否具有统计学意义;(2)使用单因素和二元logistic回归方法分析慢阻肺患者患肺癌的高风险因素指标;(3)使用logistic回归和Gaussian过程等机器学习方法建立慢阻肺患者合并肺癌风险的预测模型。结果 基于统计学和logistic回归方法分析,BMI下降、全肺气肿指数增大、全肺平均密度增高、用力肺活量及凝血酶原时间百分比活动度增加是慢阻肺患者合并肺癌的危险因素。基于慢阻肺患者合并肺癌的机器...  相似文献   

4.
目的 筛选2型糖尿病患者群合并冠心病危险因素并建立风险分类模型,为临床辅助诊断提供有价值的参考.方法 通过重庆医科大学大数据平台收集出院时间为2014年1月1日至2019年12月31日行冠状动脉造影术的2型糖尿病患者944例,根据造影结果分为2型糖尿病合并冠心病715例(T2DM-CAD组)和2型糖尿病非冠心病229例...  相似文献   

5.
 目的 筛选2型糖尿病患者群合并冠心病危险因素并建立风险分类模型,为临床辅助诊断提供有价值的参考。方法 通过重庆医科大学大数据平台收集出院时间为2014年1月1日至2019年12月31日行冠状动脉造影术的2型糖尿病患者944例,根据造影结果分为2型糖尿病合并冠心病715例(T2DM-CAD组)和2型糖尿病非冠心病229例(T2DM组)。采用倾向得分匹配法(Propensity Score Matching,PSM)均衡组间混杂因素的影响,匹配后T2DM-CAD组389例,T2DM组221例。使用单因素分析与Logistic回归筛选冠心病发病的危险因素。采用贝叶斯优化(Bayesian Optimization,BO)算法优化支持向量机(Support Vector Machine,SVM)模型、随机森林(Random Forest,RF)模型、极限梯度上升(eXtreme Gradient Boosting,XGB)模型和Logistic回归模型,并比较4种分类模型的分类性能。结果 共收集缺失值<30%的指标35项,单因素分析筛选出有统计学差异的指标20项。逐步向前Logistic回归筛选出11项危险因素,包括心率、吸烟、糖尿病肾病、血肌酐、甘油三酯、脂蛋白a、白蛋白、总胆红素、谷草转氨酶、糖化血红蛋白和尿糖。基于危险因素建立的分类模型中优化后的RF模型性能在5折交叉验证(F1值=0.711,AUC=0.811) 以及验证集(F1值=0.752,AUC=0.810)中表现最优。结论 建立了参数优化RF模型,可用于判断2型糖尿病患者是否合并冠心病,具有良好性能。  相似文献   

6.
目的基于脑膜瘤患者的术前真实世界临床变量,使用机器学习算法构建术后短期预后不良的预测模型。方法回顾性地收集了2011年9月—2022年3月在同济大学附属第十人民医院神经外科进行手术切除治疗的脑膜瘤患者的临床变量和出院时的格拉斯哥预后评分(Glasgow outcome scale, GOS)。使用GOS评分将患者进行分组,≤3级的患者定义为预后不良。将患者按照7∶3的比例随机分为训练集和验证集,分别使用支持向量机(support vector machines, SVM)、随机森林(random forest, RF)、梯度提升(gradient boosting, GB)、自适应增强(adaptive boosting, AdaBoost)和多层感知器(multilayer perceptron, MLP)算法在训练集上进行建模,使用验证集检验模型的预测能力。针对预测能力较好的模型使用Shapley Additive Explanations(SHAP)算法进行模型解释。结果收集了424个脑膜瘤患者的42种临床特征数据和GOS评分,筛选后有23种临床特征纳入了训练集的机器学习模型构建。基于不同算法的机器学习模型在验证集中的预测能力表现不同,AdaBoost的表现最优,曲线下面积为0.925。SHAP算法提示在AdaBoost模型中,脑膜瘤最大径、入院时血压、术前的钙离子浓度、血尿素浓度和血肌酐浓度对模型决策的贡献度较大,提示这些术前临床特征与脑膜瘤患者术后短期预后存在相关性。结论本研究使用真实世界大数据,构建了一种可解释的基于AdaBoost算法的机器学习模型,在预测脑膜瘤患者术后短期不良结局上具有良好的效果。  相似文献   

7.
预测药物在血浆中的蛋白结合率,有助于了解药物的药代动力学特征,对药物发现的早期研究有重要的参考价值.本研究收集了 2452个临床药物的血浆蛋白结合率信息,用Molecular Operating Environment(MOE)和Mordred两种软件计算分子描述符,将算得的分子描述符作为模型的输入特征.使用极端梯度提...  相似文献   

8.
目的 基于机器学习法构建异位妊娠发生风险预测模型.方法 选取308例异位妊娠患者和605例宫内妊娠孕妇作为研究对象,并按照7:3的比例将其分为训练集(639例)和测试集(274例).应用基于机器学习的逻辑回归、线性判别分析、多元自适应回归、K近邻算法和支持向量机算法构建异位妊娠发生风险的预测模型.比较上述5种算法构建的...  相似文献   

9.
目的 基于机器学习算法构建老年冠心病风险评估模型,并比较逻辑回归(logistic)和极限梯度上升(eX-treme Gradient Boosting,XGBoost)模型在社区老年人群中预测冠心病风险的效能,以期为老年人冠心病防治提供更高效的健康管理方法.方法 抽取2019年浦东地区47家社区卫生服务中心的8万条老...  相似文献   

10.
目的:基于粒子群优化算法(PSO)的XGBoost模型(PSO-XGBoost)预测中老年患者经皮肾镜碎石术(PCNL)后的泌尿系统结石残留情况。方法:选取2014年1月至2018年12月在某三级甲等医院接受PCNL治疗的596例中老年肾结石患者为研究对象。将数据集按7:3的比例随机分为训练集和测试集,建立PSO-XGBoost模型,以准确度、精准度、召回率、F1值和ROC曲线下面积(AUC)等指标评估模型性能。结果:PSO-XGBoost模型预测PCNL术后泌尿系统结石残留的准确度、精准度、召回率、F1值和AUC均优于支持向量机、近邻算法、决策树和BP神经网络模型。结论:PSO-XGBoost模型可更快、更准确地预测中老年患者PCNL术后是否有泌尿系统结石残留,为制定术后个性化治疗、护理方案提供参考。  相似文献   

11.
目的/意义 分析国外基于机器学习构建住院患者跌倒风险预测模型的研究现状,为我国相关研究提供参考。方法/过程 检索PubMed和Web of Science数据库中2017—2022年基于机器学习构建住院患者跌倒风险预测模型的文献,从研究角度、数据来源、构建方法、模型验证等方面梳理分析文献。结果/结论 国外相关研究角度独特,数据海量、采集周期长,采用多种机器学习方法建模,且模型验证方法多样。国外同行经验可供我国护理研究者合理借鉴。  相似文献   

12.
目的 利用机器学习算法构建原发性高血压并发脑梗死的风险预测模型,并探索原发性高血压患者并发脑梗死的危险因素.方法 收集重庆市7家医院2015年1月1日至2019年12月31日确诊的1478例原发性高血压并发脑梗死患者及2826例无脑梗死的原发性高血压患者的42项临床指标资料.采用单因素分析筛选输入指标,将4304名患者...  相似文献   

13.
目的:利用逻辑回归分析识别冠心病发作的危险因素,使用常见机器学习算法构建冠心病风险预测模型,为冠心病的早期预防与筛查提供理论参考。方法:通过对Kaggle发布的冠心病数据进行预处理和特征筛选后进行逻辑回归分析识别主要危险因素,选用逻辑回归、支持向量机、线性判别分析、决策树和随机森林5种常见机器学习算法进行冠心病发病预测。结果:性别、年龄、平均每日吸烟量、总胆固醇水平、收缩压和血糖水平是10年内冠心病发作的主要危险因素。选用的5种机器学习算法准确率与稳定性良好。与基于统计的线性判别分析相比,决策树与随机森林并未表现出明显的优越性。结论:机器学习技术适用于冠心病发作风险的预测,能够为冠心病的防控提供参考依据。  相似文献   

14.
目的 探索可解释机器学习方法在疾病预测中的应用。方法 本研究以脓毒血症死亡风险预测为例,从重症监护医学数据库(Medical Information Mart for Intensive Care, MIMIC)-Ⅳ中采集符合纳排标准的19 903例脓毒血症(sepsis-3)患者的临床数据,利用决策树、逻辑回归、随机森林、XGBoost、轻量梯度提升机(light gradient boosting machine,LightGBM)模型分别构建脓毒血症死亡预测模型。在此基础上,利用全局可解释方法(特征重要性、部分依赖图、个体条件期望、全局代理模型)和局部可解释方法(局部代理模型和Shapely值)对复杂机器学习模型进行解释,探索影响脓毒血症患者预后的危险因素。结果 解释性差的机器学习模型的预测性能[模型LightGBM、随机森林、XGBoost的曲线下面积(area under curve,AUC)值分别为0.913、0.892、0.872]高于具有内在解释性的模型(逻辑回归模型AUC=0.779,决策树模型AUC=0.791),并利用全局解释性方法、局部可解释性方法两种类型的解释方法对机器学习模型决策过程进行解释。结论 利用全局解释性方法可以解释在整个特征空间内机器学习模型的响应趋势,利用局部可解释性方法可以解释机器学习模型对特定病例的决策过程。  相似文献   

15.
目的 基于分化型甲状腺癌(DTC)患者的临床资料及放射学参数,通过机器学习算法构建放射性碘治疗(RAI)疗效的预测模型。 方法 选取2015年12月至2020年12月于山东大学第二医院核医学科接受RAI治疗的1 642例DTC患者为研究对象,在RAI治疗结束的6个月后评估其治疗疗效,筛选与疗效相关的核心特征进行机器学习建模。将研究对象按就诊时间(2019年7月)划分为训练集(n=973)和验证集(n=669),于训练集中利用Logistic、随机森林、支持向量机、Adaboost 4种方法进行模型构建,利用受试者工作特征曲线下面积(AUC)、灵敏度和特异度评估模型的性能,绘制校准曲线及决策曲线评估模型的准确度和临床受益性,并在验证集中评估模型外部稳定性。 结果 4种模型的预测性能较高,稳定性较好,预测精度和净收益高于目前临床常规应用的肿瘤-淋巴结-转移(TNM)分期和复发风险分层。Logistic模型表现最佳,其AUC在训练集中为0.827、验证集中为0.869。 结论 基于机器学习构建的术后RAI治疗疗效预测模型有较高的预测性能,由此构建的列线图可实现个体化精准预测。  相似文献   

16.
以首都儿科研究所附属儿童医院急诊患者就诊数据为基础,设计并提取19个就诊时间相关变量,构建6种不同的机器学习模型,用于儿科急诊就诊患者候诊时间预测,经检验预测模型表现良好。本研究有助于医院动态分配医疗资源,缓解急诊科拥挤程度,提高患者就诊满意度。  相似文献   

17.
目的 运用机器学习算法构建原发性高血压并发视网膜病变风险的预测模型。方法 选取2020年3月至2022年3月在中国人民解放军联勤保障部队第908医院体检中心确诊的原发性高血压患者402例,其中原发性高血压并发视网膜病变患者201例(观察组),单纯原发性高血压患者201例(对照组)。收集2组患者34个相关研究指标作为原发性高血压并发视网膜病变的可能影响因素,并采用单因素分析、Spearman相关系数及最小绝对收缩和选择算子方法(Lasso回归)筛选变量后,将所有研究对象按7:3随机分为训练集和测试集,在训练集中运用机器学习算法构建支持向量机(SVM)、K邻近(KNN)、分类决策树(DecisionTree)、随机森林(RF)、极端随机树(ExtraTrees)、XGBoost及LightGBM预测模型,在测试集中进行验证。运用准确率、AUC值、敏感性及特异性对模型进行评价。结果 经单因素分析、Spearman相关系数及Lasso回归筛选出19个变量,构建了SVM、KNN、DecisionTree、RF、ExtraTrees、XGBoost、LightGBM预测模型。其中综合性能最高的为E...  相似文献   

18.
背景 急性肾损伤(acute kidney injury,AKI)在重症监护室(intensive care unit,ICU)发病率高,尤其对于老年人群更是如此。寻找ICU老年AKI的危险因素,建立早期预测模型,有助于临床决策。目的 采用机器学习的方法建立ICU老年患者AKI的早期预测模型。方法 收集2018年1月-2021年12月入住解放军总医院第一医学中心重症医学科年龄≥65岁的老年患者的临床资料(80%用于训练集,20%用于测试集)。以是否发生AKI为结局变量,纳入人口统计学、生命体征、实验室检查、合并症等55个预测变量,通过多个机器学习模型(包含决策树、随机森林、逻辑回归、XGBoost、LightGBM)开发多变量预测模型。利用受试者工作特征曲线(ROC曲线)下面积(area under curve,AUC)、准确性、敏感度、特异度、F1值评估模型性能,选出最优模型。结果 最终纳入968例老年患者,其中共304例患AKI(占31.4%)。LightGBM模型的AUC最高,为0.887,决策树、随机森林、逻辑回归、XGBoost模型的AUC分别为0.795、0.850、0.8...  相似文献   

19.
目的:利用机器学习算法预测影响脑卒中患者日常生活自理能力(activities of daily living,ADL)的风险因素,为其 ADL管理决策提供参考。方法:对2015年1月—2019年2月在南京医科大学附属第一医院康复医学中心治疗的423例脑卒中患者进行回顾性分析。根据Barthel指数(Barthel index,BI)评定量表,将患者分为ADL较好组(BI≥60分)和ADL较差组(BI<60分),并进行数据预处理。采用共线性诊断及最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)筛选特征变量。选择逻辑回归、支持向量机、随机森林(random forest,RF)、极限梯度提升及K最近邻5种机器学习算法进行预测建模,十倍交叉验证后,使用受试者工作特征曲线、受试者工作特征曲线下面积(area under curve,AUC)、精确召回率曲线、精确召回率曲线下的面积(area under the precision recall curve,PRAUC)、准确率、灵敏度、特异度分别对模型进行综合评估,引入 Shapley加性解释(Shapley additive explanation,SHAP)对最优机器学习模型进行可解释化处理。结果:经LASSO回归分析后,确定16个特征变量用于构建机器学习模型。RF模型具有最高的AUC(0.74)、PRAUC(0.64)、准确率(0.97)、灵敏度(0.75)和特异度(0.97)。SHAP 模型解释性分析显示,对 ADL 贡献度前 5 的特征中,Brunnstrom 分期(下肢)的影响最为显著,其次是 Brunnstrom分期(上肢)、D-二聚体、血清白蛋白水平及年龄。结论:RF模型预测脑卒中患者ADL的效能最优,为脑卒中患者 ADL管理决策提供了有价值的参考。  相似文献   

20.
目的:应用机器学习中的相关算法构建一个风险预测模型,预测急性心肌梗死患者出院后是否会有严重不良事件发生。方法:采用机器学习中的随机森林算法构建预测模型,用ROC曲线评估模型预测性能。结果:通过随机森林算法建立的风险预测模型,准确预测了急性心梗患者出院后是否发生严重不良事件。结论:该模型可以为实际临床急性心梗预后康复提供参考依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号