首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 609 毫秒
1.
目的 基于电子病历系统结构化信息创建的临床数据库,通过机器学习算法进行数据预处理和特征选择,构建预测心力衰竭患者住院期间死亡和6个月内死亡预测模型,从而辅助识别高危患者,为治疗干预提供指导。方法 以PhysioNet网站上公开的一个数据集为研究数据来源,该数据集纳入了2016年12月至2019年6月在四川省自贡市第四人民医院住院的心力衰竭患者临床信息,利用Python进行数据预处理、特征选择,并构建Logistic回归及随机森林预后预测模型,以增大ROC曲线下面积(area under curve,AUC)为目标优化模型,并在测试集中以AUC、准确率、精确度、召回率和F1分数综合验证模型预测效果。结果 通过数据预处理共获得146项特征用于住院期间心力衰竭死亡预测建模,155项特征用于6个月内心力衰竭死亡预测建模,基于随机森林的建模方法用于住院期间死亡效果最佳,AUC为0.893 1;在6个月内死亡预测上,结合LASSO和RFE进行特征选择,筛选出包括出院去向(健康护理机构、家庭或未知)、入院病房(全科)、出院科室(心血管科)、Killip分级(Ⅰ、Ⅱ和Ⅲ级)、心肌梗死情况以及充血性心力衰竭情况共10个特征进行Logistic回归建模,AUC达到0.833 6,与基于全部特征进行随机森林特征效果(AUC=0.846 0)相当。结论 本研究探索出一套针对电子病历系统结构化临床数据进行数据预处理、特征工程、机器学习算法建模并验证模型的方法,利用真实世界数据构建兼顾预测准确性和高危个体检出率的心衰预后预测模型。  相似文献   

2.
目的 将贝叶斯网络与Cox模型相结合,预测包含缺失协变量的个体的肺癌发病风险。 方法 研究使用的数据来自于英国生物样本库,采用单因素Cox回归分析筛选与肺癌发病相关的预测因素;基于识别出的肺癌潜在预测因素,应用上述联合模型建立个体化肺癌风险预测模型;从鉴别和校准两方面评价模型的预测性能。 结果 建立的预测模型具有较好的鉴别和校准能力,训练和验证队列的AUC分别为0.854(95%CI:0.836~0.870)和0.885(95%CI:0.871~0.897)。 结论 本研究构建了基于贝叶斯网络和Cox模型的肺癌风险预测模型;该模型具有良好的鉴别和校准能力,能有效预测肺癌发病高危人群;联合模型在存在缺失预测因子的情况下提供了一种有效的风险预测方法,可为肺癌预防控制提供理论支撑。  相似文献   

3.
目的 探讨基于可解释性心脏磁共振(CMR)参数的机器学习模型对儿童心肌炎患者预后的预测价值。 方法 回顾性收集2012年9月至2017年11月临床诊断为儿童心肌炎患者45例,其中男28例,女17例,4~16岁,平均(9.8±3.4)岁。根据随访过程中是否出现心血管不良事件(ACE),将患者分为预后不良组(n=18例)和预后良好组(n=27例)。所有患者于住院治疗后进行CMR扫描,获取心功能、心肌应变、首过灌注及延迟强化(LGE)相关方面共206个可解释性的CMR参数。利用MATLAB分类学习应用程序对参数进行训练,挑选精度最高的模型作为预测模型。采用受试者工作特征曲线(ROC)对模型的预测效能进行评估。 结果 提取出14个可解释性的CMR参数,挑选其中无显著相关性的参数构建组合参数。单一参数中, 美国心脏协会(AHA)分段法中的第7节段最大信号强度百分比(SI %)预测性能最佳,曲线下面积(AUC)、预测敏感性和特异性分别为0.790、0.667和0.833;组合参数达到了最高的预测性能,AUC、预测敏感性和特异性分别为0.940、0.750和0.889。 结论 根据可解释性的CMR参数建立的机器学习模型对儿童心肌炎患者预后的预测具有良好价值,且在预后评估中组合参数比单一参数预测性能更高。  相似文献   

4.
目的: 通过生物信息学分析构建肺腺癌蛋白质预后模型。方法: 从癌症蛋白质组图谱和肿瘤基因组图谱数据库分别获取肺腺癌的蛋白质数据和相应的临床数据,通过单因素 Cox 回归分析和逐步回归分析筛选与肺腺癌预后相关的蛋白质,建立预后风险模型;使用多因素 Cox 回归对其进行预后风险评分分析,计算曲线下面积(AUC)评价模型的稳健性和准确性。结果: 筛选出3个与生存显著相关的蛋白质用于预后模型的构建;预后模型风险评分与预后显著相关(P<0.001),可作为评估患者预后的独立风险因子;预后模型AUC=0.710,说明模型具有稳定的特异性和灵敏度。结论: 该预后模型能准确预测肺腺癌患者的总体生存率,有助于临床早期识别预后不良的肺腺癌患者并对其进行早期干预治疗,对提高肺腺癌的生存率具有重要意义。此外,筛选出3个促进肺腺癌进展的风险蛋白有望成为肺腺癌治疗的新靶点。  相似文献   

5.
目的 探究使用Yolov5网络检测分类Modic改变(MCs)的性能,与基于Yolov5和Resnet34网络自动检测分类MCs方法进行比较。 方法 回顾性分析2020年6月至2021年6月接受MRI诊断且符合纳入和排除标准的MCs患者140例,其中男55例,女85例,25~89岁,平均(59.0±13.7)岁。在完成MRI影像的标注工作后,将标注后的MRI影像导入深度学习模型训练,使用医学数据常规增强和Mosaic数据增强进行数据扩充,降低训练数据集过少的因素;利用迁移学习的方法,解决网络在小数据集上过拟合的问题。采用平均精度(AP)、平均精度均值(mAP)、召回率、精确率、F1值等性能指标对两种方法诊断MCs进行评估并比较。 结果 Yolov5网络检测分类MCs时,mAP、召回率、精确率和F1值分别达到87.56%、82.05%、89.44%和0.845;Yolov5和Resnet34网络自动检测分类MCs时,召回率、精确率和F1值分别达到88.41%、88.68%和0.885。 结论 Yolov5网络可以帮助诊断腰椎MCs,使用Yolov5和Resnet34网络检测分类MCs时,模型诊断MCs的性能提升,进而表明Yolo系列网络可以为智能辅助诊断技术在脊柱领域的应用提供可能性。  相似文献   

6.
目的 探索重症老年患者(≥60岁)急性肾损伤早期连续风险预测的可行性,促进机器学习在临床决策支持中的应用。具体实现以6 h为单位连续预测重症老年患者在未来48 h的急性肾损伤发病风险,并探索可实现何种程度的早期预测,以及比较当前数据和累积数据的预测效果。方法 基于重症监护医学信息数据库(Medical Information Mart for Intensive Care,MIMIC)-Ⅲ,应用逻辑回归、支持向量机、随机森林和轻量梯度提升机(light gradient boosting machine,LightGBM)建模预测。基于曲线下面积(area under curve,AUC)、精确度和召回率进行结果评估。结果 共11 261条重症老年患者记录纳入研究。基于当前6 h数据预测时,LightGBM的AUC达0.845~0.925,随机森林、支持向量机和逻辑回归的最高AUC均低于0.73。基于入重症监护病房最初6 h数据,LightGBM效果最好,AUC达0.845。LightGBM应用当前数据比累积数据获得更高的AUC、精确度和召回率,随机森林、支持向量机和逻辑回归反之。结论 利用LightGBM对重症老年患者进行急性肾损伤早期连续预测切实可行,仅基于重症监护病房前6 h数据的预测结果就可以达到24 h积累数据的预测效果。此外,不同模型对数据的接收能力和适用性不同,LightGBM在当前数据中表现优于累积数据,其他3种模型在累积数据中表现优于当前数据。  相似文献   

7.
目的 利用信息库资料探讨趋化因子受体家族对肾透明细胞癌(ccRCC)预后的预测价值。 方法 下载并分析癌症基因组图谱(TCGA)的基因表达数据,筛选CC趋化因子受体(CCR)亚基因家族在正常组织与ccRCC组织中的差异表达基因。采用COX回归分析构建预后模型并进行相关功能学分析。 结果 从 TCGA 数据库下载包括539例ccRCC组织和72例正常组织的基因转录组数据,筛选出11个差异表达的CCR家族基因。通过多因素Cox回归分析得到 2个(CCR3与CCR10)与ccRCC预后相关的CCR基因,并以此构建预后模型。根据模型风险评分的中位值将训练集样本分为高风险组(n=184)与低风险组(n=197)。Kaplan-Meier生存分析结果显示,低风险组总生存率高于高风险组,差异有统计学意义(P<0.001)。 结论 本研究构建的CCR基因预后模型可较好地评估ccRCC患者的预后并指导其个体化治疗。  相似文献   

8.
目的 筛选乳腺癌中免疫关联长链非编码RNA(lncRNA),并构建乳腺癌预后风险评估模型,探索预后相关因素。 方法 从UCSC Xena(https://xena.ucsc.edu/)、TCGA、immport(https://www.immport.org/home)官网分别下载乳腺癌患者的测序数据、临床信息以及免疫基因集,并将这些数据进行整理和清洗,最终得到乳腺癌免疫关联lncRNA表达矩阵及临床信息。利用单因素Cox和多因素Cox回归分析筛选出与预后相关的免疫关联 lncRNA,用于构建预后风险评分。根据风险评分的中位数,将患者分为高风险组和低风险组,利用Kaplan-Meier(K-M)生存分析、受试者工作特征曲线(ROC)分析及独立预后因素评估对模型进行评价,并将此模型联合其他临床因素构建列线图,对乳腺癌患者进行生存率预测。 结果 最终确定10个免疫关联 lncRNAs 用来构建风险评分模型;高风险组较低风险组预后差;风险评分可作为乳腺癌患者的独立预后因素;列线图的C指数(CI)为0.751,校准图显示预测值与实际观测值一致性较好。 结论 由10个免疫关联lncRNAs 组成的风险评分模型可用于评估乳腺癌患者的预后,由此建立的列线图可进一步预测乳腺癌患者的生存率。  相似文献   

9.
目的 探索可解释机器学习方法在疾病预测中的应用。方法 本研究以脓毒血症死亡风险预测为例,从重症监护医学数据库(Medical Information Mart for Intensive Care, MIMIC)-Ⅳ中采集符合纳排标准的19 903例脓毒血症(sepsis-3)患者的临床数据,利用决策树、逻辑回归、随机森林、XGBoost、轻量梯度提升机(light gradient boosting machine,LightGBM)模型分别构建脓毒血症死亡预测模型。在此基础上,利用全局可解释方法(特征重要性、部分依赖图、个体条件期望、全局代理模型)和局部可解释方法(局部代理模型和Shapely值)对复杂机器学习模型进行解释,探索影响脓毒血症患者预后的危险因素。结果 解释性差的机器学习模型的预测性能[模型LightGBM、随机森林、XGBoost的曲线下面积(area under curve,AUC)值分别为0.913、0.892、0.872]高于具有内在解释性的模型(逻辑回归模型AUC=0.779,决策树模型AUC=0.791),并利用全局解释性方法、局部可解释性方法两种类型的解释方法对机器学习模型决策过程进行解释。结论 利用全局解释性方法可以解释在整个特征空间内机器学习模型的响应趋势,利用局部可解释性方法可以解释机器学习模型对特定病例的决策过程。  相似文献   

10.
目的 构建体检者2型糖尿病发病风险预测模型。 方法 选择2005年1月至2010年12月在山东大学附属省立医院、山东大学附属千佛山医院体检中心体检的非糖尿病者16 715人,随机选取70%体检者为训练组,用于建立Cox预测模型,逐步选择法进行变量选择,使用十折交叉验证法检验模型的稳定性,根据预后指数制定风险分级;剩余30%的体检者为校验组,对模型进行组外验证,再次评价模型效果。 结果 观察期间共新发生2型糖尿病858例,发病密度为15.14‰。最终纳入模型的变量包括年龄、体质量指数、空腹血糖、甘油三酯、是否患高血压以及白细胞自然对数;训练组ROC曲线下面积为0.742(95%CI: 0.732~0.752),校验组ROC曲线下面积为0.760(95%CI: 0.748~0.772)。 结论 建立的2型糖尿病风险预测模型在体检者中有较好的预测能力。  相似文献   

11.
目的:基于随机森林和XGBoost两种机器学习算法建立预测模型,探讨其对肾结石患者行输尿管软镜碎石术(flexible ureteroscopic lithotripsy,fURL)后早期结石清除率(stone-free rate, SFR)的预测价值。方法:回顾性分析201例行fURL的肾结石患者的临床资料,根据术后是否达到结石清除标准,将患者分为结石清除组和结石残留组。比较两组患者年龄、体重指数(body mass index,BMI)、结石数目、结石体积、结石密度和肾积水等因素的差异。对于肾下盏结石,需测量肾脏解剖相关指标,包括肾盂漏斗部夹角、肾下盏宽度、肾下盏长度及肾盂肾下盏高度。将上述潜在影响因素分别纳入随机森林和XGBoost算法建立预测模型,绘制受试者工作曲线,检验模型预测价值。前瞻性收集71例患者的临床资料对模型进行外部验证。结果:201例fURL手术均顺利完成,一期手术早期SFR为61.2%。利用随机森林和XGBoost算法建立预测模型并得到不同变量预测重要性评分,随机森林模型和XGBoost模型曲线下面积均为0.77。应用71例样本对模型进行外部验证结果显示,随机森林模型对检测样本的预测总准确率、特异度及灵敏度分别为74.6%、82.6%和60.0%,XGBoost模型对检测样本的预测总准确率、特异度及灵敏度分别为80.3%、87.0%和68.0%。在两种模型中,预测重要性评分排名前四位的变量均为结石体积、平均结石密度、最大结石密度和BMI。结论:基于随机森林和XGBoost算法建立的机器学习模型可准确预测肾结石患者fURL术后早期结石清除状态,有利于术前评估及临床决策。结石体积、平均结石密度、最大结石密度和BMI可能是影响肾结石fURL术后SFR的重要预测因素。  相似文献   

12.
目的 探讨胶质瘤及瘤周水肿(PTE)MRI影像组学在评估肿瘤复发中的价值。 方法 选取山东大学齐鲁医院2013年1月至2020年12月经术后病理证实的胶质瘤患者120例,包括55例复发和65例无复发患者,根据术前T2WI和T1WI增强图像对肿瘤和PTE进行三维容积感兴趣区勾画,并按照8∶2的比例分为训练组和验证组,分析两者及联合的组学特征与肿瘤复发的关系。使用受试者工作特征(ROC)曲线下面积(AUC)与准确性矩阵,比较和评价不同影像组学模型的训练结果。 结果 对于PTE,K临近法(KNN)分类器预测效能最好:训练组AUC值、敏感度、特异度分别为0.910、0.84、0.88,验证组分别为0.916、0.82、0.93。对于肿瘤,逻辑回归(LR)分类器预测效能最好:训练组AUC值、敏感度和特异度分别为0.777、0.69、0.67,验证组分别为0.758、0.82、0.92。当肿瘤+PTE联合时,逻辑回归(LR)分类器预测效能最好:训练组AUC值、敏感度、特异度为0.977、0.88、0.89,验证组则为0.841、0.73、0.83。 结论 胶质瘤PTE和肿瘤影像组学特征在预测胶质瘤术后复发方面具有一定的价值,其中PTE的KNN组学模型效能最佳。  相似文献   

13.
目的: 基于集成学习算法建立患者再入重症监护病房(intensive care unit, ICU)的风险预测模型,并比较各个模型的预测性能。方法: 使用美国重症医学数据库(medical information mart for intensive care,MIMIC)-Ⅲ,根据纳入、排除标准筛选患者,提取人口学特征、生命体征、实验室检查、合并症等可能对结局有预测作用的变量,基于集成学习方法随机森林、自适应提升算法(adaptive boosting, AdaBoost)和梯度提升决策树(gradient boosting decision tree, GBDT)建立再入ICU预测模型,并比较集成学习与Logistic回归的预测性能。使用五折交叉验证后的平均灵敏度、阳性预测值、阴性预测值、假阳性率、假阴性率、受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUROC)和Brier评分评价模型效果,基于最佳性能模型给出重要性排序前10位的预测变量。结果: 所有模型中,GBDT (AUROC=0.858)优于随机森林(AUROC=0.827),略好于AdaBoost (AUROC=0.851)。与Logistic回归(AUROC=0.810)相比,集成学习算法在区分度上均有较大的提升。GBDT算法给出的变量重要性排序中,平均动脉压、收缩压、舒张压、心率、尿量、血肌酐等变量排序靠前,相对而言,再入ICU患者的心血管功能和肾功能更差。结论: 基于集成学习算法的患者再入ICU预测模型表现出较好的性能,优于Logistic回归。使用集成学习算法建立的再入ICU风险预测模型可用于识别再入ICU风险高的患者,医务人员可针对高风险患者采取干预措施,改善患者的整体临床结局。  相似文献   

14.
目的:基于三种机器学习算法——支持向量机(support vector machine,SVM)、分类回归树(classification and regression tree,CART)和随机森林(random forest,RF),构建重症监护室(intensive care unit,ICU)患者的ICU入住时长(length of ICU stay,LOS-ICU)分类预测模型,并与传统的定制版简化急性生理功能评分Ⅱ(simplified acute physiology score Ⅱ,SAPS-Ⅱ)模型进行比较。方法:使用美国大型重症医疗数据库(medical information mart for intensive care Ⅲ,MIMIC-Ⅲ),以ICU患者是否发生超长LOS-ICU(prolonged LOS-ICU,pLOS-ICU)作为结局指标,构建定制版SAPS-Ⅱ、SVM、CART和RF模型,使用递归特征消除法进行特征选择,基于五折交叉验证找出最佳预测模型。模型的预测性能评价指标包括Brier评分、受试者工作特征(receiver operation characteristic,ROC)曲线下面积(area under the ROC curve,AUROC)和估计校准度指数(estimated calibration index,ECI),模型性能指标之间的比较使用双侧t检验。使用本研究中预测性能最好的模型识别出来的各预测变量重要性排序结果,给出重要性排序前五位的预测变量。结果:最终共纳入40 200例ICU患者,发生pLOS-ICU的患者23.7%。其中,男性患者57.6%,患者平均年龄为(61.9±16.5)岁。五折交叉验证结果显示,相比于定制版SAPS-Ⅱ模型,三种机器学习模型的预测性能在各个指标上均有明显提升,且差异均具有统计学意义(P<0.01)。其中,RF模型在综合预测性能、区分度与校准度三个方面均表现最优,其Brier评分、AUROC和ECI分别为0.145、0.770和7.259。校准曲线结果显示,在高pLOS-ICU发生风险的ICU人群中,RF模型倾向于略微高估其风险;在低pLOS-ICU发生风险的ICU人群中,RF模型倾向于略微低估其风险。基于性能最优的RF模型识别的对pLOS-ICU预测最重要的五个变量依次为年龄、心率、收缩压、体温和动脉血氧分压与吸入氧分数之比。结论:基于机器学习方法构建ICU患者的pLOS-ICU预测模型相比于传统的定制版SAPS-Ⅱ模型,预测性能均有明显提升,其中,基于RF方法的pLOS-ICU预测模型性能最优,具有很大的临床应用潜力。  相似文献   

15.
宫峰  马胜银 《蚌埠医学院学报》2021,46(12):1737-1740
目的探讨慢性肾功能衰竭行腹膜透析(PD)病人发生医院感染的危险因素。方法回顾性分析行PD的慢性肾功能衰竭病人193例临床资料,按照是否发生医院感染分为感染组与非感染组,分析医院感染情况及病原菌分布情况,比较2组的临床资料,采用多因素logistic分析PD病人发生医院感染的危险因素。结果42例(21.76%)发生医院感染,其中呼吸道感染17例(8.81%),泌尿道感染10例(5.18%);共培养出病原菌56株,其中革兰阴性菌44株(78.57%),革兰阳性菌5株(8.93%)。感染组与未感染组年龄、住院时间、透析时间、低蛋白血症、体质量指数(BMI)、贫血、心功能不全、血液透析充分、应用中心静脉导管差异均有统计学意义(P < 0.05~P < 0.01);年龄、住院时间、透析时间、低蛋白血症、BMI、贫血、心功能不全、血液透析充分、应用中心静脉导管是引起病人发生医院感染的独立危险因素(P < 0.01)。结论慢性肾功能衰竭行PD病人医院感染以呼吸道感染和肺炎克雷伯菌较为常见,临床需要警惕高龄、长时间住院和透析、低蛋白血症、贫血、心功能不全的PD病人,预防医院感染的发生。  相似文献   

16.
目的 探讨基于首次平扫CT的影像组学列线图模型对幕上自发性脑出血患者90 d功能状态的预测价值。 方法 回顾性分析幕上自发性脑出血(sICH)患者376例,根据90 d改良Rankin量表(mRS)评分结果将患者分为预后不良组121例(mRS评分为4~6分)和预后良好组255例(mRS评分为0~3分)。从首次平扫CT提取影像组学特征,计算影像组学评分(Rad-score)并构建影像组学模型。分析筛选临床因素用于构建临床模型,并结合Rad-score构建列线图模型。分析比较上述3种模型的预测效能。 结果 最终筛选出20个特征用于构建影像组学模型,临床模型由年龄(OR=1.045,95%CI: 1.023~1.066)、格拉斯哥昏迷评分GCS≤8(OR=4.128,95%CI: 2.161~7.887)、血肿破入脑室(OR=3.071,95%CI: 1.744~5.408)和血肿体积>30 mL(OR=5.802,95%CI: 3.327~10.117)构成。在训练集,列线图模型的曲线下面积(0.892)高于临床模型(0.814)及影像组学模型(0.862),差异有统计学意义(Z值分别为3.356、2.231,P值分别为0.001、0.026)。 结论 列线图模型可有效预测幕上sICH患者的90 d预后,有助于临床决策。  相似文献   

17.
目的 探讨腹膜透析(peritoneal dialysis, PD)患者存在的营养不良-炎症状态-心血管疾病(动脉硬化)(malnutrition-inflammation-atherosclerosis,MIA)综合征与认知功能恶化的关系。方法 采用前瞻性纵向队列研究,于2013年3—11月,对符合入选标准的腹膜透析患者完成总体和特定认知功能测定,结合基线是否有心血管疾病病史,白蛋白≤35 g/L,超敏C-反应蛋白(high-sensitive C-reactive protein, hs-CRP)≥3 mg/L,将患者分为MIA0(全为否)、MIA1(1项为是)、MIA2(≥2项为是)3个组,并于随访2年后对患者重复认知功能测定。采用卡方检验、单因素方差分析、Kruskal-Wallis H 检验比较基线及2年后组间一般资料、生化指标,以及总体和特定认知功能参数。进一步的组间多重两两比较采用Bonferroni方法调整显著性值。以每一项总体和特异认知功能得分差值为因变量,以年龄、性别、教育水平、体重指数、抑郁分数、糖尿病、血钠和MIA(MIA0为对照,MIA1和MIA2为哑变量)为自变量,以多元线性回归分析影响认知功能恶化的因素,每一项认知领域的分析都以其相应的基线参数进行校正。结果 随访2年后,认知障碍(cognitive impairment, CI)的发生率从20.0%上升到24.7%。MIA2和MIA1组修正的简易智力状态检查量表(the modified mini-mental state examination, 3MS)得分下降绝对值明显高于MIA0组(-3.9±12.0 vs. 1.1±6.7, P<0.01;-2.3±11.8 vs. 1.1±6.7, P<0.05),而特定认知功能测定包括执行功能(连线试验A和B,P=0.401,P=0.176)、即时记忆(P=0.437)、延迟记忆(P=0.104)、视觉空间能力(P=0.496)和语言能力(P=0.171)的变化3组间差异无统计学意义。经多元线性回归分析,年龄、教育水平、糖尿病、抑郁等均是一项或多项认知功能恶化的危险因素,存在MIA综合征一项因素是整体认知恶化的独立危险因素(P=0.022),存在MIA综合征两项及以上因素者不仅是整体认知恶化的独立危险因素(P<0.001),而且是延迟记忆、视觉功能及语言功能恶化的独立危险因素(P=0.002,P=0.007,P=0.004)。结论 腹膜透析患者存在MIA综合征一项及以上因素是总体认知功能恶化的高危人群;存在MIA综合征因素越多,患者的特异认知功能领域影响越广泛。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号