首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
目的 开发和验证基于机器学习算法的孕期大于胎龄儿(LGA)风险预测模型,并比较其与传统逻辑回归方法建模的性能差异。方法 研究对象来自"中国免费孕前优生健康检查项目",于2010-2012年在全国31个省市的220个县开展,覆盖全部农村计划妊娠夫妇,本研究选取分娩新生儿胎龄在24~42周内,单胎活产的所有育龄期夫妇及其新生儿为研究对象。应用10种机器学习算法分别建立LGA预测模型,评估模型对LGA的预测性能。结果 最终纳入104 936名新生儿,男婴54 856例(52.3%),女婴50 080例(47.7%),LGA的发生率为11.7%(12 279例)。经过下采样数据平衡处理后,机器学习方法建立模型的整体效能出现明显提高,其中以CatBoost模型在预测LGA风险方面表现最佳,模型的受试者工作特征曲线的曲线下面积(AUC)为0.932;逻辑回归模型表现最差,AUC仅为0.555。结论 与传统的逻辑回归方法相比,通过机器学习算法可建立更有效的孕期LGA风险预测模型,具有潜在的应用价值。  相似文献   

2.
脑卒中复发影响因素分析及函数预测模型   总被引:4,自引:0,他引:4  
目的 研究脑卒中复发危险因素并建立复发函数预测模型。方法 用Life—table法和Kaplan—Meier法对随访资料进行生存分析,采用COX比例风险模型进行因素分析。建立复发函数预测模型及复发判别函数,并对资料进行回代检验。结果 年龄、主要病史、病情严重程度、出院状态、有无后遗症、是否锻炼以及社会心理因素都是影响患者复发的主要因素。复发模型为:h(t,X)=h0(t)exp(一0.9093X1十1.5247X2十0.2019X3十1.1931X4);复发判别函数为:Y(1)=一3.9367十2.1706X1十4.2893X2十0.9735X3十2.8313X4。结论 影响脑卒中复发的因素不但包括发病情况,而且还包括病后康复和社会心理因素。为了减少脑卒中复发,在积极进行治疗的同时,也要大力加强康复和社会支持力度。  相似文献   

3.
目的 筛选出缺血性脑卒中抗栓治疗后发生消化道出血的关键变量,评价Catboost、支持向量机(SVM)、logistic回归(LR)三种机器学习算法对缺血性脑卒中抗栓治疗后消化道出血的预测效果。方法 选取2018年1月1日—2020年1月1日南昌大学第二附属医院确诊为急性缺血性脑卒中并接受抗栓治疗的住院患者,根据单因素分析结果确定初始变量,综合多因素logistic回归、RFE、lasso回归三种特征选择方法筛选变量,比较Catboost、SVM、LR在缺血性脑卒中抗栓治疗后消化道出血预测模型中的效果。结果 在1 605名缺血性脑卒中患者中,消化道出血的患者84名,单因素分析初步确定了17个变量,根据三种特征选择方法确定年龄、GCS、谷草/谷丙、碱性磷酸酶、低密度脂蛋白、出血性转化为关键变量,构建机器学习模型后重复交叉验证结果显示, Catboost算法的综合性能较好,特异度、准确率、AUC、阳性似然比分别为0.851(95%CI:0.85~0.853)、0.84(95%CI:0.838~0.841)、0.848(95%CI:0.841~0.855)、4.463(95%CI:4.378...  相似文献   

4.
目的 探讨急性缺血性脑卒中(AIS)患者早期预后不良的影响因素,并进一步构建风险预测模型。方法 于2019年1月至2021年12月选取恩施某三甲综合医院接诊的AIS患者为研究对象,于患者入院6个月后根据改良Rankin量表(mRS)评分对患者早期预后不良情况进行随访评价,根据随访结果将其分为预后良好组和预后不良组,比较2组AIS患者病例特征并利用多因素logistic回归模型分析早期预后不良的影响因素,构建风险预测模型和绘制ROC曲线对模型进行验证评价。结果 共纳入AIS患者836例,男515例,女321例,年龄42~89岁,平均年龄(65.37±11.96)岁。卒中部位:颈内动脉227例,大脑中动脉301例,大脑后动脉及其他263例。其中279例AIS患者在入院6个月短期随访内出现预后不良,预后不良率为33.37%。多因素logistic回归分析显示年龄(OR=1.234)、房颤(OR=2.992)、入院NIHSS评分(OR=1.906)、NLR(OR=1.770)、D-dimer(OR=1.614)和UA(OR=0.834)均是AIS患者预后不良的独立影响因素。ROC曲线下面积(A...  相似文献   

5.
目的 了解医学生自杀意念影响因素,并探索机器学习算法对医学生自杀意念的预测效果。方法 于2021年11月―2022年3月对山东省医学生进行随机分层整群抽样,进行问卷调查。使用χ2检验、Fisher确切概率法、logistic回归分析模型探讨医学生自杀意念影响因素。训练集使用机器学习算法构建预测模型,测试集使用准确度、灵敏度等指标评估模型预测能力。结果 医学生自杀意念检出率为12.80%。影响因素分析结果显示:住在农村(OR=1.523,95%CI:1.023~2.271,P=0.039)、存在抑郁症状(OR=3.874,95%CI:2.676~5.621,P<0.001)等是自杀意念危险因素,近2年没有谈过恋爱(OR=0.601,95%CI:0.427~0.841,P=0.003)等是自杀意念的保护因素。4种模型预测准确率、灵敏度均>0.90,Kappa值均>0.80,阳性、阴性预测值均>0.90。结论 4种预测模型表现均良好,基于支持向量机(support vector machine, SVM)的自杀意念预测模型更具优势,可有效预测自杀...  相似文献   

6.
目的  评价极端梯度提升(extreme gradient boosting, XGBoost)、支持向量机(support vector machine, SVM)和朴素贝叶斯等6种机器学习模型与传统logistic回归分析模型对小于胎龄儿(small for gestational age, SGA)的预测效能。方法  选取2012年3月―2016年9月在山西医科大学第一医院产科住院分娩的9 972例孕妇作为研究对象,采用问卷调查及从医院信息系统收集数据。依据分娩结局分为SGA组(n=1 124)与非SGA组(n=8 848),按7.50∶2.50比例划分训练集与测试集。采用多因素logistic回归模型筛选危险因素,基于XGBoost、SVM、朴素贝叶斯、梯度提升决策树(gradient boosting decision tree, GBDT)、K最近邻(k-nearest neighbor, KNN)算法及传统logistic回归分析模型方法分别建立预测模型,使用受试者工作特征曲线的曲线下面积(area under the curve, AUC)、准确率和精确度等指标比较预测性能。结果  Logistic回归模型结果显示,妊娠期高血压和子痫等7项变量是SGA的影响因素。将以上因素纳入预测模型,SVM算法构建的预测模型效能最佳,AUC达0.72,模型准确率为71%。传统logistic回归分析模型表现欠佳,AUC为0.71,准确率为66%。结论  基于机器学习算法尤其是SVM算法建立的SGA风险预测模型具有较好的效能,能够有效预测山西省SGA的发生,为实现SGA的一级预防提供参考。  相似文献   

7.
目的 探究机器学习方法对老年人高脂血症的预测价值,并从中分析老年人高脂血症的危险因素。方法 采用分层随机整群抽样方法抽取潍坊市9个县市区27个社区5 759位60岁及以上老年人,并收集这些老年人在2020年度的健康体检资料,排除缺失或异常资料,最终将4 534位老年人纳入研究。将这些老年人按照7∶3的比例随机划分为训练集和验证集,并采用单因素分析筛选出10个显著性变量,用于构建支持向量机、决策树、XGBoost、CATBoost和LightGBM风险预测模型,随后采用AUC(ROC曲线下面积)、精确率、准确率、召回率、F1值评价其性能。结果 CATBoost机器学习模型的综合性能最好,其AUC、精确率、准确率、召回率、F1值分别为0.82、76.49%、92.46%、78.68%、0.85。在CATBoost模型预测老年人高脂血症的风险过程中,9个变量对高脂血症风险预测较为重要,其重要程度由高到底排序依次为收缩压、腰围、空腹血糖、体质指数、舒张压、吸烟情况、年龄、饮酒情况和性别。而且经模型优化后发现,仅纳入这9个变量即可较好的预测风险。结论 基于CATBoost机器学习方法构建的老年人...  相似文献   

8.
目的 建立老年急性缺血性脑卒中患者认知功能障碍的预测模型.方法 选择珠海市人民医院2017年7月~2020年6月收治的300例老年急性缺血性脑卒中患者.根据患者接受治疗后是否发生认知功能障碍将其分为认知功能障碍组(106例)和正常组(194例).收集所有患者临床资料,包括患者性别、年龄、身体质量指数(BMI)、发病时间...  相似文献   

9.
目的了解缺血脑卒中患者发病的影响因素,根据影响因素建立发病概率预测模型,为防治缺血性脑卒中提供依据。方法采用1∶1的病例对照研究方法,使用自行设计的问卷调查研究对象的各种资料;利用条件logistic回归分析方法构建预测模型,并利用ROC曲线方法评价模型预测效果。结果影响缺血性脑卒中发病的危险因素有吸烟、高血压、甘油三酯、低密度脂蛋白(LDL),而文化程度、体力活动、生活自主程度、高密度脂蛋白(HDL)为保护因素;预测准确率高达92.8%。结论条件logistic回归预测概率模型预测效果较好,能较为准确地预测疾病发病概率。  相似文献   

10.
目的  构建并验证脑卒中患者发生静脉血栓栓塞症(venous thromboembolism, VTE)的风险预测模型,为脑卒中患者VTE的预防控制提供科学依据。方法  研究对象为河南省脑卒中队列的675例脑卒中患者,按7∶3随机划分为训练集(473例)和测试集(202例)。使用随机森林算法筛选变量、logistic回归模型分析方法构建模型,并绘制列线图。通过受试者工作特征曲线下面积(area under curve, AUC)、Hosmer-Lemeshow检验等评价模型的预测效能,使用决策曲线分析(decision curve analysis, DCA)评估模型的临床使用价值;并采用五折交叉验证对模型进行内部验证。结果  最终纳入模型的预测因子为年龄、住院天数、日常生活活动能力(activity of daily living, ADL)、肌力、尿酸(uric acid, UA)、D-二聚体、纤维蛋白原(fibrinogen, Fib)和总胆固醇(total cholesterol, TC)。模型在训练集中的Hosmer-Lemeshow检验P=0.872,AUC=0.924(95% CI: 0.898~0.950);测试集Hosmer-Lemeshow检验P=0.597,AUC=0.902(95% CI: 0.852~0.951)。DCA曲线表明,模型在训练集和测试集中均具有较高的临床净获益。五折交叉内部验证结果显示,模型在训练集和测试集中的平均AUC分别为0.913和0.929。结论  该研究构建的脑卒中患者VTE风险预测模型能有效预测VTE的发生,可为高风险患者早期识别和预防性治疗提供参考。  相似文献   

11.
目的 基于集成四种机器学习算法建立哮喘疾病发病风险预测模型,为健康气象预报服务及公众防御提供依据。方法 收集、整理2012—2018年天津市某三甲医院哮喘病患者逐日就诊数据以及同期气象因子、环境因子、花粉等数据资料,采用主成分分析法选取最优因子,应用Stacking集成学习方法集成决策树、随机森林、XGBoost、LightGBM等四种机器学习算法,通过调节最优风险等级阈值、时间滞后、分季节等手段优化模型性能。结果 随机森林建模预测效果好于决策树及XGBoost、LightGBM;基于四个子模型进行多模型集成,相比随机森林模型,在易发、多发等级的预报能力提升约13%;当选择滞后时间为2~3 d,且分季节建模后,模型预测能力有进一步提升。结论 综合考虑多种气象因子、环境因子和花粉因素的多模型集成方法可应用于哮喘疾病的气象预测业务和服务。  相似文献   

12.
13.
目的 本研究旨在构建预测全髋关节置换术(THA)患者下肢深静脉血栓(DVT)风险的机器学习模型,并利用shapley additive explanations(SHAP)方法分析影响DVT风险的关键因素。方法 回顾性分析2017年1月1日至2022年7月31日在温州市某医院接受THA患者的数据,按4∶1随机分为训练集和测试集。采用递归特征消除法及5折交叉验证选取最佳特征;运用6种机器学习算法开发预测模型,并用多种指标评估性能;SHAP方法用于对最优模型进行可解释性分析。结果 共416例THA患者纳入最终研究,其中训练集患者333例,测试集患者83例。XGBoost模型在测试集上表现最佳,其敏感度为0.817,特异度为0.783,F1分数为0.860,ROC-AUC为0.800,Brier评分为0.106。SHAP摘要图显示,影响THA术后DVT发生的前5位最重要因素依次为年龄、胆固醇、术后卧床时间、纤维蛋白原、术前血浆D-二聚体浓度。SHAP值的特征依赖图显示,年龄、胆固醇、术后卧床时间以及纤维蛋白原对THA患者DVT的影响均呈现出复杂的非线性关系,其中年龄、术...  相似文献   

14.
脑血管血液动力学参数脑卒中预测模型的建立   总被引:7,自引:0,他引:7       下载免费PDF全文
目的 根据脑血管血液动力学参数(CVHI)和脑卒中的主要危险因素建立脑卒中预测模型。方法 选择全国六大行政区脑卒中研究队列人群25355例,将基线调查时的CVHI检测结果 进行主成分分析,再以各主成分和主要脑卒中危险因素为自变量,以随访中脑卒中发病为应变量进行回归分析,根据回归系数建立脑卒中预测模型,计算发病概率,绘制ROC曲线,确定最佳截断点,评价预测模型的预测效能。结果 四个主成分的累积贡献率依次为58.1%、79.4%、88.4%和94.6%,被筛检进入logistic回归方程的变量分别为第一至第四主成分、高血压病史、年龄和性别,ROC曲线下面积为0.855,最佳截断点为预测概率≥0.05,预测脑卒中的敏感度、特异度和准确度分别为踟.7%,78.5%,78.5%。结论 通过主成分回归分析,可以建立具有良好效能的脑卒中预测模型。  相似文献   

15.
张奇  杨志辉  杨甲飞  刘志宏 《现代预防医学》2023,(21):3878-3882+3894
目的 探讨银川市粉尘作业工人肺功能异常的影响因素,建立肺功能异常风险预测模型并验证。方法 选取银川市2022年3月—7月进行职业健康体检的粉尘作业工人进行问卷调查、体格检查和实验室检查,共纳入923名调查对象。采用logistic回归分析粉尘作业工人肺功能异常影响因素并构建肺功能异常风险预测列线图模型,采用受试者工作特征(receiver operator characteristic, ROC)曲线、校准曲线和决策分析曲线对模型进行评价。结果 多因素logistic回归结果显示,工作时无个人防护(OR=7.806,95%CI:5.803~11.989)、工龄[与0~5年相比,6~10年OR=3.025,95%CI:1.764~5.188;>10年OR=2.546,95%CI:1.545~4.193]、高血压(OR=3.909,95%CI:2.223~6.873)、BMI(≥24.0 kg/m2)(OR=1.553,95%CI:1.004~2.401)均是肺功能异常的独立危险因素,文化程度为大专(OR=0.503,95%CI:0.299~0.847)是肺功能异常的保护因素。风险预...  相似文献   

16.
目的  在循证医学的基础上利用Rothman-Keller模型建立出生缺陷发病风险预测模型, 为中国有针对性的制定干预措施提供依据。 方法  通过评价Meta分析的文献获得出生缺陷危险因素及相应比值比(odds ratio, OR)值, 构建Rothman-Keller模型的危险评分表, 再利用模拟数据构建模型, 确定风险预测危险程度划分界值, 并采用实际数据验证。 结果  通过17篇文献收集了先天畸形家族史和居住地有污染源等20个出生缺陷的主要危险因素。在山西省的实际数据中, Rothman-Keller模型筛选出的高危人群实际发病率为10.9%, 并与其他组有统计学差异(χ2=147.58, P < 0.001)。除此之外, Rothman-Keller模型能将先天畸形家族史的患者100%识别到高危人群。 结论  通过中国出生缺陷的Meta分析文献, 找出出生缺陷主要危险因素, 构建风险预测模型, 可用于预测出生缺陷的发病风险, 帮助筛选高危人群。同时为预测其他疾病的发病风险提供了思路。  相似文献   

17.
目的 剖析太行山食管癌高发区山西平顺农村居民高血压患病的影响因素,为制订防治对策提供根据。方法 通过随机整群抽样方法,抽取调查对象开展问卷调查和体格检查;利用非条件logistic回归模型分析高血压影响因素并建立风险预测模型。结果 调查问卷发放1 121份,有效966(86.1%)份。调查对象女性503名(52.1%),检出336人(粗率34.8%,标化率33.7%)患高血压。分析显示,BMI(OR=1.068,95%CI:1.025~1.112)、习惯性饮茶(OR=1.815,95%CI:1.290~2.555)、喜食腌制食品(OR=1.638,95%CI:1.199~2.239)、被动吸烟(OR=1.535,95%CI:1.135~2.076)、进食较快(OR=1.518,95%CI:1.120~2.058)、高血压家族史(OR=4.197,95%CI:3.080~5.718)、高脂饮食(OR=2.117,95%CI:1.556~2.880)均是高血压患病的危险因素,喜食辣椒(OR=0.621,95%CI:0.425~0.908)则是保护因素;模型检验中C=0.741(95%CI:...  相似文献   

18.
目的 研究肛瘘术后复发的相关危险因素并构建术后复发风险的预测模型,为临床肛瘘术后复发预测提供依据。方法 收集行肛瘘切除术的肛瘘住院患者临床资料,采用Logistic多元回归模型分析肛瘘术后复发的独立危险因素,采用ROC曲线及决策曲线分析评估Nomogram模型临床效能。结果 有其他肛肠疾病、肛门外伤手术史、便秘、肛瘘手术史、高位肛瘘的患者,术后复发率较高;肛瘘术后复发患者的平均血红蛋白量、红细胞平均体积、血红蛋白含量,低于肛瘘术后未复发患者;差异均有统计学意义(均P<0.05)。平均血红蛋白量、红细胞平均体积、血红蛋白含量的AUC分别为0.919、0.907、0.924,最佳截断值分别为23.69 pg、73.66 fl、111.15 g/L。有其他肛肠疾病、肛瘘手术史、高位肛瘘及平均血红蛋白量(≤23.69 pg)、红细胞平均体积(≤73.66 fl)、血红蛋白含量(≤111.15 g/L)是肛瘘术后复发患者的独立危险因素(P<0.05)。结论 基于其他肛肠疾病、肛瘘手术史、高位肛瘘及平均血红蛋白量、红细胞平均体积、血红蛋白含量构建的预测肛瘘术后复发风险Nomogram模...  相似文献   

19.
杨磊  聂艳武  朱凯  周青  蔡雯 《现代预防医学》2021,(18):3270-3276
目的 基于机器学习( machine learning,ML)的不同算法构建新疆维吾尔自治区乌鲁木齐市非酒精性脂肪性肝病(nonalcoholic fatty liver disease, NAFLD)决策树、随机森林及支持向量机风险预测模型,与经典logistic回归预测模型进行对比分析,以筛选出NAFLD最佳风险预测模型。方法 选取2018年1月—2019年12月就诊并明确诊断为NAFLD的患者429例为病例组,同时选择同期体检的健康志愿者561例作为对照组,探讨NAFLD患者健康状况、生活方式及行为等环境影响因素,基于影响因素构建NAFLD经典logsitic回归预测模型,并运用R软件构建决策树、随机森林及支持向量机风险预测模型,绘制四种模型受试者工作特征曲线(receiver operating characteristic curve,ROC),计算曲线下面积(area under curve,AUC) ,运用“十折交叉验证法”(10-fold cross-validation)对各模型准确率、灵敏度、特异度等指标进行对比分析。结果 共纳入体质指数(P<0.001;OR = 14.479;95%CI:4.000~52.407)、腰臀比(P = 0.001;OR = 3.692;95%CI:1.713~7.956)、被动吸烟(P = 0.004; OR = 3.074; 95%CI:1.426~6.623)、主食品种(P = 0.001;OR = 4.938;95%CI:2.004~12.164)、高血压(P = 0.008 ;OR = 3.601;95%CI:1.407~9.219)、糖尿病(P = 0.018;OR = 4.719;95%CI:1.301~17.124)、血脂异常(P<0.001;OR = 8.538;95%CI:3.582~20.350)、食用红肉类频率(P<0.001;OR = 5.923;95%CI:2.487~14.106)、压力(P = 0.019;OR = 2.466;95%CI:1.158~5.252)、食用水果频率(P = 0.034;OR = 0.498 ;95%CI:0.261~0.949)、文化程度(P = 0.011;OR = 0.444;95%CI:0.238~0.828)11个预测因素构建经典logistic回归预测模型、决策树、随机森林及支持向量机风险预测模型。四种模型均具良好NAFLD风险预测能力,各模型准确率均大于0.80,灵敏度均大于0.85,Kappa值均大于0.65,阳性预测值、阴性预测值均大于或等于0.80;其中支持向量机具有最高的准确率(0.852)、特异度(0.855)、阳性预测值(0.877)及仅次于logsitic回归预测模型的AUC值(0.9086)。结论 综合分析可知,基于支持向量机算法的预测模型更具有优势,可以有效地预测NAFLD患病风险,更有助于NAFLD的预防、早期治疗和管理。  相似文献   

20.
目的构建基于机器学习的儿童使用消费品时发生啃咬行为的预测模型。方法对北京市6所医疗机构就诊的1803例儿童进行问卷调查,依据使用消费品时是否发生啃咬行为分为有啃咬行为组(n=617)与无啃咬行为组(n=1186)。随机抽取1442例儿童的临床资料作为训练集构建预测模型,其余作为测试集进行内部验证。采用单因素分析筛选的指标应用基于机器学习的XGBoost、随机森林、Logistic回归、决策树、贝叶斯网络和SVM算法构建预测模型。完成机器学习算法对特征重要性的排序,比较6种方法构建的模型对儿童使用消费品时是否发生啃咬行为的预测价值。结果XGBoost、随机森林、逻辑回归、决策树、贝叶斯网络和SVM模型的曲线下面积(AUC)分别为0.939、0.935、0.921、0.911、0.893、0.772,灵敏度分别为0.771、0.833、0.879、0.838、0.870、0.233,特异度分别为0.928、0.898、0.847、0.874、0.751、0.969。上述6种机器学习算法优劣排序为:XGBoost>随机森林>Logistic回归>决策树>贝叶斯网络>SVM。儿童年龄(OR=0.721,95%CI=0.683~0.761)、儿童受教育水平(小学:OR=0.244,95%CI=0.170~0.352)、主要照顾者对化学物质知识了解程度(了解一点:OR=0.679,95%CI=0.466~0.990)、主要照顾者陪伴程度(经常陪伴:OR=0.471,95%CI=0.347~0.639)、母亲职业(商业服务人员:OR=0.479,95%CI=0.234~0.980)是儿童啃咬行为主要的影响因素(P<0.05)。结论基于机器学习算法建立的儿童使用消费品发生啃咬行为的预测模型具有较高的应用价值,其中XGBoost的预测效能优于随机森林、Logistic回归、决策树、贝叶斯网络和SVM。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号