首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 988 毫秒
1.
目的 运用logistic回归、卷积神经网络和QUEST决策树建立石油工人代谢综合征发生风险预测模型,并比较三种模型的预测性能。方法 以2017年4月—2018年10月参加职业健康体检的1 468名石油工人作为研究对象。由培训后的调查人员对其进行调查,根据石油工人代谢综合征影响因素的分析结果和相关文献综述确定模型的输入变量,构建logistic回归、卷积神经网络和QUEST决策树模型。结果 训练集显示logistic回归、卷积神经网络和QUEST决策树模型的准确率分别为83.45%、86.34%、79.75%;F1分数分别为0.79、0.83、0.74;ROC曲线下面积(AUC)分别为0.894、0.935、0.844。卷积神经网络明显优于其他两种模型,模型各评价指标间差异均具有统计学意义(P<0.05)。测试集显示以上三种模型的准确率分别为76.72%、78.69%、74.75%;F1分数分别为0.70、0.71、0.65;ROC曲线下面积分别为0.797、0.855、0.826。卷积神经网络模型与其他两种模型相比差异具有统计学意义(P<0.05)。结论 卷积神经网络模型的预测效果较logistic回归和QUEST决策树模型更优。  相似文献   

2.
目的应用不同机器学习算法预测男男性行为(MSM)人群HIV感染状况的比较。方法将四种机器学习算法(logistic回归、神经网络、随机森林和支持向量机)的预测结果和实验室的检测结果相比较,分类性能的评价指标采用ROC曲线下面积(AUC)、灵敏度、特异度和准确度(PRE)。结果四种算法在训练集和测试集上均具有较理想的分类效能,训练集的结果略好于测试集。和logistic回归分析相比较,其他几种算法均提高了分类预测效能:神经网络提高18.4%(AUC:0.909,95%CI:0.903~0.915),随机森林提高19.7%(AUC:0.922,95%CI:0.920~0.924),支持向量机提高22.3%(AUC:0.948,95%CI:0.947~0.949)。其中支持向量机的分类性能最好,分类的灵敏度为97.5%,特异度为99.1%,准确度(PRE)为98.9%。结论机器学习算法显著地提高了MSM人群中HIV感染的预测效能,可以较准确地识别MSM人群中HIV感染者与未感染者,为及时地提供预防与治疗服务提供了依据,同时避免了医疗资源的浪费。  相似文献   

3.
  目的  比较C5.0决策树与径向基函数(radial basis function,RBF)神经网络用于急性缺血性脑卒中(acute jschemic stroke,AIS)出血性转化(hemorrhagic transformation,HT)风险预测性能。  方法  将AIS住院患者作为研究对象,收集相关资料。根据入院2周内是否发生HT分为HT组与非HT组,建立C5.0决策树与RBF神经网络模型,比较两者的预测性能。  结果  共收集460份病历资料,按照训练集与测试集7 ∶3的比例分为训练集样本和测试集样本。C5.0决策树模型的训练集与测试集准确率分别为96.5%和80.1%,灵敏度为98.1%和82.6%,特异度为94.8%和77.9%,Kappa指数是0.93和0.60,AUC是0.97和0.80。RBF神经网络模型的训练集与测试集准确率分别为72.6%和74.7%,灵敏度为87.6%和88.4%,特异度为56.9%和62.3%,Kappa指数为0.45和0.50,AUC为0.72和0.75;在训练集中,C5.0决策树模型的预测性能优于RBF神经网络模型的预测性能。在测试集中,两者预测性能的差异无统计学意义。  结论  C5.0决策树模型的预测性能优于RBF神经网络模型的预测性能。  相似文献   

4.
目的探讨logistic回归、BP神经网络和决策树分析模型在预测个体2型糖尿病患病风险中的应用。方法分别应用logistic回归、BP神经网络与决策树建立2型糖尿病预测模型,通过受试者工作特征曲线评价模型的预测效能。结果共550名糖尿病患者和1100名非糖尿病患者纳入本次研究。logistic回归、BP神经网络和决策树分析模型的预测一致率分别为80.8%、84.1%和81.1%。3种模型ROC曲线下面积(AUC)分别为0.739、0.777和0.737。BP神经网络的AUC与logistic模型和决策树分析模型的均有统计学差异(P0.05)。结论 BP神经网络在预测个体患2型糖尿病方面具有更好的预测效能。  相似文献   

5.
支持向量机原理及其在医学分类中的应用   总被引:1,自引:0,他引:1  
目的 介绍一种具有较高精度的分类模型--支持向量机在解决分类问题时的应用.方法 以胃癌流行病学调查资料为例分别建立支持向量机、决策树、logistic 回归模型,比较三种模型性能优劣.结果 对于测试集样本SVM预测精度为99.052%,C5.0决策树预测精度为93.365%,logistic 回归预测精度为90.995%,SVM具有良好的泛化能力.结论 当传统统计分析条件不能得到满足或效果不佳时支持向量机能够达到良好的预测结果,在医学领域具有较好的应用前景.  相似文献   

6.
目的 提出一种基于粒子群优化算法随机森林模型(PSO-RF),并用于体外冲击波治疗泌尿系统结石的疗效预测,以期为临床结石的治疗提供新的选择和思路。方法 选取2018年至2021年江苏省中医院泌尿外科确诊的原发性泌尿系统结石患者1150例为研究对象,将样本集按7:3的比例随机分为训练集(805例)和测试集(345例),使用MATLAB 2019a建立BP神经网络模型、支持向量机(SVM)模型、决策树(DT)模型及PSO-RF模型,同时将准确率、召回率、F1分数、精准率作为模型精度评判指标。结果 相比SVM模型、DT模型,PSO-RF模型的预测准确率、精确率、F1分数均提高,差异均有统计学意义(P <0.05);相比BP神经网络模型、SVM模型与DT模型,PSO-RF模型的预测召回率提高,差异有统计学意义(P <0.05);PSO-RF模型的AUC为0.74,时间复杂度相比BP神经网络模型降低,差异有统计学意义(P <0.05)。结论 PSO-RF模型可对泌尿系统结石治疗效果进行快速、合理、科学的预测,为泌尿系统结石的治疗提供参考,值得进一步研究和学习。  相似文献   

7.
目的 利用重采样技术提高我国中老年居民糖尿病不平衡数据的分类预测效果。方法 采用随机欠采样、随机过采样、合成少数类过采样(synthetic minority oversampling technique, SMOTE)以及自适应合成抽样(adaptive synthetic sampling, ADASYN)四种重采样技术处理CHARLS数据库中糖尿病不平衡数据,比较重采样前后logistic回归、支持向量机、随机森林的分类性能,采用G-means和AUC评价模型的预测效果。结果 对CHARLS糖尿病不平衡数据集,logistic回归、支持向量机、随机森林模型的G-means分别为0.222 7、0、0,AUC分别为0.761 2、0.736 3、0.742 9,logistic回归模型显著优于支持向量机,模型准确率(χ2=1 231.501,P<0.001)及AUC值(Z=2.634, P=0.028)的差异均具有统计学意义。四种重采样技术处理后模型的G-means均提高,特别是SMOTE和ADASYN技术;此外,随机欠采样不能显著提高logistic回...  相似文献   

8.
杨磊  聂艳武  朱凯  周青  蔡雯 《现代预防医学》2021,(18):3270-3276
目的 基于机器学习( machine learning,ML)的不同算法构建新疆维吾尔自治区乌鲁木齐市非酒精性脂肪性肝病(nonalcoholic fatty liver disease, NAFLD)决策树、随机森林及支持向量机风险预测模型,与经典logistic回归预测模型进行对比分析,以筛选出NAFLD最佳风险预测模型。方法 选取2018年1月—2019年12月就诊并明确诊断为NAFLD的患者429例为病例组,同时选择同期体检的健康志愿者561例作为对照组,探讨NAFLD患者健康状况、生活方式及行为等环境影响因素,基于影响因素构建NAFLD经典logsitic回归预测模型,并运用R软件构建决策树、随机森林及支持向量机风险预测模型,绘制四种模型受试者工作特征曲线(receiver operating characteristic curve,ROC),计算曲线下面积(area under curve,AUC) ,运用“十折交叉验证法”(10-fold cross-validation)对各模型准确率、灵敏度、特异度等指标进行对比分析。结果 共纳入体质指数(P<0.001;OR = 14.479;95%CI:4.000~52.407)、腰臀比(P = 0.001;OR = 3.692;95%CI:1.713~7.956)、被动吸烟(P = 0.004; OR = 3.074; 95%CI:1.426~6.623)、主食品种(P = 0.001;OR = 4.938;95%CI:2.004~12.164)、高血压(P = 0.008 ;OR = 3.601;95%CI:1.407~9.219)、糖尿病(P = 0.018;OR = 4.719;95%CI:1.301~17.124)、血脂异常(P<0.001;OR = 8.538;95%CI:3.582~20.350)、食用红肉类频率(P<0.001;OR = 5.923;95%CI:2.487~14.106)、压力(P = 0.019;OR = 2.466;95%CI:1.158~5.252)、食用水果频率(P = 0.034;OR = 0.498 ;95%CI:0.261~0.949)、文化程度(P = 0.011;OR = 0.444;95%CI:0.238~0.828)11个预测因素构建经典logistic回归预测模型、决策树、随机森林及支持向量机风险预测模型。四种模型均具良好NAFLD风险预测能力,各模型准确率均大于0.80,灵敏度均大于0.85,Kappa值均大于0.65,阳性预测值、阴性预测值均大于或等于0.80;其中支持向量机具有最高的准确率(0.852)、特异度(0.855)、阳性预测值(0.877)及仅次于logsitic回归预测模型的AUC值(0.9086)。结论 综合分析可知,基于支持向量机算法的预测模型更具有优势,可以有效地预测NAFLD患病风险,更有助于NAFLD的预防、早期治疗和管理。  相似文献   

9.
目的分析缺血性脑卒中发病因素,建立缺血性脑卒中患病风险预测模型,为脑卒中的早期筛查与防治提供依据。方法应用统计学方法筛选与缺血性脑卒中患病相关的指标,通过支持向量机算法构建预测模型,并对模型进行评估。结果采用支持向量机算法构建的简单个人和复杂临床水平模型的训练集准确率分别为97.48%、97.09%,测试集准确率分别为91.47%、91.09%。结论支持向量机算法构建的风险预测模型,具有很好的时效性与准确性,对脑卒中早期筛查和干预具有一定的应用价值。  相似文献   

10.
目的 借助数据挖掘技术,联合流行病学特征和临床症状资料构建肺癌危险度预测模型,评价各模型用于肺癌危险度预测的性能,并筛选出最优模型。 方法 选取460例肺癌患者和560例肺良性疾病患者为研究对象,收集其流行病学特征和临床症状共16个自变量。将研究对象按照3∶1的比例随机分为训练集与测试集,应用支持向量机(support vector machine,SVM)、决策树C5.0和人工神经网络(artificial neural network,ANN)分别建立肺癌危险度预测模型,并比较不同模型的预测性能。 结果 经特征提取,痰中带血、发热出汗和吸烟史等9个变量被筛选为有效变量,用来构建肺癌危险度预测模型。测试集中SVM、决策树C5.0和ANN模型的灵敏度分别为74.1%、62.5%和92.9%;特异度分别为76.2%、80.4%和64.3%;阳性预测值分别为70.9%、71.4%和67.1%;阴性预测值分别为79.0%、73.2%和92.0%;准确度分别为75.3%、72.5%和76.9%;曲线下面积分别为0.752(95%CI:0.694~0.803)、0.715(95%CI:0.655~0.769)和0.786(95%CI:0.730~0.835)。 结论 ANN预测模型的整体性能优于SVM模型和决策树C5.0模型,在肺癌高危人群的筛查中具有潜在的应用价值。  相似文献   

11.
基于支持向量机的婴儿死亡率预测模型   总被引:4,自引:0,他引:4  
张彤  殷菲  倪宗瓒 《中国卫生统计》2004,21(2):78-80,84
目的将通常的回归分析方法应用于婴儿死亡率预测,结果往往不尽人意.因此,本文采用支持向量机回归算法建立预测模型对婴儿死亡率进行预测.方法采用支持向量机回归算法建立回归模型,并对全国22个省的32个县的婴儿死亡率进行预测.并用径向基函数神经网络建立回归模型对同一数据进行预测.结果预测值与实际值误差较小.该模型具有较高的预测精度.并且,支持向量机预测精度高于径向基函数神经网络.结论利用SVM回归算法建立预测模型是一个新颖而有发展前途的方法.  相似文献   

12.
目的 介绍决策树法的原理及其在出生缺陷预测中的应用,为出生缺陷研究提供一种新的思路.方法 通过1:2匹配的病例对照研究探讨湖南省前10位出生缺陷发生的影响因素;对单因素logistic回归分析中有统计学意义的变量采用C5.0决策树算法和判别分析构建预测模型.统计分析软件采用Clementine 11.0和SPSS 15.0.结果 决策树分类结果与实际类别的符合率为83.7%,灵敏度为74.1%,特异度为88.6%;判别分类与实际类别的符合率为64.7%,灵敏度为54.0%;特异度为70.3%.C5.0决策树法比判别分析法具有更好的预测效果,其判断准确率高于判别分析.结论 C5.0决策树法构建的出生缺陷预测模型,可获得比传统的判别分析更好的预测效果.通过建立孕妇资料数据库,结合专业知识选取高质量的指标,应用决策树法能够对出生缺陷的发生起到较好的预测作用.  相似文献   

13.
介绍一种基于支持矢量机(SVM)分类器进行瘢痕组织色度分析,进而判断其增生程度的方法。其技术流程为:先用数码相机获取烧伤瘢痕图像,再通过人工神经网络(ANN)进行色度校正,最后运用支持矢量机(SVM)进行瘢痕色度分析及增生程度分类。经临床烧伤实例评价,证明上述方法行之有效。  相似文献   

14.
Highly imbalanced data sets are those where the class of interest is rare. In this paper, we compare the performance of several common data mining methods, logistic regression, discriminant analysis, Classification and Regression Tree (CART) models, C5, and Support Vector Machines (SVM) in predicting the discharge status (alive or deceased, with “deceased” being the class of interest) of patients from an Intensive Care Unit (ICU). Using a variety of misclassification cost ratio (MCR) values and using specificity, recall, precision, the F-measure, and confusion entropy (CEN) as criteria for evaluating each method’s performance, C5 and SVM performed better than the other methods. At a MCR of 100, C5 had the highest recall and SVM the highest specificity and lowest CEN. We also used Hand’s measure to compare the five methods. According to Hand’s measure, logistic regression performed the best. This article makes several contributions. We show how the use of MCR for analyzing imbalanced medical data significantly improves the method’s classification performance. We also found that the F-measure and precision did not improve as the MCR was increased.  相似文献   

15.
利用面向对象程序设计技术,结合信号处理领域内出现的新技术:小渡变换、神经元网络、遗传算法等,设计和实现心电信号数据处理系统和患者管理系统,为医学诊断提供帮助.  相似文献   

16.
针对肺癌临床诊断中缺乏定量评估方法等问题,本研究采用影像组学方法构建基于支持向量机(SVM)的肺肿瘤良恶性分类预测模型。首先介绍了影像组学的定义、处理流程。实验样本选自公开数据集LIDC上的816例肺癌患者的CT影像数据。先采用中心池化卷积神经网络分割法提取感兴趣区(ROI),然后分别采用影像组学特征提取包Pyradiomics和FSelector特征筛选模型进行特征提取和特征降维,最后通过SVM构建肺肿瘤良恶性分类预测模型。模型对大于5 mm肺小结节的良恶性分类的预测准确率为80.4%,曲线下面积(AUC)的值为0.792,表明SVM分类器模型可以准确地判别大于5 mm的肺小结节的良恶性。  相似文献   

17.
介绍了广州市妇女儿童医疗中心建设临床辅助决策系统的详细情况,系统囊括了药学临床辅助决策系统、检验临床辅助决策系统等多个临床辅助决策系统,达到HIMSS 7级医院等级评审对临床辅助决策系统的要求。同时指出:系统的应用减少了医疗差错和医疗事故的发生,使得传统诊疗过程更加智能化,固化了医院制度和诊疗流程。  相似文献   

18.
目的 分析基于奇异谱分析(singular spectrum analysis, SSA)的自回归移动平均模型(Autoregressive integrated moving average, ARIMA)模型预测流感样病例 (influenza like illness, ILI) 发病趋势的可行性,为流感防控工作提供合理的预测方法。 方法 利用山西省2010年第14周-2017年第13周的流感监测资料以不同长度配比的训练集、测试集构建SSA-ARIMA模型,并与ARIMA、BP神经网络(Back propagation neural network, BPNN)、广义回归神经网络(General Regression Neural Network, GRNN)模型进行比较。采用平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Squared Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)比较各模型预测效果。 结果 模型拟合方面,SSA-ARIMA模型在预测未来一个月发病趋势时的MAE、MSE、RMSE分别为0.163、0.061、0.248;预测六个月时分别为0.161、0.061、0.248;预测一年时分别为0.168、0.066、0.256;均低于ARIMA、BPNN、GRNN。模型预测方面,在预测未来一个月发病趋势时的MAE、MSE、RMSE分别为0.056、0.005、0.068;预测六个月时分别为0.189、0.081、0.285;预测一年时分别为0.210、0.075、0.273;也均低于ARIMA、BPNN、GRNN。 结论 SSA-ARIMA模型对山西省ILI的预测效果优于ARIMA、BPNN、GRNN,可为流感预测提供科学依据。  相似文献   

19.
Prediction of CTL epitopes using QM, SVM and ANN techniques   总被引:12,自引:0,他引:12  
Bhasin M  Raghava GP 《Vaccine》2004,22(23-24):3195-3204
Cytotoxic T lymphocyte (CTL) epitopes are potential candidates for subunit vaccine design for various diseases. Most of the existing T cell epitope prediction methods are indirect methods that predict MHC class I binders instead of CTL epitopes. In this study, a systematic attempt has been made to develop a direct method for predicting CTL epitopes from an antigenic sequence. This method is based on quantitative matrix (QM) and machine learning techniques such as Support Vector Machine (SVM) and Artificial Neural Network (ANN). This method has been trained and tested on non-redundant dataset of T cell epitopes and non-epitopes that includes 1137 experimentally proven MHC class I restricted T cell epitopes. The accuracy of QM-, ANN- and SVM-based methods was 70.0, 72.2 and 75.2%, respectively. The performance of these methods has been evaluated through Leave One Out Cross-Validation (LOOCV) at a cutoff score where sensitivity and specificity was nearly equal. Finally, both machine-learning methods were used for consensus and combined prediction of CTL epitopes. The performances of these methods were evaluated on blind dataset where machine learning-based methods perform better than QM-based method. We also demonstrated through subgroup analysis that our methods can discriminate between T-cell epitopes and MHC binders (non-epitopes). In brief this method allows prediction of CTL epitopes using QM, SVM, ANN approaches. The method also facilitates prediction of MHC restriction in predicted T cell epitopes.  相似文献   

20.
目的探讨血细胞计数参数对再生性障碍性贫血(AA)和骨髓增生异常综合征(MDS)的鉴别诊断价值。方法收集我院2010年1月-2013年11月初诊为诊AA患者40例,MDS患者38例,应用血细胞计数参数对两种疾病进行回顾性鉴别诊断。结果白细胞(WBC)计数、血小板(PLT)计数和贫血程度在中度以上者,MDS较AA组高,差异显著,有统计学意义(P〈0.05),平均红细胞血红蛋白含量(MCH),平均红细胞血红蛋白浓度(MCHC)AA组较MDS组高,差异有统计学意义(P〈0.05),平均血小板体积(MPV)、网织红细胞百分比(RET%)、网织红细胞绝对值(RET#)AA组较MDS组低、其差异有统计学意义(P〈0.05)。结论血细胞计数中WBC、Hb、PLT、MCH、MCHC、MPV、RET%、RET#等各参数对AA与MDS两种疾病的鉴别诊断具有重要的参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号