首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
目的应用支持向量机(SVM)构建2型糖尿病预测模型的方法。方法简述SVM的原理、特点,并以北京市某社区健康监测档案数据为例,应用matlab软件结合libsvm工具箱实现数据分析。结果通过对2型糖尿病队列数据的分析发现,归一化可以提高预测模型的准确性,不同核函数对预测模型的影响较大,多项式核函数拟合模型最差,5次交互验证准确率和回代训练样本准确率为92.7%,预测检验样本准确率为93.1%;sigmoid核函数拟合的预测模型5次交互验证准确率为93.7%,回代训练样本准确率达到94.0%,预测检验样本准确率为97.3%;径向基核函数拟合的预测模型最佳,5次交互验证准确率为94.5%,回代训练样本准确率为95.1%,预测检验样本准确率为98.7%。结论 SVM可以用于2型糖尿病的预测分析,得到准确率较高的预测模型。  相似文献   

2.
目的 探讨决策树在预测2型糖尿病患者发生脑梗死风险中的应用,为进一步的预防和治疗提供参考依据.方法 采用C5.0决策树算法建立预测模型,并对其预测准确性进行评估.结果 所建立的预测模型对训练样本和测试样本的预测准确率分别为88.41%、85.00%,准确率较高.结论 采用C5.0决策树算法预测2型糖尿病患者发生脑梗死的风险是可行的,其预测结果可以为患者自我保健和医务人员制定治疗方案提供依据.  相似文献   

3.
目的探讨支持向量机(SVM)和人工神经网络(ANN)在2型糖尿病患病风险预测中的应用价值。方法采集2型糖尿病患病数据和体检健康数据,进行数据预处理。基于SVM和ANN对2型糖尿病患病影响因素进行分析,建立模型,观测其预测准确性。结果经过比较,不同核函数的SVM的预测准确率分别为95.15%,93.65%,而不同ANN的预测准确率为96.32%,84.95%,其中分类器性能最好的是BP反向传播网络。结论 SVM和ANN模型都能为2型糖尿病分类提供一定的客观影响因素依据,具有良好的实用价值。  相似文献   

4.
目的 探讨决策树在预测2型糖尿病患者发生脑梗死风险中的应用,为进一步的预防和治疗提供参考依据.方法 采用C5.0决策树算法建立预测模型,并对其预测准确性进行评估,全部分析在SPSS Clementine12.0和SPSS13.0软件中完成.结果 所建立的预测模型对训练样本和测试样本的预测准确率分别为88.41%、85.00%,准确率较高.结论 采用C5.0决策树算法预测2型糖尿病患者发生脑梗死的风险是可行的,其预测结果可以为患者自我保健和医务人员制订治疗方案提供依据.  相似文献   

5.
目的 探索结核病患者的个体特征与适宜治疗方案之间的关系,为临床治疗提供依据.方法 使用1 141例2013年发病的结核病病人专项档案资料,采用C5.0和CHAID算法的决策树模型建立分类预测模型,并对其准确性进行评估.结果 C5.0算法决策树模型训练样本和测试样本的准确率分别为90.72%和88.37%,CHAID算法决策树模型训练样本和测试样本的准确率分别为77.92%和76.74%.结论 C5.0算法构建的决策树模型预测准确率更高,使用决策树模型用于建立结核病治疗方案的分类和预测模型是可行的,其预测结果可以为基层医务人员对患者制定治疗计划提供依据.  相似文献   

6.
目的探讨基于临床数据构建2型糖尿病肾病的Logistic预测模型及应对措施。方法回顾性选择2019年9月至2021年9月石家庄市第二医院收治的200例2型糖尿病肾病患者(研究组), 采用个体匹配、按照1∶1比例选取200例2型糖尿病肾功能正常患者(对照组)。采用单因素分析和多因素分析筛选2型糖尿病肾病影响因素, 并建立Logistic回归方程模型, 验证其预测价值。结果 Logistic回归方程模型显示, 2型糖尿病病程、糖化血红蛋白(HbA1c)、空腹血糖(FPG)、同型半胱氨酸(Hcy)、尿微量白蛋白、血肌酐(Scr)是2型糖尿病肾病发生的高危因素(P<0.05)。Logistic回归模型评价显示, 模型建立具有统计学意义, 回归方程的系数差异有统计学意义, 采用Hosmer-Lemeshow拟合优度检验显示模型拟合效果较好。根据Logistic回归模型统计分析数据集, 绘制2型糖尿病肾病发生的受试者工作特征曲线, 曲线下面积为0.949(95%CI 0.922~0.968), 预测灵敏度为81.50%, 特异度为95.50%, 且校准曲线显示预测结果与观测结果吻合良好。结论...  相似文献   

7.
目的 进行2型糖尿病死亡相关因素研究,探讨决策树模型在住院2型糖尿病患者死因预测中的应用,为进一步的预防和治疗提供参考依据.方法 收集某医院1991-2010年的2型糖尿病患者住院死亡病例597例,采用CART算法构建决策树模型,并使用分析工具对其预测结果进行评估.结果 使用建立的决策树模型测试样本,有91.25%的测试样本的预测值与实际值相符,准确率较高.决策树模型可生成规则集,其中蕴含着住院2型糖尿病患者的死因与心血管病、脑血管病、病程、血肌酐上升以及是否吸烟等相关因素之间的关系.结论 采用CART算法构建决策树模型预测糖尿病患者的死因是可行的,本方法可对大量病例进行数据挖掘,其预测结果具有一定的应用价值.  相似文献   

8.
目的 探讨自回归滑动平均混合(ARIMA)模型的应用价值,为医院感染的监控和预警模式建立提供辅助信息.方法 以2005年1月-2010年12月宁夏某医院的医院感染发病率建立ARIMA模型,进行样本内回代评价预测模型的可行性,以2011年1-10月的发病率资料作为模型预测评价样本,检测模型预测值和实际值的拟合程度,以相对误差绝对值平均(MAPE)值评价ARIMA模型的预测准确性.结果 ARIMA季节乘积模型(0、1、1)×(0、1、1)12的AIC、SBC值分别为1.9047、1.9752,为最优模型,模型表达式为12 Lnyt=(1+0.6841L)、(1 +0.8003 L12),其样本内拟合MAPE值为23.48%,R2=0.5423,模型具有外推价值,样本外预测MAPE值为12.55%,R2 =0.6213,模型预测精度良好.结论 用ARIMA模型对医院感染发病率的拟合结果满意,预测效果良好,可为医院感染的防治提供参考依据.  相似文献   

9.
该文从2型糖尿病风险评估建模角度,重点介绍了芬兰、丹麦、泰国、美国、中国目前糖尿病风险评分过程中引入变量的异同。提出未来2型糖尿病风险预测建模不仅需要考虑环境因素,遗传因素的作用也不可忽视。  相似文献   

10.
目的评价基于不同核函数构建的退行性颈椎病支持向量机高危人群筛查模型的优劣,为退行性颈椎疾病高危人群的筛查提供工具支持。方法利用北京地区社区人群骨科退行性疾病研究数据库,采用线性核、多项式核、Sigmoid核和高斯核函数构建支持向量机模型,并根据十折交叉验证率最大的标准确定核函数参数。根据约登指数最大化的标准选择切点值,计算模型相应的灵敏度、特异度和预测准确率。采用ROC曲线评价不同核函数构建的模型的性能。结果在四种核函数计算的支持向量机模型中,多项式核函数计算ROC曲线下面积最大,为0.6928(95%CI:0.6502~0.7355),但不同核函数的ROC曲线下面积的95%CI存在重叠,尚未发现不同核函数建立本模型的优势。结论可利用该模型进行高危人群筛查,但未发现不同核函数构建的支持向量机模型性能的差别。  相似文献   

11.
12.
The translation of human genome discoveries into health practice is one of the major challenges in the coming decades. The use of emerging genetic knowledge for early disease prediction, prevention, and pharmacogenetics will advance genome medicine and lead to more effective prevention/treatment strategies. For this reason, studies to assess the combined role of genetic and environmental discoveries in early disease prediction represent high priority research projects, as manifested in the multiple risk prediction studies now underway. However, the risk prediction models formed to date lack sufficient accuracy for clinical use. Converging evidence suggests that diseases with the same or similar clinical manifestations could have different pathophysiological and etiological processes. When heterogeneous subphenotypes are treated as a single entity, the effect size of predictors can be reduced substantially, leading to a low‐accuracy risk prediction model. The use of more refined subphenotypes facilitates the identification of new predictors and leads to improved risk prediction models. To account for the phenotypic heterogeneity, we have developed a multiclass likelihood‐ratio approach, which simultaneously determines the optimum number of subphenotype groups and builds a risk prediction model for each group. Simulation results demonstrated that the new approach had more accurate and robust performance than existing approaches under various underlying disease models. The empirical study of type II diabetes (T2D) by using data from the Genes and Environment Initiatives suggested heterogeneous etiology underlying obese and nonobese T2D patients. Considering phenotypic heterogeneity in the analysis leads to improved risk prediction models for both obese and nonobese T2D subjects.  相似文献   

13.
The substantial heritability of most complex diseases suggests that genetic data could provide useful risk prediction. To date the performance of genetic risk scores has fallen short of the potential implied by heritability, but this can be explained by insufficient sample sizes for estimating highly polygenic models. When risk predictors already exist based on environment or lifestyle, two key questions are to what extent can they be improved by adding genetic information, and what is the ultimate potential of combined genetic and environmental risk scores? Here, we extend previous work on the predictive accuracy of polygenic scores to allow for an environmental score that may be correlated with the polygenic score, for example when the environmental factors mediate the genetic risk. We derive common measures of predictive accuracy and improvement as functions of the training sample size, chip heritabilities of disease and environmental score, and genetic correlation between disease and environmental risk factors. We consider simple addition of the two scores and a weighted sum that accounts for their correlation. Using examples from studies of cardiovascular disease and breast cancer, we show that improvements in discrimination are generally small but reasonable degrees of reclassification could be obtained with current sample sizes. Correlation between genetic and environmental scores has only minor effects on numerical results in realistic scenarios. In the longer term, as the accuracy of polygenic scores improves they will come to dominate the predictive accuracy compared to environmental scores.  相似文献   

14.
目的 考虑数据的不均衡性以及预测模型犯第一类错误和第二类错误的概率,建立腹腔镜切除术下急性阑尾炎患者住院天数预测模型。方法 随机抽取某三甲医院2016年7月 - 2017年9月的腹腔镜切除术下急性阑尾切除术患者共243例,利用向前逐步选择方法筛选关键影响因素,之后利用随机欠抽样和SMOTE过抽样方法对数据进行均衡化处理,最后分别利用Logistic回归模型及径向基神经网络模型进行住院天数预测。结果 Logistic回归模型总体精度为76.25%,第一错误概率为35.00%,径向基神经网络模型的总体精度为88.75%,第一错误概率为15.00%。结论 相比Logistic回归模型,径向基神经网络的准确性更高,第一类错误概率更低,该模型更适合住院天数的预警,能够为患者了解病情、治疗方案选择以及医保政策制定提供参考。  相似文献   

15.
目的 基于机器学习模型(machine learning,ML)和logistic回归构建预测结直肠腺癌5年生存结局的组合模型。方法 选取SEER数据库中12 980名患者,采用传统logistic回归分析影响患者5年存活的相关因素。使用相关因素构建以极限梯度提升、自适应提升、支持向量机、随机森林、回归决策树的预测概率为自变量,分别纳入极限梯度提升、自适应提升和logistic回归做最终预测的组合模型,比较各组合模型5年结直肠腺癌生存预测效果。结果 年龄、手术、化疗、分化程度、T分期、N分期、M分期、CEA状况和婚姻,9个因素影响结直肠腺癌患者5年生存。组合模型logistic+Adaboost+RF+XGboost,内部测试集AUC、准确率、F1分数分别为0.861、0.801、0.832。外部验证集AUC、准确率、F1分数分别为0.833、0.806、0.869。组合模型效能优于单一模型。结论 机器学习组合模型更具有优势,可以有效预测结直肠腺癌5年生存结局,辅助临床工作者制定诊疗方案和优化癌症防治措施。  相似文献   

16.
目的探讨支持向量机(SVM)在肾综合征出血热(HFRS)发病率预测上的优势及应用前景。方法首先,利用辽宁省葫芦岛市1984~2006的气象资料(包括平均气压、平均气温、平均降雨量、相对湿度、日照时数、日照百分率)和动物疫情资料(包括鼠密度和鼠带病毒率)共8个指标作为解释变量,所有变量均进行归一化到[0,1]区间,将整个数据集分成训练集和检验集,从数据集中随机抽取1/3个体(舍人取整)组成检验集,其余样本作为训练集。其次,利用软件R2.60构造HFRS发病率预测的SVM模型,获得误差平方和。最后,与基于反馈(BP)和径向基函数(RBF)神经网络模型的预测结果进行比较。结果对于训练集,SVM拟合的误差平方和的x^-±s为(0.031±0.009),而BP和RBF神经网络拟合的误差平方和的x^-±s分别为(0.074±0.030)和(0.082±0.018);对于检验集,SVM预测的误差平方和的x^-±s为(0.067±0.021),而BP和RBF神经网络预测的误差平方和的互±5分别为(0.073±0.022)和(0.089±0.036)。结论SVM作为近年来在统计学理论的基础上发展起来的一种新的模式识别方法,在解决小样本、非线性及高维模式识别问题中具有较高的预测精度和较强的泛化能力。该模型对于发病率的预测是可靠的,可以作为HFRS疫情预测的参考方法。  相似文献   

17.
针对肺癌临床诊断中缺乏定量评估方法等问题,本研究采用影像组学方法构建基于支持向量机(SVM)的肺肿瘤良恶性分类预测模型。首先介绍了影像组学的定义、处理流程。实验样本选自公开数据集LIDC上的816例肺癌患者的CT影像数据。先采用中心池化卷积神经网络分割法提取感兴趣区(ROI),然后分别采用影像组学特征提取包Pyradiomics和FSelector特征筛选模型进行特征提取和特征降维,最后通过SVM构建肺肿瘤良恶性分类预测模型。模型对大于5 mm肺小结节的良恶性分类的预测准确率为80.4%,曲线下面积(AUC)的值为0.792,表明SVM分类器模型可以准确地判别大于5 mm的肺小结节的良恶性。  相似文献   

18.
  目的  评价Logistic回归算法和随机森林算法对2型糖尿病患者3个月后血糖控制情况的预测效果,并探究血糖控制的影响因素。  方法  收集顺义、通州区2型糖尿病患者的基线调查和随访信息,以患者3个月后糖化血红蛋白是否大于6.5%作为结局分类变量,使用随机森林算法和Logistic算法建立预测模型,通过受试者工作特征曲线下面积(area under the curve,AUC)、灵敏度等指标比较预测效果。  结果  患者血糖控制效果的影响因素有基线空腹血糖(P < 0.001)、病程(P < 0.001)、吸烟(P=0.026)、静态活动时间(P=0.006)、体重指数(超重P=0.002,肥胖P=0.011)、手环使用(P=0.028)和糖尿病饮食(P=0.002)7个因素;Logistic回归预测模型的AUC为0.738,灵敏度为72.9%,特异度68.1%,准确率71.2%,随机森林模型的AUC为0.756,灵敏度74.5%,特异度69.5%,准确率72.8%。  结论  随机森林算法预测效果优于Logistic回归预测模型,可应用于血糖控制效果预测,辅助糖尿病患者的管理。  相似文献   

19.
The performance of a support vector machine (SVM) algorithm was investigated to predict prostate tumour location using multi-parametric MRI (mpMRI) data. The purpose was to obtain information of prostate tumour location for the implementation of bio-focused radiotherapy. In vivo mpMRI data were collected from 16 patients prior to radical prostatectomy. Sequences included T2-weighted imaging, diffusion-weighted imaging and dynamic contrast enhanced imaging. In vivo mpMRI was registered with ‘ground truth’ histology, using ex vivo MRI as an intermediate registration step to improve accuracy. Prostate contours were delineated by a radiation oncologist and tumours were annotated on histology by a pathologist. Five patients with minimal imaging artefacts were selected for this study. A Gaussian kernel SVM was trained and tested on different patient data subsets. Parameters were optimised using leave-oneout cross validation. Signal intensities of mpMRI were used as features and histology annotations as true labels. Prediction accuracy, as well as area under the curve (AUC) of the receiver operating characteristics (ROC) curve, were used to assess performance. Results demonstrated the prediction accuracy ranged from 70.4 to 87.1% and AUC of ROC ranged from 0.81 to 0.94. Additional investigations showed the apparent diffusion coefficient map from diffusion weighted imaging was the most important imaging modality for predicting tumour location. Future work will incorporate additional patient data into the framework to increase the sensitivity and specificity of the model, and will be extended to incorporate predictions of biological characteristics of the tumour which will be used in bio-focused radiotherapy optimisation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号