首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
目的 探讨SAM与支持向量机相结合(SAM-SVM)的方法在高维数据中的变量筛选效果.方法采用R语言编程,根据SAM算法,按照变量重要性排序,通过支持向量机分类模型验证其筛选效果.经过多次迭代满足收敛条件时,自动选择"最优"模型.将该方法应用于真实高维数据考核其应用效果,并通过模拟试验验证其有效性.结果对3种疾病的真实高维基因表达数据分别采用上述方法进行变量筛选,均取得了良好的效果,模拟试验也显示使用筛选后的变量再利用支持向量机进行分类判别,具有较高的准确性.结论基于SAM的支持向量机逐步判别方法在解决小样本、非线性及高维问题中表现出许多潜在的优势,可以有效地用于分析高维基因表达数据的特征提取问题.  相似文献   

2.
张奇  荣雯雯  刘艳 《实用预防医学》2018,25(8):1018-1021
基因表达谱数据的分类算法有很多种,每种分类算法有其各自的特点,不同分类算法在不同基因表达谱数据中的分类效果也有所不同。本文主要对目前应用较多的四种分类算法(判别分析、决策树、支持向量机、集成算法)的特点和研究进展进行综述,为相关研究和应用提供科学指导。  相似文献   

3.
在脑-机接口(BCI)研究中一个关键问题是准确地对EEG信号进行特征提取和模式分类,以得到人机通信与控制命令。经过对非靶刺激和靶刺激下诱发的EEG进行去均值、低通滤波、下采样等处理后,利用共同空间模式算法对所采集到的EEG数据进行特征提取,然后通过网格搜索法获取最优分类参数的情况下,利用基于径向基函数的支持向量机设计分类器。通过对3名受试者的实验数据进行各10次的处理后得到较好的分类效果,平均分类准确率为99.2%。实验结果表明,本文的方法适合于基于"模拟阅读"的脑-机接口中。  相似文献   

4.
支持向量机在基因表达数据分类中的应用研究   总被引:1,自引:1,他引:1  
目的探讨支持向量机在基因表达数据分类研究中的应用条件和效果。方法使用支持向量机软件包,通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在含有大量无差异表达基因情况下对分类产生的影响。结果对四种疾病的真实基因表达数据的分类取得了良好的效果,模拟试验则显示了支持向量机对分类具有较高的准确性,但随无差异基因数量的增加其分类效果呈明显下降的趋势;在类间分离一定的情况下,差异表达基因数目较多、基因之间具有较高的相关性时,更容易获得好的分类效果。结论支持向量机在解决小样本、非线性及高维问题中表现出许多潜在的优势,可以有效地用于分析基因表达数据的分类问题。  相似文献   

5.
近年来随着小卫星数量与传感器类型的快速增加,急需研究和发展快速可靠的小卫星遥感影像分类方法.针对分类方法各具局限性、具体应用中最优分类器选取困难等问题,本文基于多分类器集成学习的思路,引入随机森林( Random Forests)方法用于小卫星遥感影像分类.采用灾害监测预报小卫星(HJ-1)、北京1号小卫星(BJ-1)两种国产小卫星多光谱遥感影像进行试验,并与传统分类方法进行比较,结果表明,随机森林比最大似然分类器( MLC)、支持向量机分类器(SVM)等具有更好的稳定性、更高的分类精度和更快的运算速度,具有很好的适用性.  相似文献   

6.
基于支持向量机的婴儿死亡率预测模型   总被引:4,自引:0,他引:4  
张彤  殷菲  倪宗瓒 《中国卫生统计》2004,21(2):78-80,84
目的将通常的回归分析方法应用于婴儿死亡率预测,结果往往不尽人意.因此,本文采用支持向量机回归算法建立预测模型对婴儿死亡率进行预测.方法采用支持向量机回归算法建立回归模型,并对全国22个省的32个县的婴儿死亡率进行预测.并用径向基函数神经网络建立回归模型对同一数据进行预测.结果预测值与实际值误差较小.该模型具有较高的预测精度.并且,支持向量机预测精度高于径向基函数神经网络.结论利用SVM回归算法建立预测模型是一个新颖而有发展前途的方法.  相似文献   

7.
目的 探讨XGBoost算法在二分类高维非平衡数据中的分类判别效果.方法 通过模拟实验及真实代谢组学数据分析,对XGBoost、随机森林、支持向量机、随机欠采样以及随机梯度提升树共五种方法进行比较.结果 模拟实验显示,XGBoost算法在数据非平衡较明显时,在各种实验条件下均优于或不劣于其他四种算法,在数据类别趋于平衡...  相似文献   

8.
目的应用支持向量机模型法评估研究入境国际航行船舶携带输入外来医学媒介生物的风险。方法以中国第2大港、世界第5大港的宁波港作为研究范围,以2014年到港的国际航行船舶为研究对象,对834艘媒介生物阳性船舶和2 151艘媒介生物阴性船舶的33项指标展开调查,采集数据信息。对数据进行清洗及变量筛选后应用R语言编程实现支持向量机模型法建模训练,并以所建模型预测新到港的1 333艘次船舶外来媒介携带风险。结果经过12种支持向量机模型的筛选,以预测精度为判定指标,选定分类器与核函数两个参数分别为"nu-classification"和"高斯函数"的支持向量机模型为最优模型,并构建起基于支持向量机的外来医学媒介生物携带风险与入境国际航行船舶关联因子间的非线性关系模型。模型训练过程的正确分类率为78.89%,通过该模型预测船舶携带外来媒介风险与实际检疫结果的符合率达到82.52%,预测效果良好。结论针对高度不确定的非线性系统,应用支持向量机模型法可实现更加精确的预测功能,为国境卫生检疫风险评估及预警方面的研究提供理论基础。  相似文献   

9.
目的研究类不平衡是否会给基因表达数据的类别预测带来额外挑战,通过公开数据集评估7种分类器在不同类平衡比例数据上的表现,旨在为后续研究提供理论基础。方法在真实数据集上按不同比例抽取样本组成训练集(阴性样本量Nn=10,阳性样本量Np=10,15,20,30,35;Nn=15,Np=5,10,15,25,30)和测试集(Nn=20,Np=20),组成10组新数据集,并选取常用7种分类算法(SVM、C4.5、NB、RF、KNN、AdaBoost、Bagging)对10组新数据集进行分析,比较单次抽样分类与100次抽样平均的分类效果。结果随着数据集中阳性样本量的增加,分类算法整体灵敏度呈上升趋势,而特异度呈下降趋势。结肠癌数据集中,AdaBoost、NB和RF算法表现较好,支持向量机表现较差且不稳定。在白血病数据集中,NB算法整体表现最优且稳定,AdaBoost、C4.5和RF算法分类效果较好但波动较大。结论基因表达数据集中类平衡比例、数据特征和分类算法类别均会影响类别预测结果,且单次分析结果具有偶然性,复现性较差,故分析类不平衡数据时应结合类分布比例谨慎选择适当的算法。  相似文献   

10.
目的对山西省某三甲医院2011-2017年间血液科新诊断的弥漫大B细胞淋巴瘤患者(diffuse large B-cell lymphoma,DLBCL)是否实现两年无事件生存,即DLBLC患者早期复发的预测。方法根据无事件生存期,将患者分成早期复发和非早期复发,并以此为标签构建分类模型。首先对数据进行了归一化处理,然后用LASSO进行了特征选择,因数据类别不平衡,分别采用了SMOTE(synthetic minority over-sampling technique)、Borderline-1 SMOTE、Borderline-2 SMOTE与ADASYN(adaptive synthetic sampling)四种方法平衡数据,之后构建了基于支持向量机的多核模型作为最终的分类器,并与AdaBoost、随机森林和以高斯核、多项式核为内核的单核支持向量机进行比较,最终实现对新诊断病例早期复发的预测。结果在本文所有模型中,采用LASSO加Borderline-1 SMOTE的多核模型(accuracy=0.87,precision=0.87,recall=0.87,f1=0.87,AUC=0.87)取得了最优的分类性能。采用SMOTE的随机森林模型(accuracy=0.84,precision=0.85,recall=0.87,f1=0.79,AUC=0.83)、Borderline-2 SMOTE的随机森林(accuracy=0.84,precision=0.85,recall=0.87,f1=0.79,AUC=0.83)两种集成模型的分类性能也较好,但都低于多核支持向量机模型。两种单核支持向量机性能较差。结论本文构建的所有模型中,经过LASSO和Borderline-1 SMOTE重采样的多核支持向量机性能最优,可为DLBCL早期复发预测提供参考。  相似文献   

11.
目的探讨支持向量机(SVM)在肾综合征出血热(HFRS)发病率预测上的优势及应用前景。方法首先,利用辽宁省葫芦岛市1984~2006的气象资料(包括平均气压、平均气温、平均降雨量、相对湿度、日照时数、日照百分率)和动物疫情资料(包括鼠密度和鼠带病毒率)共8个指标作为解释变量,所有变量均进行归一化到[0,1]区间,将整个数据集分成训练集和检验集,从数据集中随机抽取1/3个体(舍人取整)组成检验集,其余样本作为训练集。其次,利用软件R2.60构造HFRS发病率预测的SVM模型,获得误差平方和。最后,与基于反馈(BP)和径向基函数(RBF)神经网络模型的预测结果进行比较。结果对于训练集,SVM拟合的误差平方和的x^-±s为(0.031±0.009),而BP和RBF神经网络拟合的误差平方和的x^-±s分别为(0.074±0.030)和(0.082±0.018);对于检验集,SVM预测的误差平方和的x^-±s为(0.067±0.021),而BP和RBF神经网络预测的误差平方和的互±5分别为(0.073±0.022)和(0.089±0.036)。结论SVM作为近年来在统计学理论的基础上发展起来的一种新的模式识别方法,在解决小样本、非线性及高维模式识别问题中具有较高的预测精度和较强的泛化能力。该模型对于发病率的预测是可靠的,可以作为HFRS疫情预测的参考方法。  相似文献   

12.
13.
目的 探讨支持向量机在环境和遗传因素对2型糖尿病预测中的应用前景.方法 建模数据库来源于2001 - 2004年中国双生子登记系统,以是否发生2型糖尿病为预测标签,以13个环境因素和5个遗传因素为预测因子,应用Matlab软件建立基于支持向量机的预测模型.结果 环境因素对2型糖尿病的预测模型中,应用线性核函数拟合模型,回代训练样本准确率和预测检验样本准确率分别为82.50%和87.50%,当考虑遗传因素共同作用后,回代训练样本准确率和预测检验样本准确率分别提高1.67%和2.88%;两个预测模型中,应用径向基核函数拟合模型,回代训练样本准确率为100.00%,但预测检验样本准确率仅为86.54%,模型均出现过度拟合现象;应用sigmoid核函数拟合模型,回代训练样本准确率为81.67%,预测检验样本准确率为86.54%,预测效果略差.在环境和遗传因素对2型糖尿病的预测模型中,应用线性核函数拟合模型时,灵敏度为93.33%,特异度为71.42%,优于基于径向基核函数和sigmoid核函数的预测模型.结论 基于线性核函数建立的模型对2型糖尿病发生的预测效果较好,并且综合环境和遗传因素共同作用对2型糖尿病的预测准确率要高于仅考虑环境因素的预测效果,应用支持向量机在解决小样本、非线性、高维模型识别问题中具有良好的应用前景.  相似文献   

14.
目的构建基于神经网络模型(SVM)在MSCT孤立肺小结节(SPN)诊断系统的设计及应用。方法观察2000例经病理证实的SPN临床表现及影像学特征共17项相关指标,采用多因素回归分析,与SPN病理良恶性相关指标作为SVM分析参数,对1500例进行训练,另500例进行预测,对照病理结果分析。采用C/S(Client/Server)架构设计神经网络模型诊断系统。结果与病理对照,500例SVM的良性正确预测238例(98.5%),错误预测4例(1.5%);恶性正确预测250例(97%),错误预测8例(3%)。结论 SVM能有效地对SPN良恶性进行较精确的预测,该模型操作简单、方便、使用,可帮助医生提高SPN正确诊断率。  相似文献   

15.
目的应用支持向量机(SVM)构建2型糖尿病预测模型的方法。方法简述SVM的原理、特点,并以北京市某社区健康监测档案数据为例,应用matlab软件结合libsvm工具箱实现数据分析。结果通过对2型糖尿病队列数据的分析发现,归一化可以提高预测模型的准确性,不同核函数对预测模型的影响较大,多项式核函数拟合模型最差,5次交互验证准确率和回代训练样本准确率为92.7%,预测检验样本准确率为93.1%;sigmoid核函数拟合的预测模型5次交互验证准确率为93.7%,回代训练样本准确率达到94.0%,预测检验样本准确率为97.3%;径向基核函数拟合的预测模型最佳,5次交互验证准确率为94.5%,回代训练样本准确率为95.1%,预测检验样本准确率为98.7%。结论 SVM可以用于2型糖尿病的预测分析,得到准确率较高的预测模型。  相似文献   

16.

Objective

To derive and validate a new ecological measure of the social determinants of health (SDoH), calculable at the zip code or county level.

Data Sources and Study Setting

The most recent releases of secondary, publicly available data were collected from national U.S. health agencies as well as state and city public health departments.

Study Design

The Social Vulnerability Metric (SVM) was constructed from U.S. zip-code level measures (2018) from survey data using multidimensional Item Response Theory and validated using outcomes including all-cause mortality (2016), COVID-19 vaccination (2021), and emergency department visits for asthma (2018). The SVM was also compared with the existing Centers for Disease Control and Prevention's Social Vulnerability Index (SVI) to determine convergent validity and differential predictive validity.

Data Collection/Extraction Methods

The data were collected directly from published files available to the public online from national U.S. health agencies as well as state and city public health departments.

Principal Findings

The correlation between SVM scores and national age-adjusted county all-cause mortality was r = 0.68. This correlation demonstrated the SVM's robust validity and outperformed the SVI with an almost four-fold increase in explained variance (46% vs. 12%). The SVM was also highly correlated (r ≥ 0.60) to zip-code level health outcomes for the state of California and city of Chicago.

Conclusions

The SVM offers a measurement tool improving upon the performance of existing SDoH composite measures and has broad applicability to public health that may help in directing future policies and interventions. The SVM provides a single measure of SDoH that better quantifies associations with health outcomes.  相似文献   

17.
目的比较SCAD-支持向量机、支持向量机和弹性网三种方法对基因表达谱数据的变量筛选和预测判别能力。方法根据设置的参数生成不同条件的基因表达谱模拟数据和实际数据,利用FDR、一致性错误率和ROC曲线下面积(AUC值)从三个方面评价三种方法的变量筛选和预测判别能力。结果模拟实验显示在差异变量数不变的情况下,随着差异变量间相关系数的增加,三种方法建立模型的变量筛选和预测判别能力均提高;当差异变量间相关系数不变时,随着差异变量数目的增加,SCAD-支持向量机和弹性网方法的变量筛选和预测判别能力均呈下降趋势,而支持向量机呈现提高趋势。结论 SCAD-支持向量机不仅改善了支持向量机不能直接进行变量筛选的不足同时提高了模型的精度以及判别的准确性。综合来看SCAD-支持向量机的变量筛选和预测判别能力更优,处理变量间有高度相关性的基因表达谱数据时可以获得更高的预测精度和更稳定的模型估计。  相似文献   

18.
The automated contrast–detail (C–D) analysis methods developed so-far cannot be expected to work well on images processed with nonlinear methods, such as noise reduction methods. Therefore, we have devised a new automated C–D analysis method by applying support vector machine (SVM), and tested for its robustness to nonlinear image processing. We acquired the CDRAD (a commercially available C–D test object) images at a tube voltage of 120 kV and a milliampere-second product (mAs) of 0.5–5.0. A partial diffusion equation based technique was used as noise reduction method. Three radiologists and three university students participated in the observer performance study. The training data for our SVM method was the classification data scored by the one radiologist for the CDRAD images acquired at 1.6 and 3.2 mAs and their noise-reduced images. We also compared the performance of our SVM method with the CDRAD Analyser algorithm. The mean C–D diagrams (that is a plot of the mean of the smallest visible hole diameter vs. hole depth) obtained from our devised SVM method agreed well with the ones averaged across the six human observers for both original and noise-reduced CDRAD images, whereas the mean C–D diagrams from the CDRAD Analyser algorithm disagreed with the ones from the human observers for both original and noise-reduced CDRAD images. In conclusion, our proposed SVM method for C–D analysis will work well for the images processed with the non-linear noise reduction method as well as for the original radiographic images.  相似文献   

19.
目的:运用数学模型粒子群优化(PSO)算法与支持向量机(SVM)(PSO-SVM)评估糖尿病并发症的发病风险,为糖尿病的临床诊断提供有效的数据信息.方法:以SVM为人工智能算法,通过PSO算法对其参数进行优化,利用K-fold交叉验证法将部分数据用于模型的训练,建立以16项指标数据作为输入变量、以糖尿病肾病、糖尿病性视...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号