首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基因表达数据判别分析的随机森林方法   总被引:2,自引:1,他引:2  
目的探讨随机森林算法在基因表达数据分类研究中的应用。方法通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在存在大量无差异表达基因情况下对分类产生的影响。结果随机森林算法对基因表达数据的分类具有较高的准确性,但随着基因数量的增加其判别效果呈下降的趋势,在差异表达基因之间具有相关性时,下降趋势明显减慢,能够获得较理想的分类效果。结论随机森林算法对基因表达数据的分类研究有较好的判别效果。  相似文献   

2.
医学三维可视化方法以及算法平台的研究进展   总被引:3,自引:0,他引:3  
医学三维可视化技术的研究与应用方兴未艾,近年来为提高绘制效率、改善成像质量、节省存储空间提出了许多改进算法,出现了许多算法平台,现对医学图像可视化的两种重建方法和基本原理进行了比较分析,并就常用的几种算法平台进行综述。  相似文献   

3.
目的 综述常见新近决策树算法及其在卫生领域的应用进展,为后续相关研究提供参考。方法 以“数据挖掘”、“决策树算法”、“decision trees”等作为检索词,检索2010-2019年CNKI、万方、维普、PubMed等数据库,总结随机森林、C5.0、GBDT等方法的基本原理、步骤、适用条件及优缺点,列举其在卫生领域中的应用。结果 不同决策树算法各有其优势,在卫生领域多学科中有不同程度的应用。结论 新近决策树算法较原始算法有较大改进,但仍存在不足。推广新近算法,针对其缺陷进行改进,将是决策树算法未来研究的重要方向之一。  相似文献   

4.
目的 探讨XGBoost算法在二分类高维非平衡数据中的分类判别效果.方法 通过模拟实验及真实代谢组学数据分析,对XGBoost、随机森林、支持向量机、随机欠采样以及随机梯度提升树共五种方法进行比较.结果 模拟实验显示,XGBoost算法在数据非平衡较明显时,在各种实验条件下均优于或不劣于其他四种算法,在数据类别趋于平衡...  相似文献   

5.
几种图像分割技术在医学图像处理中的应用研究   总被引:1,自引:0,他引:1  
叙述了基于特定理论的图像分割算法在医学图像处理中的应用,详细介绍了遗传算法、水平集分割法、模糊集分割法各自的基本理论以及优缺点,论述与讨论了医学图像分割效果评价方法,最后对各种算法的特点进行了总结。  相似文献   

6.
目的 探讨合成少数类过采样技术(SMOTE)结合机器学习模型在老年人是否具备健康素养预测评估中的应用。方法 利用单因素筛选从资料中筛选出与是否具备健康素养有关联的变量;以筛选出的变量作为输入变量,以是否具备健康素养为结局变量,分别在经SMOTE算法处理前后的数据集中建立logistic回归模型、随机森林和SVM模型,通过受试者工作特征曲线(ROC)来评价模型性能。结果 Logistic回归、随机森林和SVM在SMOTE算法处理前的测试集中的准确率分别为0.833、0.600和0.636,3种模型的ROC曲线下面积(AUC)分别为0.723、0.815和0.728;在SMOTE算法处理后的测试集中的准确率分别为0.936、0.908和0.890,3种模型的AUC分别为0.896、0.944和0.897。结论 随机森林模型在老年人是否具备健康素养的预后评估中具有较高的应用价值。  相似文献   

7.
DNA微阵列数据判别的旋转森林方法   总被引:1,自引:0,他引:1  
陈金瓯  柳青 《中国卫生统计》2012,29(4):525-528,534
目的探讨旋转森林算法在DNA微阵列数据分类中的应用。方法通过对四个经典基因表达数据的分析考察旋转森林的分类效果,并与其他分类器进行比较,进一步调整算法参数并研究其对分类效果产生的影响。结果旋转森林对基因表达数据有较高且稳定的分类准确性,除了线性变换方式和集成规模对分类性能影响较大,分类效果不随算法其他几个主要参数变化。结论旋转森林在基因表达谱数据分类中有较好的判别结果。  相似文献   

8.
目的 分析老年肌肉衰减症的影响因素,为老年肌肉衰减症干预提供参考依据.方法 通过对泸州市某社区及医院439例老年人进行问卷调查,应用随机森林算法对影响因素进行重要性排序并降维,将降维后的变量纳入Logistic回归分析模型,分析影响因素的作用方向和相对危险度.结果 随机森林算法显示:变量数为7时袋外估算误差率最低,依次...  相似文献   

9.
基因表达数据的随机森林逐步判别分析方法   总被引:3,自引:2,他引:3  
目的给出一种新的随机森林算法,它能在建模过程中自动对变量进行筛选,建立“最优”判断模型。方法采用变量重要性评分和逐步迭代算法选择有作用的变量;通过实际基因表达数据考核其应用效果,并使用R语言编程做模拟试验验证其有效性。结果三种疾病基因表达数据的判别模型,在包含很少量的基因情况下便获得了理想的分类效果;模拟试验则显示在类间区分度较大的情况下,随机森林逐步判别分析的效果明显,能有效地将有作用的变量保留在模型中,提高模型的判别效果;在类间区分度不够大的情况下分类效果提高不明显。结论随机森林逐步判别分析可以有效地应用于基因表达数据的基因筛选和分类研究,但要特别注意由随机波动对分析结果造成的影响。  相似文献   

10.
目的 介绍自组织映射模型的基本原理、常见算法及其研究进展,阐述自组织映射模型在医学领域数据挖掘中的应用,以期为相关研究提供参考方法 本文从医学领域的数据挖掘角度出发,采用文献回顾的方法,阐述自组织映射模型在处理非线性、高度冗余数据时运算速度和精度上的优势,并分析自组织映射模型各种算法的特点及不足结果 相对于传统的数据挖掘方法在大规模的医学数据挖掘时无法消除数据冗余及捕捉非线性特征,从而导致挖掘过程速度慢、精度低等问题,自组织映射模型可以自动地、智能地、可视化地将待处理的数据转化为有用的知识,较好地弥补传统数据挖掘方法的不足.自组织映射模型算法的不断改进,保证了它可以适用于具有不同特征的数据结论 自组织映射模型在医学领域的数据挖掘中得到了较好的应用,其算法还有进一步改进的空间,在医学领域的应用前景将会得到进一步扩展.  相似文献   

11.
目的 将随机森林算法用于类风湿性关节炎病例对照研究的高维甲基化数据的分析,并探讨应用效果。方法 实例数据来自基因表达数据库(gene expression omnibus,GEO),检索号为GSE42861,包含354名病例、335名对照,本文选取类风湿性关节炎相关基因区域所在的第9号染色体,共纳入2 433个胞嘧啶-磷酸-鸟嘌呤双核苷酸(cytosine-phosphate-guanine pairs of nucleotides,CpGs)位点。利用随机森林计算变量的重要性评分并排序;对排序后的变量进行逐步随机森林过程,寻找最有可能与结果存在关联的变量子集;对降维后的变量子集进行逐步Logistic回归。结果 逐步随机森林筛选出80个重要的CpG位点,Logistic回归模型中有13个位点具有统计学意义。纳入这些位点建立Logistic回归模型,该模型的预测正确率达88.29%。结论 随机森林算法可以大大减少噪音变量,提高检验效能,适用于高维甲基化数据分析。  相似文献   

12.
目的探讨随机森林模型和决策树模型在肝硬化并发上消化道出血患者预后评估中的应用。方法利用logistic回归方法从肝硬化住院患者病历资料中筛选出与并发上消化道出血有关联的变量;以筛选出的变量作为输入变量,以是否出血作为结局变量,分别建立随机森林、决策树和传统logistic回归模型,通过受试者工作特征曲线(ROC)来评价三种模型的性能。结果 logistic回归、决策树和随机森林模型在测试集中的准确率分别为81.5%、75.1%和88.9%,三种模型的ROC曲线下面积(AUC)分别为0.854、0.720和0.909;在随机森林模型的变量重要性评分中,血糖、胆固醇、血清钾、总蛋白、碱性磷酸酶、尿素氮等指标得分较高,提示这些指标或有临床意义。结论随机森林模型在肝硬化上消化道出血患者的预后评估中具有较高的应用价值。  相似文献   

13.
目的 集成学习是近年来机器学习领域中被广泛应用的一种新的、用来提高学习精度的算法.本文旨在介绍基于superlearner算法的集成学习方法在纵向删失数据预测建模中的应用及其R语言实现.方法 本文介绍了su-per learner算法的基本原理及其在纵向删失数据建模中的应用,以及如何在R语言中实现该算法的建模.其次,应...  相似文献   

14.
目的介绍一种基于K近邻的过抽样算法在不平衡的医学数据集分类中的应用。方法首先利用K近邻法删除在分类中容易与少数类混淆的多数类样本;再对新生成的训练集利用SMOTE算法进行少数类样本的扩充,以有效提高少数类的分类性能。结果利用社区人群的慢性阻塞性肺疾病资料验证,基于K近邻的过抽样算法的分类性能比合成少数类过抽样算法及欠抽样方法要强。结论当医学资料出现不平衡特征时,传统分类器的分类效果不佳,基于K近邻的过抽样算法能够获得良好的分类性能,在医学模式识别领域中有较好的应用前景。  相似文献   

15.
目的 基于集成四种机器学习算法建立哮喘疾病发病风险预测模型,为健康气象预报服务及公众防御提供依据。方法 收集、整理2012—2018年天津市某三甲医院哮喘病患者逐日就诊数据以及同期气象因子、环境因子、花粉等数据资料,采用主成分分析法选取最优因子,应用Stacking集成学习方法集成决策树、随机森林、XGBoost、LightGBM等四种机器学习算法,通过调节最优风险等级阈值、时间滞后、分季节等手段优化模型性能。结果 随机森林建模预测效果好于决策树及XGBoost、LightGBM;基于四个子模型进行多模型集成,相比随机森林模型,在易发、多发等级的预报能力提升约13%;当选择滞后时间为2~3 d,且分季节建模后,模型预测能力有进一步提升。结论 综合考虑多种气象因子、环境因子和花粉因素的多模型集成方法可应用于哮喘疾病的气象预测业务和服务。  相似文献   

16.
摘要:目的 采用随机森林算法分析体检人群肾结石的影响因素。方法 自体检人群中选取955例肾结石患者和1670例未患肾结石者,收集各项生化指标,先利用随机森林方法进行降维,再用传统的Logistic回归对降维后的变量进行分析。结果 经随机森林算法筛出8个重要性得分最高且错误率最低的变量纳入经典Logistic回归模型进行分析,最终进入Logistic回归模型的变量有性别、年龄、体质指数、收缩压、低密度脂蛋白、总胆红素。结论 肾结石的发病与性别、年龄及人体多项生化指标有关。  相似文献   

17.
目的:研究基于MITK的医学图像三维重建技术,分析基于MITK的医学图像处理效果。方法:利用MITK平台在VC++6.0环境下采用面绘制技术实现了交互式医学图像三维重建系统。结果:利用MITK平台实现了改进算法下医学图像表面重建。结论:医学图像三维重建是一个多学科交叉的研究领域,是计算机图形学和图像处理在生物医学工程中的重要应用。它涉及数字图像处理、数学、图形学以及医学领域的相关知识,在诊断医学、手术规划及模拟仿真、虚拟内窥镜、解剖教学等方面都有重要应用。  相似文献   

18.
潜在狄利克雷分布(LDA)模型作为一种无监督的机器学习算法,具有"文档→主题→词"三层贝叶斯网络结构。近年来,LDA及其改进模型在基础医学、临床医学和公共卫生等医学领域得到了广泛的应用。本研究就LDA模型在结构化与非结构化医学文本处理、基因与蛋白质组学等生物信息学领域、医学图像处理等方面的应用进行综述。  相似文献   

19.
目的:测试基于MITK的医学图像处理效果。方法:通过实例在VC++6.0集成开发环境下分别编程实现了MITK在医学图像分割、配准和三维可视化(包括面绘制和体绘制)开发中的应用。结果:在MITK中这些算法都得到了比较满意的处理效果,尤其是MITK中的面绘制绘制速度快,绘制效果好。结论:可以方便地使用MITK进行医学图像分割、配准和可视化处理。  相似文献   

20.
目的:探讨改进的嵌入式零树小波编码算法压缩医学图像,以便应用于PACS。方法:应用嵌入式零树小波编码算法及本文提出的对其改进算法对CT医学图像压缩,并进行分析和比较。结果:改进的算法压缩医学图像取得了比原有EZW算法更好的压缩效果。结论:实验证明,本文改进的EZW算法优于嵌入式零树小波编码算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号