共查询到20条相似文献,搜索用时 187 毫秒
1.
目的:探讨分类树中C&RT算法和判别分析在数据分析应用中的区别。方法:首先介绍模型的基本原理,据此对方法间的优缺点进行比较,然后采用实例进行分析介绍,并报告模型的树型图,10折交叉验证的预测准确率。结果:C&RT算法是非参数、非线性的,对变量不同属性的适应是非常灵活地;C&RT在构造树模型时是单变量拆分和递归的,故能够明显细分危险因素。结论:C&I汀算法和判别分析模型各有优势,根据数据特点及专业背景合理分析与解释,将能保证分析的正确性和完善性。 相似文献
2.
3.
4.
5.
6.
在入侵检测系统中使用关联规则分析,挖掘网络数据中系统特征之间的关联关系,创建正常行为库,找出异常连接.描述了一种改进的FP_树算法--NFP_树算法,用以进行入侵检测关联规则的挖掘,实验证明,此算法比传统的关联算法在入侵检测中的应用效果更好. 相似文献
7.
目的 :分析血管内皮生长因子C(VEGF C)与胃癌淋巴结转移和其他临床病理参数的关系。方法 :共 6 6例胃癌手术患者 ,免疫组织化学方法测定切除标本的VEGF C表达 ,RT PCR测定VEGFⅢ型受体 (VEGFR 3,Flt 4 )mRNA表达 ,进行统计学分析。结果 :VEGF C在胃癌的表达率为 39.7% ,VEGFR 3mRNA表达和VEGF C的表达有相关性 ,VEGF C表达与肿瘤浸润深度 (P =0 .0 13)、淋巴结转移 (P =0 .0 2 1)、肿瘤病理分期相关 (P =0 .0 16 )。多变量分析表明 ,VEGF C是胃癌淋巴结转移的危险因素。结论 :VEGF C和胃癌淋巴转移和进展相关 ,可能是肿瘤治疗的新靶点。 相似文献
8.
CMH统计分析是在MH统计分析方法的基础上发展并提出的,用于分层分析,即控制非试验因素后对保留下来的由原因变量与结果变量构成的2×2、R×2、2×C、R×C二维列联表资料的统计学处理.这种方法可以控制一个或多个原因变量,而考察关注的一个原因变量对结果变量的影响.本文结合实例,对高维列联表资料和用SAS软件进行统计学处理的方法进行了介绍,并给出了结果解释. 相似文献
9.
10.
目的:通过融合HPLC与ICP-MS的分析结果建立数据集,结合模式识别法对来自5个产地96批次的藏药东方草莓进行地理溯源性研究,以期为未知来源的东方草莓提供便捷有效的产地判别方法。方法:采用HPLC建立东方草莓指纹图谱,并以LC-MS对各色谱峰进行成分归属,色谱峰信息作为数据集1;采用ICP-MS对东方草莓中21种无机元素进行含量测定,并以对数法建立无机元素指纹图谱,无机元素信息作为数据集2;二者数据融合作为数据集3。结合CA、PCA、PCA-LDA及C5.0决策树算法,对比3个数据集的地理追溯结果。结果:数据融合法相较于单一技术所得数据集,CA、PCA和PCA-LDA均可使96批东方草莓成功归类。对数据融合法的PCA-LDA模型进行内部验证和外部验证,其正确分类率均大于88.3%,表明该模型可作为东方草莓的正确分类依据。C5.0决策树筛选出4个主要贡献变量,并获得树深度为3的分类规则,其十折交叉验证结果显示平均准确度为98.9%。结论:数据融合法可提高不同产地东方草莓地理溯源的准确性,且决策树算法得出的分类规则可降低实际操作难度。以数据融合法结合决策树规则所得出的东方草莓地理分类机制... 相似文献
11.
12.
《中国药物依赖性杂志》2016,(2):161-165
目的:建立甲基苯丙胺依赖树鼩模型的实验方法和评价体系。方法:中缅树鼩18只,随机分为对照组、低剂量给药组(1.5 mg/kg·day)、高剂量给药组(3.5 mg/kg·day),腹腔注射给药,观察记录树鼩甲基苯丙胺给药后的体重改变、条件性位置偏爱实验等行为学变化,探索甲基苯丙胺依赖树鼩模型的建立及评价方法。结果:根据树鼩甲基苯丙胺给药后体重改变、是否形成条件性位置偏爱等行为学指标的观察,建立了甲基苯丙胺依赖树鼩模型和评价指标体系。结论:通过腹腔注射甲基苯丙胺结合条件性位置偏爱实验,成功建立甲基苯丙胺依赖树鼩模型。 相似文献
13.
14.
针对并行程序结构产生任务计算量和通信量的随机性,提出了一种扩展的随机DAG模型.基于此模型对DAG调度中常用调度算法关键路径SCP(Static Critical Path)算法进行了详细的分析,提出了相应的扩展的随机DAG的调度方法SSCP(Stochastic Static Critical Path)算法.同时,给出了扩展的随机DAG中节点的EST(Earliest Start Time)计算方法,并以SCP算法为例进行实验模拟.实验结果表明,SSCP算法相对于SCP算法,减少了并行任务执行时间,并能更精确地预测任务调度的平均执行时间. 相似文献
15.
16.
17.
单变量边缘分布算法(UMDA)是一种新的进化算法,是求解复杂问题的一种有效算法.根据SAT问题的特点,本文提出了一种求解SAT问题的改进单变量边缘分布算法(HeUMDASAT),该算法结合SAT问题本身固有的结构信息与当前群体的优秀解所提供的全局信息,构造了一个新的启发算子,并将此算子结合到单变量边缘分布算法中.此算子不同于随机搜索算子,由其产生的个体可以使得算法跳出局部最优并探索新的潜在区域,并且加快算法的收敛速度.用SATLIB库中的标准SAT问题对HeUMDASAT算法进行测试,实验结果表明该算法在求解速度和成功率方面都有明显的改善. 相似文献
18.
本文对目前比较优秀的各种分类方法进行了介绍、分析和比较.在此基础上,借鉴决策树方法的快速分类特性,提出了一种基于数据库抽样的海量数据分类算法,给出了算法的设计思想和实现原理,并对多处理环境下的优化进行了探讨.实验研究表明,该算法可以明显提高海量数据库的分类效率. 相似文献
19.
结合区间编码和结点模型映射方法提出一种用于关系数据库的扩展存储模式.通过按广度优先遍历XML树实现对双亲/孩子关系结构连接算法的改进.改进后的算法降低了内存空间的开销,缩小了列表的扫描范围,明显提高了查找匹配速度,达到了查询优化的目的. 相似文献
20.
相对约简格作为简化的概念格,在数据挖掘和知识发现等领域具有广泛的应用.相对约简格的构造在其应用过程中是一个主要问题.本文提出了采用树结构对相对约简格节点进行组织,研究了基于属性的相对约简格渐进式构造算法.相对约简格节点的树结构组织可以约束更新格节点、产生子格节点及新生格节点的子结点的搜索范围,从而可以有效地减少算法的执行时间.该算法不仅为相对约简格的构造提供了一种方法,还解决了在已构造好相对约简格的前提下,增加属性所带来的更新问题.在随机生成的数据集上进行的实验测试表明,本算法的时间性能更优越. 相似文献