首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 625 毫秒
1.
Web日志预处理的Clementine方案   总被引:5,自引:0,他引:5  
利用Clementine完成Web日志预处理数据流的初步构建,实现了数据清洗、用户识别、会话识别、路径补充4大过程,同时具备日志合并、数据审核、规范编码、外部信息关联等辅助功能。实验研究表明,利用Clementine对Web日志进行预处理是完全可行的,这为在该平台上进一步完成挖掘工作奠定了基础,从一定程度上解决了Web日志挖掘与预处理交由不同工具处理的困境,提高了Web日志挖掘的自动化程度。  相似文献   

2.
Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段,其中的数据预处理工作关系到挖掘的质量。本文首先针对各类数据分别定义其数据模型;然后根据服务器托管网站的实际工作环境,针对现有预处理工具仅仅局限于固定的日志格式的不足,提出了定制日志的思想,并结合前面定义的数据模型,详细描述了一个预处理工具原型WUMPA。  相似文献   

3.
用著名的数据挖掘工具Clementine处理数据有些大材小用,但它的确比Excel更易用、更高效,处理数据时不需要翻看复杂的编程手册、在Excel表中拉滚动条、选择各种函数等。以国家科技文献中心(NSTL)签到数据上传处理为研究实例,涉及数据查重、规范、筛选、映射、比对、频次统计等各种常见任务,介绍了如何根据不同处理需求定制相应Clementine数据流和Clementine工具在海量数据处理中的优势。  相似文献   

4.
根据网站的树形结构特点,提出了一种统一的树化模型对用户访问路径进行建模,解决了因使用原始访问路径产生的"过度比较问题",并通过采用适合该模型的网页相对位置的概念,大大减轻了原来由于使用网页绝对访问位置导致的误差。结果表明:树化模型能够提高用户访问行为的相似度识别率。  相似文献   

5.
介绍了Oracle数据库的日志挖掘工具的功能,并结合医院信息系统数据库应用管理的需求,给出一个简单实用的验操作过程,便于医院的数据库管理员能够尽快了解其用途并掌握其使用方法.  相似文献   

6.
临床路径挖掘和分析旨在通过分析临床路径事件日志,发现其中隐藏的知识和模式,辅助临床路径的设计与改进。采用流程挖掘技术,以大量的临床数据为对象,挖掘事件间的关系和诊疗流程模型,深入分析临床路径的实际执行情况。结肠癌临床路径的一致性检验实验结果显示,该方法可以有效评估临床路径实际执行情况,发现路径表达和执行时的不规范、不合理的地方,为临床路径的持续优化提供合理的建议和依据。  相似文献   

7.
通过研究病案首页统计信息中各项研究变量的分布规律与特点,探讨各研究变量对是否将病历纳入临床路径的贡献。介绍数据来源和预处理过程,阐述研究方法的选择和并具体分析挖掘过程。建立研究变量Logstic回归方程,找出纳入临床路径概率高的病历特征。  相似文献   

8.
阐述了数据挖掘技术在方剂学研究中的常用方法和在方药配伍及用药规律中的应用,说明其在方剂研究中存在缺乏规范化、评价方法和研究人员知识结构差异性等问题,并提出了建立数据库和研究系统标准化、进行数据预处理、采用多元化挖掘方法、确立评价体系、培养兼备中医药知识与计算机技术研究人员的发展对策。  相似文献   

9.
文本挖掘技术为药物重新定位提供了新思路,不断出现的新数据库以及相应工具,为利用文本挖掘技术进行药物重新定位提供了越来越多便利。介绍了一些使用文本挖掘方法进行药物重新定位研究的方法和工具及成功应用这些方法和工具的范例,以便为对此领域感兴趣的研究人员提供参考。  相似文献   

10.
选取具有代表性的13种文献信息分析工具,从支持的数据格式、数据预处理、构建的关系矩阵、标准化处理、分析方法、结果的可视化等方面进行了比较,总结了每个工具的优势与不足,并为用户选择合适的分析工具提出了建议。  相似文献   

11.
目的:研究王清任使用桃仁的药物配伍规律。方法:应用Microsoft Office Excel 2003建立《医林改错》药物数据库,采用Clementine 11.1数据挖掘系统中的关联规则(Apriori算法)研究桃仁与其他药物之间的相互关联。结果:找出了与桃仁配伍常用的对药、药群等;桃仁和其他药物的配伍主要集中在:与活血化瘀药物的配伍,与补血养血药物的配伍,与补气药物的配伍,与理气药物的配伍等几个方面。结论:将数据挖掘技术应用于药物配伍规律研究是可行的,关联规则可作为探寻药物配伍规律的有效方法。  相似文献   

12.
决策树算法在医院数据挖掘中的应用探索   总被引:1,自引:0,他引:1  
介绍决策树的基本原理,对决策树算法在医院信息系统中的应用进行研究,以肝癌为例对医院临床数据进行挖掘,经过数据预处理,应用ID3算法建立完整的决策树.用测试数据测试,该决策树具有很高的准确率,指出决策树算法在医院信息系统中具有广泛的应用前景.  相似文献   

13.
数据挖掘技术在医学领域中的应用   总被引:16,自引:0,他引:16  
传统统计手段无法对海量数据进行有效地分析,数据挖掘技术的出现使人们看到了解决这一问题的曙光,它能将大量数据背后隐藏的有价值的信息挖掘出来,给用户带来巨大的经济效益和社会效益。目前数据挖掘技术在医学领域的应用尚处于起步阶段,但随着该方法的日益普及,其必将在医学领域得到更加广泛的应用。  相似文献   

14.
从数据集建立、模型设计、医保审核模型相关指标建立、原始数据集预处理、基于K-means的聚类特征生成、数据分类、后处理模块几方面介绍基于数据挖掘的标准化医疗保险监控模型构建,提高医疗费用审核效率,减少医疗资源浪费。  相似文献   

15.
目的:基于现代中医文献数据库,采用数据挖掘技术分析现代医家辨治阿尔茨海默病的用药规律。方法:搜集中国知网(CNKI)、维普(VIP)、万方数据库建库至2020年5月23日所有中药治疗阿尔茨海默病的中文期刊随机对照临床研究文献。运用Excel 软件建立方剂数据库,对药物累计频数、功效分类、性味、证型分布采用描述性分析。应用SPSS Statistics 19.0软件对高频药物进行系统聚类分析、因子分析,应用SPSS Clementine12.0软件对高频药物进行关联规则分析。结果:共纳入文献140篇方剂165首,涉及用药167种,其中频次最多的是石菖蒲,功效类别最多的是补虚药,性味以“甘”、“苦”、“辛”、“温”为主;系统聚类分析得出用药组合12类;关联规则分析得到核心药物组合12个;因子分析提取得到10个公因子。结论:AD的病因病机,以虚、痰(湿)、瘀为主,且三者互为影响,临床多见虚实夹杂证。现代医家辨治AD以扶正祛邪为总治则,温补精气血、安神以扶正,活血、化痰(湿)、开窍以祛邪,多从心、脾、肾三脏论治。  相似文献   

16.
目的:分析治疗痹证方剂的处方用药及配伍规律,为临床治疗痹证提供参考。方法:筛选《中医方剂大辞典》收录的治疗痹证的方剂,利用SPSS Clementine软件,采用软件内置的Apriori算法对筛选方剂进行处方分析。结果:共筛选1311首痹证方剂,涉及中药672味。对其中使用频率大于100次的42味中药进行关联规则分析,显示常用药对配伍组合为没药、乳香,赤芍、当归和杜仲、牛膝等;常用三味药物组合为牛膝、川芎、当归,肉桂、川芎、当归和羌活、川芎、当归等。结论:通过关联规则等数据挖掘方法对痹证方剂进行挖掘,可以得到痹证治疗的一些常用药物组合以及发现一些新的药物组合,对于开拓痹证临床组方用药思路,提高痹证临床治疗水平和效果具有一定参考意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号