共查询到18条相似文献,搜索用时 109 毫秒
1.
研究医药文本特点,提出了基于免疫克隆选择算法的医药文本分类特征选择方法。该算法引入Jeffries-Matusita距离设计亲和度,并利用相应的克隆算子确保算法快速收敛到全局最优解。实验结果表明,该算法在提高医药文本分类精度的同时,有效降低了特征维数。与基于BP神经网络特征选择和基于遗传算法特征选择的结果相比较,在有限代数内,该算法能收敛到更优的特征子集。 相似文献
2.
简要回顾了文本自动分类研究的发展史,对现有的中文文本分类技术和分类系统进行了分析与比较,同时讨论了目前主要的几种自动分类算法,在此基础上指出了当前中文文本自动分类研究存在的不足和今后研究的重点,最后指出了加强各类电子词典的建设是促进自动分类技术不断成熟并被广泛应用的一个重要工作。 相似文献
3.
利用文本分类技术研究方剂分类 总被引:1,自引:0,他引:1
顾铮 《辽宁中医药大学学报》2010,(2)
目的:借助现代化的工具和手段,批量处理中医方剂信息,发现方剂的类别及内在联系。方法:利用计算机自然语言处理领域的知识,基于文本分类算法,计算方剂相似度,为研究中医方剂提供有用信息。结果:KNN分类器可以在方剂分类中取得预期效果。 相似文献
4.
目的:探索基于深度学习的文本分类方法在生物医学文本的学科分类中是否具有更好的分类性能。方法:以中国医院科技量值研究中累积的神经病学科、消化病学科、肿瘤学科的SCI论文为数据来源,分别训练并测试CNN、LSTM、LSTM-CNN、LSTM-attention及SVM模型并评估其性能。结果:5类模型中,双层CNN模型的分类性能最好,CNN、LSTM、LSTM-CNN和LSTM-attention模型的分类性能均优于SVM模型。结论:基于深度学习的文本分类方法可提高生物医学文本的学科分类精度,推动医院评价和学科评估的发展。 相似文献
5.
目的:构建基于医学文本的预训练语言模型,以解决基于通用语料的预训练语言模型不适应医学文本分类的问题。方法:使用PubMed医学论文摘要数据和PMC医学论文全文数据在通用预训练语言模型Bert上进行二次预训练,得到医学领域的预训练语言模型BioBert,使用标注好的文本数据对BioBert进行微调,得到最终的医学文本分类模型。结果:病历文本和医学论文摘要文本两个数据集的分类实验显示,经过医学文本二次预训练的预训练语言模型在两个数据集上都取得了较好的分类效果。结论:通过自训练的方式对大量医学文本进行预训练得到的医学领域预训练语言模型,能在一定程度上解决使用通用预训练语言模型无法很好适配医学文本分布而导致分类性能偏低的问题。 相似文献
6.
1黔南苗医药对疾病病因的认识黔南苗医认为,季节变化是疾病发生的主要因素。光绪《乾州万志》记曰“春始见微霜,四时皆热。而人多生寒疾,盖症气卑湿,雾多风少,且冬寒返暖,则阴中之阳不固,复时阳雨反凉,则阳中之阴邪易侵,故阳不下降,阴上升,多上热一寒之疾也”指出风、寒、霜、雾皆为人体致疾因素。苗医认为,气、血、水是相成人生命的基本物质。人之所以生病,既因外为水毒、气毒、火毒所犯,内有情感、信念所动,亦因劳累损伤所致。其观点认为人体脾、胃是最重要的器官,主宰一切,胃能纳则百病能除。2黔南苗医药对疾病的分类和命名苗族没有文字,在认识疾病里有一定的局限性,特别对五脏六腑等内脏器官的认识不清晰,但长期的医疗实践中,通过对现象有认识,多以动、植、矿物命名,以明比隐,以形赋虚,便于记忆。与其他地区的苗族医药一样,黔南苗医药主要根据各种疾病的某些共同属性而将其归类。往往包含有该疾病的病因、病理、病症、病性及病势演变、预后等。黔南苗医药命名多依据发病部位或性质,取类比象。以动物形象命名,如口唇四肢发绀如乌鸦羽毛色叫“乌鸦经”;以植物形象命名,如其病灶溃烂如开花状称为“花”(如“肚花”);以家常使用之物品命名如“疔”;以主症命名如患者... 相似文献
7.
按照各民族医药的学科属性和文化特征将相关学者对民族医药古籍分类体系进行类和类的等级划分,综合考察中图法、科图法、古籍普查分类法、中华古籍总目编目规则、《中国中医古籍总目》、历代学者对医药古籍的分类方法,以及前期工作中对少数民族医药古籍实地调查情况,并结合少数民族医药古籍内容特征,将相同类目进行合并,上下级类目进行归类后分为上级类目和所属下级类目。本研究将少数民族医药古籍按照内容的不同划分为以下“一级类目”:医经、医理、诊疗、本草、方书、临床各科、养生、医案、医史、综合性医书、兽医等11大类。根据民族医药古籍文献内涵外延的解析以及其传统分类方法的研究,结合民族医药的学科特点和民族医药古籍文献的工作需要,对民族医药古籍文献类型进行了归纳和划分,列出一级、二级、三级、四级四个层次的分类体系简表,以供研究者参考。 相似文献
8.
《中医学报》2014,(12):1851-1854
按照各民族医药的学科属性和文化特征将相关学者对民族医药古籍分类体系进行类和类的等级划分,综合考察中图法、科图法、古籍普查分类法、中华古籍总目编目规则、《中国中医古籍总目》、历代学者对医药古籍的分类方法,以及前期工作中对少数民族医药古籍实地调查情况,并结合少数民族医药古籍内容特征,将相同类目进行合并,上下级类目进行归类后分为上级类目和所属下级类目。本研究将少数民族医药古籍按照内容的不同划分为以下一级类目:医经、医理、诊疗、本草、方书、临床各科、养生、医案、医史、综合性医书、兽医等11大类。根据民族医药古籍文献内涵外延的解析以及其传统分类方法的研究,结合民族医药的学科特点和民族医药古籍文献的工作需要,对民族医药古籍文献类型进行了归纳和划分,列出一级、二级、三级、四级四个层次的分类体系简表,以供研究者参考。 相似文献
9.
目的:探索机器学习方法在中医学派文本分类中的应用。方法:将数字化纯文本中医文献分为伤寒、外科、儿科、女科4类,选择Bigram作为特征分词方法、TF-IDF为特征提取方法、Chi-square为特征降维方法,基于LibSVM和LibLinear两种分类模型将待分类文献放入模型进行分类预测。结果:训练得到LibSVM模型正确率为0.9375,Liblinear模型正确率为0.9231,编号1-5的文献分类结果符合预期。结论:机器学习对中医文献识别分类具有普适性良好、正确率高、测试速度快的优点,适合中医学派文献资料的文本分类研究。 相似文献
10.
目的分析老年人咳嗽分类与临床特征。方法收集以咳嗽就诊老年科门诊并符合咳嗽诊疗指南的老年患者174例并回顾分析。结果急性咳嗽116例,亚急性咳嗽25例,慢性咳嗽33例。咳嗽病因:感冒咳嗽66.1%,慢性支气管炎10.3%,哮喘4.6%,X线胸片有明确病变3.5%,无明确病变15.5%(诊断不明2.3%)。全部做血常规及胸片检查。选择做CT、支气管镜、食道钡透、肺炎支原体抗体检查及经验性治疗和病因诊断性治疗后确诊率分别为15.2%、3%、33.3%、0、36.4%。结论感冒诱发的急性咳嗽和X胸片无明确病变的慢性咳嗽是老年人咳嗽的主要因素。 相似文献
11.
12.
13.
14.
目的探讨病例分型与住院病例费用结构的变化规律。方法从“军字一号”医院信息系统中提取2006年-2008年出院病人86,281份数据,运用病例分型软件对86,281例出院病人医疗费用结构进行统计对比分析。结果四种病例分型的医疗费用排序:D型〉C型〉A型〉B型。结论病例分型法分析医疗费用结构,有利于客观地评价住院病人医疗费用结构的合理性,为医院管理者评价和控制目前不断增长的医疗费用提供了新的管理模式。 相似文献
15.
目的利用终末病例分型方法探讨在医疗费用结构中资源消耗情况。方法利用终末病例分型统计分析软件对单病种其中之一"股骨干骨折"进行5年住院费用医院结构特点进行分析。结果四种终末病例分型医疗费用为D型〉C型〉B型,在不同的费用中各型略有不同。结论提示医院要优化费用结构,客观地评价医疗费用指标,在引导医生合理施治,合理收费上有可借鉴的管理思路,从而解除人们对医疗单位"看病贵"的意识。 相似文献
16.
目的/意义 梳理分析医疗健康领域问题分类发展现状,为提升医学问答系统性能提供思路。方法/过程 基于医疗健康领域问题分类相关文献资料,梳理现有分类体系、数据集、深度学习方法、评价标准和应用情况,分析未来医疗健康问题分类研究改进方向和核心科学问题。结果/结论 医疗健康问题分类有助于更好地理解问题,提高医疗健康领域问答系统性能,提供更高效的医疗服务。 相似文献
17.