共查询到19条相似文献,搜索用时 640 毫秒
1.
2.
目的:利用文本挖掘的方法识别肺癌治疗的研究前沿热点。方法:在Pub Med数据库中检索2013-2014年发表的肺癌治疗相关文献,利用Meta Map进行UMLS概念映射,通过语义类型的限定去除较为宽泛意义的词,利用文档主题生成模型LDA进行主题识别。结果:利用LDA可以识别出肺癌治疗方面近两年的研究主题。结论:分析主题结果并阅读相关文献,可得出近年肺癌治疗的研究热点主题,为相关医学科研人员和管理人员提供参考。 相似文献
3.
4.
5.
6.
7.
目的:探讨应用新颖性探测模型评估医学文献主题新颖性的可行性,对比分析2种新颖性探测方法(词重叠法和基于共词的逆文档频率量化法)的优劣。方法:选取生物医学领域8个研究主题,从PubMed数据库收集文献,构建2种新颖性探测模型,结合文献主题新颖性的专家分析结果,利用ROC曲线及AUC值对2种新颖性探测模型的可行性进行评估。结果:词重叠法的新颖度计算结果波动幅度较大,能够更好地将文献内容间差异表现在数据上。基于ROC曲线及AUC值分析,词重叠法对于判断新颖文献具有一定准确性,基于共词特性的逆文档频率量化法对于判断新颖文献准确性较低。结论:两种新颖性探测方法得出的新颖度计算结果呈中度相关,二者的均值差异有统计学意义,前者的表现优于后者。 相似文献
8.
目的/意义揭示国内智慧养老领域研究热点主题。方法/过程选取中国知网作为检索数据库,以2004—2023年智慧养老领域期刊论文、学位论文和会议论文的摘要作为研究数据,运用LDA主题模型进行文本挖掘,利用困惑度和一致性确定最佳主题数量。根据主题-词分布进行主题识别,根据文档-主题分布计算各主题强度。结果/结论 LDA主题模型提取得到国内智慧养老领域主题共9个,其中热点主题为服务架构、数字化转型、社区养老、用户调研。 相似文献
9.
10.
《河北医科大学学报》2000,21(3):175-175
分类号通常是指《中国图书资料分类法》或《中国图书馆图书分类法》的分类表中的分类号。分类表是分类语言的文字体现。分类语言和主题词同属于情报信息检索语言 ,分类语言是用分类号来表达文献主题概念的 ,分类语言是通过学科知识的分类体系来揭示文献主题概念的。作为情报信息语言 ,分类语言和主题词的作用及功能是互补的。分类语言是由符号体系、词汇和语法组成的。符号体系即是分类语言类名所使用的代码系统 ,这种代码系统通常由字母和阿拉伯数字组成。为了便于文献的检索、存储和编制索引 ,发表的论文应按照《中国图书资料分类法》(第… 相似文献
11.
目的:基于文献和专利数据评估主要国家在医疗机器人领域的科技发展水平,识别其研究热点。方法:借助兰德公司的开源方法,通过高影响力文献、合作网络密度、质量调整专利和科技组织能力4个指标评估科技发展水平,使用VOSviewer和LDA主题分类模型对研究热点进行识别。结果:欧美国家更重视交流合作和专利质量把控,中国则在科技组织能力方面占优,但专利质量有待提高。通过文献和专利数据识别出机器人参与手术、泌尿科疾病治疗、机器人系统设计、物理技术支持等主题。结论:国内研究主体应重视跨机构、跨国别的学术交流与合作,关注国内专利质量的审查制度和“专利泡沫”的产生,加强政产学研用联系、多赛道同步发展,全面发展医疗机器人市场。 相似文献
12.
目的:探讨互联网军事医学公开信息资源的收集与鉴选策略。方法:确定互联网军事医学信息资源采集范围,构建互联网军事医学信息资源自动识别辅助词表,构建军事医学信息资源鉴选规则。结果:确立了专题收集与选择性收集相结合的网络军事医学信息资源采集策略,并进行了实验验证。结论:通过军事医学信息资源自动识别辅助词表可实现军事医学信息资源识别,说明结合词汇类别、出现频次、出现位置、载体性质、文献类型等因素进行信息筛选的研究思路是可行的。 相似文献
13.
以中文医学论文摘要为语料,采用3种特征筛选方法以及两种主题模型方法的组合进行主题建模,结果表明建模方法中LDA的预测能力和拟合度优于CTM,而特征筛选方式中IDF拟合度、TF预测能力更好。 相似文献
14.
With the rapid development of the Internet, more and more users utilize health communities (known as forums) to find health-related information, share their medical stories and experiences, or interact with other people in the communities. In this paper, we propose a framework to analyze the user-generated contents in a health community. The proposed framework contains three phases. First, we extract medical terms, including conditions, symptoms, treatments, effectiveness and side effects to form a virtual document for each question in the community. Next, we modify Latent Dirichlet Allocation (LDA) by adding a weighted scheme, called conLDA, to cluster virtual documents with similar medical term distributions into a conditional topic (C-topic). Finally, we analyze the clustered C-topics by sentiment polarities, and physiological and psychological sentiment. The experiment results show that conLDA outperforms the original LDA, and can cluster relevant medical terms and relevant questions together. The C-topics clustered by conLDA are more thematic than those clustered by the original LDA. The results of sentiment analysis may provide a quick reference and valuable insights for patients, caregivers and doctors. 相似文献
15.
在已实现疑似肺结节图像分割的基础上,提取肺结节图像多维特征,应用LDA和SVM统计分类器,通过对大量样本的训练,实现对肺结节CT图像的自动检测和诊断。实验结果表明该检测和诊断方法达到了较好的分类效果,是适用于CAD系统的实用方法。 相似文献
16.
目的:设计一种基于深度学习的BERT-TextCNN模型,用于临床试验筛选短文本的自动化识别与分类.方法:调研文本分类的常见算法,从中国健康信息处理会议开发的临床试验中筛选短文本分类数据集,比较分析BERT-TextCNN模型、BERT模型和TextCNN模型的性能差异.结果:BERT-TextCNN模型的文本分类平均... 相似文献
17.
18.
提出了将医学叙词表MeSH词汇加入到通用分词表中进行分词,并利用MeSH词汇结合词长、词语所在位置加权实现医学新闻网页的关键词自动提取策略。作者随机选取了10家网站100篇医学新闻进行人工关键词标引,并采用机器标引与人工标引比照的方式进行验证的结果表明,关键词抽取精度达0.34,召回率达0.30,实验证明该策略可行。 相似文献
19.
目的:总结医学大学生创新创业训练计划项目("大创计划")总体立项和各方向及领域的选题情况,对实施情况和选题进行全面探索.方法:对2008-2021年上海交通大学医学院的243个国家级"大创计划"进行分类统计,比较不同年份、各个学生特征的项目数,对选题进行大类和小类分组,统计各类别的选题百分比及随年份变化的情况.结果:五... 相似文献