首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
针对传统基于关键词匹配的中医药信息检索存在查全率和查准率低下的缺陷,将本体与潜在语义索引相结合,提出一种基于中医药领域本体的语义信息检索模型.该模型基于本体概念扩展树构建相应的查询扩展方法和语义向量空间模型,将用户查询和文档集映射到同一潜在语义空间,通过计算查询向量与文档之间的相似度返回检索结果.着重阐述了该模型的体系结构、实现过程和关键技术,并对其实用性进行论证.  相似文献   

2.
阐述现有基因术语间语义相似度计算方法,提出基于融合高斯核函数的重启随机游走的基因本体术语相似度算法(Random Walk with Restart-based Similarity Measure,RWRSM),测试算法性能并进行分析,结果表明该算法优于其他算法,可以提高准确性及稳定性。  相似文献   

3.
针对国内电子病历(EMR)中临床日常用语特点,通过字面及语义相似度等完成了部分电子病历中的临床日常用语与人类表型术语集术语概念的映射,这对主流医学术语集富集中文电子病历同义词有较大的实践意义。研究结果显示,通过相似度算法和人工验证相结合,可有效降低中文同义词富集的人力消耗。随着基于众包机制的术语维护,电子病历中日常用语可被持续不断地和低成本地富集到人类表型术语集等主流医学术语集上。  相似文献   

4.
提出了一种面向翻唱歌曲识别的相似度融合算法。该算法将基于乐理特征的相似度和基于人耳感知特性的相似度融合,通过把基于节拍跟踪和瞬时频率音级轮廓(IF-PCP)的最大互相关相似度、基于和声音级轮廓(HPCP)的Qmax相似度、基于耳蜗音级轮廓(CPCP)的Qmax相似度映射到同一个多维空间,并计算其几何距离来进行相似度融合。该算法使得IF-PCP特征的节拍速度不变性、HPCP特征的和声优势、CPCP特征的人耳感知特性有效融合。为了验证算法的有效性,采用包含212首不同歌曲共502个版本的数据库作为测试对象,以平均正确率均值和TOP-N作为测试指标对算法性能进行测试。测试结果表明,与基于单一相似度算法相比,该融合算法可提高翻唱歌曲识别准确率。  相似文献   

5.
本文面向区域医疗信息共享需求,提出了一种基于语义的信息共享与服务机制,并设计了一种基于语义覆盖网的信息共享体系框架。该框架充分考虑各医疗单位信息自治与区域内信息共享要求,提供了一种趋于扁平化的信息共享与服务环境。该框架通过自底向上和自顶向下相结合的模式,在各医疗单位设计信息资源中心完成基于语义的信息整合与组织的基础上,采用基于语义相似度聚类的构建语义覆盖网络,提供基于语义的信息共享与服务能力。  相似文献   

6.
杨妹  陈宁 《医学教育探索》2018,44(5):752-759
在翻唱歌曲识别中,手工设计的特征虽然具有高可定制性,但其采用的浅层线性结构难以表现音乐的非线性长效结构,而采用基于深度学习的特征提取算法分析音乐的非线性动力学特性可以弥补这一缺陷。本文在研究两者互补性的基础上,提出了一种融合手工特征和深度特征的翻唱歌曲识别算法。该算法分别采用深度学习模型和手工设计算法提取歌曲的音级轮廓特征和旋律特征,然后将基于这两种特征的相似度组合成相似度向量输入到改进的SVM模型中,并将输入歌曲属于翻唱组合的概率作为融合相似度。为了验证算法性能,以两个公开的数据库(covers80,covers1212)作为测试对象进行测试,实验结果表明该算法比基于单个特征的算法和基于相似度融合的算法取得了更高的识别率和分类准确率。  相似文献   

7.
针对中文医疗文献中的中文词边界模糊、分词歧义导致传统深度学习方法难以获取词汇语义信息的问题,提出了一种融合嵌入字词特征的中文医疗命名实体识别模型。首先,针对词向量缺失边界特征的问题,将词向量与词性、词边界特征拼接融合,结合注意力机制捕获字符间潜在的依赖权重等特征和增强词汇向量;其次,将通过BERT模型获得的字符向量与增强词汇向量拼接融合作为嵌入的基础上,利用BiLSTM模型提取上下文语义信息特征;最后通过CRF模型进行序列解码。利用瑞金医院标准化代谢性疾病管理中心(MMC)的糖尿病标注数据集对融合嵌入字词特征的中文医疗命名实体识别模型进行实验,获得了较好的结果。  相似文献   

8.
目的 探讨五级症状程度语义量词的赋值及赋值差值分布规律.方法 165名大学生对五级症状程度语义量词进行赋值,对区间赋值和点赋值进行比较,并分析赋值差值的分布特征、组内各词赋值差值之间的差异程度.结果 五级症状程度语义量词内每个词的模糊度不同,其序列关系与自然语言中的序列关系基本一致,但词与词的赋值区间并不完全等距.被试的区间赋值范围与点赋值的95%、99%可信区间无显著差异.语义量词的赋值差值呈正偏态分布,偏度系数=2.136,峰度系数=7.258,组内各词赋值差值差异显著(F=15.5l,P<0.01).结论 五级症状程度语义量词赋值区间不完全等距,语义量词赋值差值大小呈正偏态分布,词与词之间赋值区间宽度差异较大.  相似文献   

9.
采用自标注中文电子病历标准数据集,融合相似度算法与预训练模型并分别应用于实体映射的候选实体生成和实体消歧阶段,对不同相似度算法和预训练模型的性能进行比较分析。提出基于别名间相似性改进药物类实体映射效果的方法,结合Jaccard相似度算法与BERT预训练模型,高效实现海量中文电子病历实体映射任务。  相似文献   

10.
利用共现分析构建概念空间,实现语义检索,是当前信息组织和检索领域研究热点之一。阐明概念空间的定义、意义、应用及构建方法,介绍词共现分析技术的内涵、应用前提、演进历程、步骤与方法,从多个角度系统综述词共现分析在构建概念空间、本体、揭示语义关系等方面的应用状况,为构建基于概念空间的信息检索可视化系统研究奠定基础。  相似文献   

11.
以R语言中的复杂网络处理包igraph为工具,基于语义相似性算法构建论文相似网络,然后采用四种代表性网络聚类算法(随机游走法、标签传播法、最大模块度法、边介数法)对构建出的网络进行聚类分析。最后结合金标准和网络社团划分评价指标D函数比较四种算法的准确性和稳定性,发现随机游走算法最为卓越,同时明确了复杂网络的预处理也是一个影响聚类效果的重要因素。  相似文献   

12.
针对由于用户评价矩阵的数据稀疏性而导致推荐精度和准确率不高的问题,提出了一种基于双层相似度的协同过滤算法。经典算法通过改进某一种相似度或者混合相似度来提高推荐精度和准确度,本文对此进行了改进,将最近邻相似度和最近评分相似度两个概念进行区分,采用双层相似度来寻找这两个概念层次的邻居。第1层用来寻找与用户行为偏好的最近邻居,基于用户共同评价行为和差异行为的对数似然比及用户物品属性偏好相似性来实现。第2层用来寻找在评分意义上的最近评分邻居,通过改进的皮尔森相似度衡量用户评分上的相似性,给用户未知的物品进行评分预测。在Movielens数据集上的实验结果表明,本文算法能够快速排除干扰找到用户邻居,极大地提高了推荐系统的精确度、准确率。  相似文献   

13.
郑小霞  钱锋 《医学教育探索》2006,(12):1458-1462
提出一种基于变精度粗糙-模糊集模型的诊断知识获取算法,利用相似性聚类方法自动获取模糊隶属函数,将连续属性表示成模糊值,通过定义模糊相似关系和模糊相似类给出了变精度粗糙-模糊模型的近似表示,并引入蚁群算法求取模糊相似关系下的属性约简,进行诊断知识的获取。将其应用于精对苯二甲酸生产过程尾氧浓度故障诊断知识获取中,结果表明:该算法可以从故障数据中提取更客观有效的诊断规则,在实际故障诊断中具有很好的应用价值。  相似文献   

14.
为解决中药新药研发中的信息集成和检索问题,设计并实现了语义搜索系统TCMSearch。为实现分布式、异构数据库的语义集成和一致性访问,提出语义视图,来定义关系型数据库与领域本体之间的模式映射。该系统根据关系型数据库的语义视图,将用户提出的语义查询重写为结构查询语言(SQL)查询,再分派给各个关系型数据库,最终将查询结果进行语义封装。它还基于本体构建文本内容的语义索引,从而实现了基于概念的内容检索。这些本体驱动的方法,使该系统与关键词搜索系统相比,具有更高的查准率与查全率。该系统已成功部署,它基于一个大型中药领域本体,通过Web方式为中药领域专家提供智能搜索服务。  相似文献   

15.
Similarity measurement of lung nodules is a critical component in content-based image retrieval (CBIR), which can be useful in differentiating between benign and malignant lung nodules on computer tomography (CT). This paper proposes a new two-step CBIR scheme (TSCBIR) for computer-aided diagnosis of lung nodules. Two similarity metrics, semantic relevance and visual similarity, are introduced to measure the similarity of different nodules. The first step is to search for K most similar reference ROIs for each queried ROI with the semantic relevance metric. The second step is to weight each retrieved ROI based on its visual similarity to the queried ROI. The probability is computed to predict the likelihood of the queried ROI depicting a malignant lesion. In order to verify the feasibility of the proposed algorithm, a lung nodule dataset including 366 nodule regions of interest (ROIs) is assembled from LIDC-IDRI lung images on CT scans. Three groups of texture features are implemented to represent a nodule ROI. Our experimental results on the assembled lung nodule dataset show good performance improvement over existing popular classifiers.  相似文献   

16.
目的:建立基于中医药优势病种文献的语义网络模型。方法:顶层参考中医药学语言系统并结合专家咨询设定模型中的语义类型和语义关系,底层基于获取的中医药优势病种文献全信息结构解析进行语义类型和语义关系补充。结果:构建了基于语义表达的中医药优势病种网络模型。结论:基于语义表达的中医药优势病种网络模型可以支持中医药优势病种文献数据库的构建和中医药优势病种文献的语义检索与利用。  相似文献   

17.
主题模型因能够有效捕获离散数据间的语义关系和挖掘隐含的主题,而在语义分析、文本分类、信息检索等领域得到广泛的应用。在“证候-症状-用药”的辨证诊疗模式中,主题模型能够挖掘中医多类实体间的复杂语义关系。基于Link-LDA模型,提出了Multi-Link-LDA模型。利用这两种模型,在不同中医诊疗数据集上进行示范性分析,结果显示主题模型能够较好地捕获中医的诊疗规律。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号