首页 | 本学科首页   官方微博 | 高级检索  
检索        

中文病历文档术语提取和否定检出方法
引用本文:李昊旻,李莹,段会龙,吕旭东.中文病历文档术语提取和否定检出方法[J].中国生物医学工程学报,2008,27(5).
作者姓名:李昊旻  李莹  段会龙  吕旭东
作者单位:浙江大学生物医学工程与仪器科学学院生物医学工程教育部重点实验室,杭州,310027
基金项目:国家高技术研究发展计划(863计划)  
摘    要:利用生物医学术语系统中的词汇和概念,为存有大量珍贵信息的非结构化临床文档建立有效的索引,以便进行信息挖掘和利用,国际上相关研究已经开展多年,而基于中文病历文档概念索引的研究尚属空白。本研究将现有的中文版的国际疾病分类(ICD)集成到统一医学语言系统(UMLS)中,依据中文语言处理的特殊性,对中文电子病历文档进行统计分析,提出了一套中文病历文档术语提取和否定检出的方法,可用于建立中文病历文档的概念索引。术语提取阶段利用高灵敏的最大匹配法并结合通用分词技术来控制假阳性;而在概念否定意义检出部分,充分利用中文特点并基于现有中文处理技术提出了一种简化的子句模式匹配方法。选取了两组医疗文本数据集对算法进行了验证,术语提取算法的灵敏性分别为99.51%和100%,误检率分别为1.46%和1.66%。否定检出算法的阳性预测值均为100%,阴性预测值分别为100%和98.99%,除标点使用不规范等文书质量问题外,基本可以正确检出。

关 键 词:医学语言处理  术语提取  否定检出

Term Extraction and Negation Detection Method in Chinese Clinical Document
LI Hao-Min,LI Ying,DUAN Hui-Long,LV Xu-Dong.Term Extraction and Negation Detection Method in Chinese Clinical Document[J].Chinese Journal of Biomedical Engineering,2008,27(5).
Authors:LI Hao-Min  LI Ying  DUAN Hui-Long  LV Xu-Dong
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号