面向真实世界的知识挖掘与知识图谱补全研究(三):基于正则表达式对膀胱癌真实世界数据的结构化信息抽取 |
| |
作者姓名: | 马文昊 石涵予 黄桥 黄兴 王永博 王诗淳 任相颖 施悦 靳英辉 阎思宇 |
| |
作者单位: | 1. 武汉大学中南医院循证与转化医学中心;2. 武汉大学第二临床学院;3. 武汉大学弘毅学堂;4. 浙江大学医学院附属第一医院泌尿外科;5. 武汉大学中南医院信息中心 |
| |
基金项目: | 国家自然科学基金面上项目(82174230); |
| |
摘 要: | 随着医疗大数据的发展,真实世界研究近些年来越来越受到重视,发展前景良好,但真实世界研究的实施仍存在一些挑战,引起学者们广泛讨论。真实世界数据的非结构化是目前最亟待解决的问题。本研究以正则表达式为基础,通过基于规则的信息抽取方法对武汉大学中南医院近几年膀胱癌患者的入院记录、病理报告、手术记录和影像记录等数据进行结构化信息抽取,并以准确率和召回率为指标评价其抽取效果,旨在为后续研究提供参考。
|
关 键 词: | 真实世界数据 信息抽取 正则表达式 自然语言处理 电子病历数据 膀胱癌 |
|