基于条件随机场的中医临床医案症状命名实体抽取研究* |
| |
作者姓名: | 高佳奕 刘震 杨涛 谢佳东 史话跃 董海艳 胡孔法 |
| |
作者单位: | 南京中医药大学人工智能与信息技术学院 南京210023;南京中医药大学第一临床医学院 南京210023 |
| |
基金项目: | 国家自然科学基金委青年项目(81803997):肝癌病证计算智能量化研究及体系构建,负责人:史话跃; 国家重点研发计划项目(2017YFC1703506):中医药大数据中心与健康云平台构建,负责人:李国正; 江苏高校护理学优势学科建设工程资助项目(2019YSHL068):基于集成学习的心脑血管常见病证诊断模型构建研究,负责人:杨涛 |
| |
摘 要: | 目的 从中医临床医案抽取症状命名实体。方法 对名老中医临床肺癌医案进行序列标记,利用条件随机场对标注样本进行学习,采取十折交叉验证对模型进行测试,使用多分类评价指标对模型结果进行评价。结果 CRF模型微平均的三个评价指标(P,R,F1)为(0.9233 ± 0.0063,0.9222 ± 0.0062,0.9211 ± 0.0062);宏平均评价指标为(0.8822 ± 0.0126,0.8322 ± 0.0215,0.8556 ± 0.0151)。病位权重由高到低依次为“背”、“胸”、“口”、“腰”、“鼻”等词;症状权重由高到低依次为“咳”、“痛”、“痰”、“酸”、“闷”等词。结论 利用条件随机场构建中医临床信息抽取模型,抽取结果符合中医辨证理论,能够有效实现中医临床医案症状命名实体识别。
|
关 键 词: | 条件随机场 中医临床医案 命名实体识别 信息抽取 |
收稿时间: | 2019-08-31 |
修稿时间: | 2020-04-18 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《世界科学技术-中医药现代化》浏览原始摘要信息 |
|
点击此处可从《世界科学技术-中医药现代化》下载全文 |
|