首页 | 本学科首页   官方微博 | 高级检索  
     

基于朴素贝叶斯和word2vec的中医电子病历文本信息抽取
作者姓名:刘一斌  叶辉  易珺  曹东
作者单位:广州中医药大学医学信息工程学院 广州 510006;广东药科大学医药信息工程学院 广州 510006
基金项目:国家科学技术部重点研发计划项目
摘    要:中医电子病历(electronic medical record,EMR)包含大量的医疗知识和患者健康信息,对该类信息的抽取和挖掘对中医药的传承和创新有着重要意义。然而以纯文本形式记录的中医电子病历是一种非结构化信息,阻碍了中医药临床经验的总结与挖掘。本文主要讨论如何用机器学习算法对非结构化的中医电子病历文本进行信息的分类抽取,抽取出症状、处方、治法等有用信息。先将电子病历文本进行分词,然后进行标签标注,采用朴素贝叶斯和word2vec算法训练形成模型,最后进行模型测试。实验结果表明,该算法模型的信息抽取查准率可达80%以上。该研究在中医电子病历文本信息抽取领域做出了初步探索,为进一步进行中医药领域的数据挖掘和科研工作提供了良好的基础。

关 键 词:朴素贝叶斯  word2vec  中医电子病历  信息抽取
收稿时间:2018-12-26
修稿时间:2021-01-20
本文献已被 万方数据 等数据库收录!
点击此处可从《世界科学技术-中医药现代化》浏览原始摘要信息
点击此处可从《世界科学技术-中医药现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号