首页 | 本学科首页   官方微博 | 高级检索  
检索        

基于Skip-gram词嵌入算法的结构化患者特征表示方法研究
引用本文:黄艳群,王妮,刘红蕾,费晓璐,巍岚,陈卉.基于Skip-gram词嵌入算法的结构化患者特征表示方法研究[J].北京生物医学工程,2019,38(6).
作者姓名:黄艳群  王妮  刘红蕾  费晓璐  巍岚  陈卉
作者单位:首都医科大学生物医学工程学院 北京100069;首都医科大学临床生物力学应用基础研究北京市重点实验室 北京 100069;首都医科大学宣武医院 北京 100053
基金项目:国家自然科学基金;国家自然科学基金
摘    要:目的基于表示学习中的Skip-gram词嵌入算法,寻找能够克服电子病历中结构化特征的高维性并在语义层次上表示特征的方法。方法本文的数据来源于北京市某三甲医院的电子病历系统,从中提取患者的结构化特征,包括疾病、药物和实验室指标,其中实验室指标通过正常值范围离散化;利用Skip-gram算法,将电子病历中离散型患者特征(疾病和药物)和离散后的连续型患者特征(实验室指标)嵌入到同一个低维实数向量空间中。通过t-SNE降维可视化方法显示低维实数空间中特征向量的关系,并与特征向量间的余弦距离计算结果相互印证,从而评价特征表示的有效性和揭示特征向量间的潜在联系。结果患者特征的低维实数向量既降低了患者特征的维度,又很好地表征了特征间的潜在联系,临床含义相关的特征表示成的低维实数向量也很相近。结论基于Skip-gram算法将患者结构化特征表示成低维实数向量取得了较好的效果,为解决EMR数据表示的高维性以及结构化特征间潜在关系分析提供一种思路。

关 键 词:电子病历  Skip-gram算法  特征表示  自然语言处理  词嵌入
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号