首页 | 本学科首页   官方微博 | 高级检索  
     

基于SMOTE算法和决策树的绝经后骨质疏松性骨折分类模型建构
引用本文:章轶立 魏戌 聂佩芸 申浩 虞鱿 康树 谢雁鸣. 基于SMOTE算法和决策树的绝经后骨质疏松性骨折分类模型建构[J]. 中国骨质疏松杂志, 2019, 0(1): 1-5
作者姓名:章轶立 魏戌 聂佩芸 申浩 虞鱿 康树 谢雁鸣
作者单位:1.中国中医科学院中医临床基础医学研究所,北京1007002.中国中医科学院望京医院科研处,北京1001023.中国人民大学统计学院,北京1008724.上海大华医院中医科,上海2002375.北京中医药大学附属东直门医院放射科,北京100700
基金项目:基金项目:国家自然科学基金面上项目(81373885);北京市中医药科技发展资金项目(JJ2015-57)
摘    要:目的构建符合北京、上海两地40~65岁女性人口学特征的危险因素和中医症状相结合的骨质疏松性骨折早期风险预测工具。方法本研究采用注册登记式研究的方法 ,于2009年3-8月在北京市东城区及上海市徐汇区收集的1 823例40~65岁女性骨质疏松症高危人群的危险因素及中医症状信息,进行连续3年的登记观察。采用SMOTE过抽样算法平衡数据,基于决策树模型筛选与骨质疏松症骨折有关的危险因素及中医症状,并建立骨质疏松性骨折风险评估工具。结果本研究选择C4.5算法作为预测模型建立工具。首先筛选出对绝经后骨质疏松性骨折高危患者发生脆性骨折的危险因素,然后建立预测模型。由于样本量较小,在节点的设置中采用交叉验证,Mode选用Expert,修剪纯度设为75,采用全局修剪。根据此生长和修剪规则,所建立分类树模型共包括5层,共19个结点,共筛选出6个解释变量。各指标按重要程度从大到小依次为骨密度、目眩、肉类、生产次数、视物模糊和乏力。经过逐层各影响因素的分类,最终骨折人群比例占13%。对该预测模型预测概率绘制受试者工作特征曲线,结果显示曲线下面积为0.871(95%CI=0.8226-0.9211)。结论初步建立了基于北京、上海人口学特征40~65岁女性骨质疏松性骨折分类模型。

关 键 词:骨质疏松性骨折  风险评估  SMOTE过抽样  决策树模型

The construction of postmenopausal osteoporosis model based on SMOTE and strategy tree method
ZHANG Yili,WEI Rong,NIE Peiyun,SHEN Hao,YU Kun,KANG Shu,XIE Yanming. The construction of postmenopausal osteoporosis model based on SMOTE and strategy tree method[J]. Chinese Journal of Osteoporosis, 2019, 0(1): 1-5
Authors:ZHANG Yili  WEI Rong  NIE Peiyun  SHEN Hao  YU Kun  KANG Shu  XIE Yanming
Abstract:
Keywords:osteoporotic fracture   risk evaluation   SMOTE   strategy tree model
本文献已被 CNKI 等数据库收录!
点击此处可从《中国骨质疏松杂志》浏览原始摘要信息
点击此处可从《中国骨质疏松杂志》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号