摘 要: | 目的探讨两种不同机器学习算法在海口市男男性行为(MSM)人群HIV患病情况风险预测中的应用。方法收集经过数据清洗和筛选后共计3184个样本数据作为抽样集,生成随机序列抽取编号,保证数据均衡的情况下,随机抽样200个,分别运用支持向量机和Logistic回归两种机器算法进行预测分类,依据4个评价指标,比较两种算法预测结果的准确度。并在抽样集上,采用Logistic回归模型对HIV患病情况进行影响因素分析。结果支持向量机灵敏度为0.955,特异度为0.938,准确度为0.950,相对提升度为158.333%;Logistic回归的灵敏度为0.545,特异度为0.750,准确度为0.600,相对提升度为63.158%;哨点监测数据中,Logistic回归模型采用逐步回归法,筛选出3个HIV患病影响因素,采取安全措施和接受预防服务为保护因素,OR值为0.410和0.820;患有伴随性病为危险因素,OR值为3.626。结论在分类与预测方面,支持向量机的结果比Logistic回归模型更加精确。MSM人群应当注意采用安全措施、接受干预服务,提高预防性病的风险意识,减少患HIV的可能性。
|