摘 要: | 目的 探讨百度关键词在清远市流感发病预测中的适用性。方法 收集《中国疾病预防控制信息系统》清远市范围内2012年12月31日至2017年12月24日每周流感发病数,同时从百度指数官网收集同期流感相关关键词在清远市范围内的百度指数,利用流感实际发病数拟合自回归移动平均模型(ARMA),利用实际发病数和相关的流感百度指数拟合自回归分布滞后模型(ARDL),比较两个模型的优劣。结果 共收集260周数据,流感发病11 895例,共收集15个流感相关百度指数,其中与实际发病数相关系数大于等于0.3的百度指数6个,与流感发病数呈单向格兰杰因果关系的百度指数有1个,为“流感”。利用前256周数据建立的ARMA模型预测未来4周流感发病数时,模型调整决定系数为0.80,其均方根误差(RMSE)=95.25,平均绝对百分误差(MAPE)=45.49,希尔不等式系数(TIC)=0.25。利用前256周数据建立的ARDL模型预测未来4周流感发病数时,模型调整决定系数为0.81,其均方根误差(RMSE)=79.07,平均绝对百分误差(MAPE)=39.67,希尔不等式系数(TIC)=0.19。ARDL模型的预测精度优于ARMA模型。结论 利用百度指数建立的流感发病预测模型能够增加预测准确性,适用于流感发病预测。
|