集成学习在水产品无机砷含量预测中的应用研究 |
| |
引用本文: | 梁怀新,王润东,王浩然,刘斌,郑存芳.集成学习在水产品无机砷含量预测中的应用研究[J].职业与健康,2024(7):913-916+922. |
| |
作者姓名: | 梁怀新 王润东 王浩然 刘斌 郑存芳 |
| |
作者单位: | 1. 秦皇岛市疾病预防控制中心理化检验科;2. 河北港口集团港口医院检验科;3. 燕山大学电气工程学院 |
| |
摘 要: | 目的水产品中无机砷元素慢性暴露严重危害人体健康,其检测时间成本较高,为实现无机砷元素含量快速预测,构建一种基于小样本特征量的无机砷元素含量预测集成学习模型。方法抽取2018—2022年秦皇岛地区水产品重金属元素检测数据,采用皮尔逊法对铅、镉、汞、无机砷4种元素做相关性分析并检验多重共线性。使用逐步回归向量组合法测试不同特征组合下梯度提升回归树(gradient boosting regressor,GBR)和随机森林模型(random forest,RF)的拟合优度(R2)及均方误差(mean squared error,MSE),以筛选最优组合。综合比对5种集成学习算法在模型评估指标、预测误差比率分布、目标危险系数(target hazard quotients,THQ)三方面的预测效果以评估方法可行性。结果4种重金属元素间呈弱相关,不存在多重共线性。RF及GBR算法拟合优度R2分别为89.9%、93.3%。极端学习树模型(extremely randomized tree,ET)在贝、鱼、蟹、虾类水产品中R2分别为1...
|
关 键 词: | 无机砷 回归预测 水产品 小样本 |
|
|