摘 要: | 目的:构建基于机器学习的高效成纤维细胞生长因子受体(FGFR)激酶抑制剂虚拟筛选模型。方法:收集公共数据集BindingDB中的FGFR激酶抑制剂;用RDkit计算分子描述符表征化合物分子用以数据输入;采用随机森林和支持向量机两种机器学习算法建立虚拟筛选模型,用准确率、精准率、召回率、受试者工作特征曲线下面积(AUC)四个指标对模型进行评价;使用随机森林模型对1 300万个化合物进行初步筛选;随后依次用Autodock Vina和Glide方法进一步筛选FGFR1激酶抑制剂;用分子动力学模拟对虚拟筛选得到的化合物进行分析。结果:构建的随机森林模型和支持向量机模型的准确率、精准率、召回率和AUC等评价指标有良好表现,随机森林模型的准确率和AUC分别可达0.878和0.952,随机森林模型可以用来作为FGFR激酶抑制剂的虚拟筛选模型。将随机森林模型用于大通量虚拟筛选获取高活性先导化合物,筛选所得3个最优化合物与FGFR1激酶的分子对接和分子动力学分析显示,在氢键、结合自由能、疏水作用与阳性药物AZD4547有较高相似性,FGFR1的LEU21、VAL29、ALA49三个残基是小分子药物保持...
|