基于机器学习的成纤维细胞生长因子受体激酶抑制剂虚拟筛选模型 |
| |
作者姓名: | 丁俊涛 刘博 吴建章 李物兰 |
| |
作者单位: | 1. 温州医科大学第一临床医学院(信息与工程学院);2. 温州医科大学附属眼视光医院 |
| |
基金项目: | 国家自然科学基金项目(81402839);;浙江省自然科学基金项目(LGF20B020001); |
| |
摘 要: | 目的:构建基于机器学习的高效成纤维细胞生长因子受体(FGFR)激酶抑制剂虚拟筛选模型。方法:收集公共数据集BindingDB中的FGFR激酶抑制剂;用RDkit计算分子描述符表征化合物分子用以数据输入;采用随机森林和支持向量机两种机器学习算法建立虚拟筛选模型,用准确率、精准率、召回率、受试者工作特征曲线下面积(AUC)四个指标对模型进行评价;使用随机森林模型对1 300万个化合物进行初步筛选;随后依次用Autodock Vina和Glide方法进一步筛选FGFR1激酶抑制剂;用分子动力学模拟对虚拟筛选得到的化合物进行分析。结果:构建的随机森林模型和支持向量机模型的准确率、精准率、召回率和AUC等评价指标有良好表现,随机森林模型的准确率和AUC分别可达0.878和0.952,随机森林模型可以用来作为FGFR激酶抑制剂的虚拟筛选模型。将随机森林模型用于大通量虚拟筛选获取高活性先导化合物,筛选所得3个最优化合物与FGFR1激酶的分子对接和分子动力学分析显示,在氢键、结合自由能、疏水作用与阳性药物AZD4547有较高相似性,FGFR1的LEU21、VAL29、ALA49三个残基是小分子药物保持...
|
关 键 词: | 虚拟筛选 机器学习 分子动力学 成纤维细胞生长因子受体 激酶抑制剂 |
|