整个宇宙充满了无数的分子。但是,这些分子中有多少具有潜在的药物特性,可以用于开发救生药物?百万?亿、万亿?
答案是:好吧,妖君打不出来,直白说就是1后面跟着60个零,数学牛的人可以试着读一下是多少了。
这一巨大数字延长了快速传播疾病(如covid-19)的药物开发过程,因为它远远超出了现有药物设计模型的范围。
麻省理工学院的研究人员开发了一种称为equibind的几何深度学习模型,其速度是现有最快的计算分子对接模型quickvina2-w的1200倍,并成功地将类药物分子与蛋白质结合。
Equibind是在其前身equidock的基础上开发的,equidock专门使用晚期屋大维Eugen ganea开发的技术来结合两种蛋白质。这项技术最近由麻省理工学院计算机科学和人工智能实验室以及Abdul Latif Jameel健康机器学习诊所博士后研究员开发。
在药物开发开始之前,药物研究人员必须找到可用的类药物分子,这些分子可以在药物发现过程中正确结合或“对接”到某些蛋白质靶点。与蛋白质成功对接后,结合药物(也称为配体)可以阻止蛋白质发挥作用。如果这种情况发生在细菌的一种必需蛋白质上,那以这种药物就可以杀死细菌并保护人体。
然而,药物发现过程在财务上和计算上都很昂贵,在这一过程中需要投入数十亿美元,在食品和药物管理局最终批准之前,这一过程已经开发和测试了十多年。
更重要的是,90%的药物在人体试验后由于无效或太多副作用而失败。制药公司收回这些失败成本的一种方法是提高成功药物的价格。
当前搜索有希望的候选药物分子的计算过程如下:大多数最先进的计算模型依赖于大量候选样本和评分、排序和微调等方法来获得最佳的“拟合”。
Hannes Stärk是麻省理工学院电气工程和计算机科学系的一年级研究生,他将典型的配体-蛋白质结合方法比作“试图将钥匙插入有许多锁孔的锁中”在选择最佳模型之前,典型模型将花费大量时间对每个“适合度”进行评分。相反,equibind可以在一个步骤中直接预测精确的关键位置,而无需事先知道蛋白质的目标口袋,这称为“盲对接”。
与大多数需要多次尝试才能找到配体在蛋白质中的有利位置的模型不同,equibind具有内置的几何推理功能,可以帮助模型学习分子的基本物理性质,并在遇到新的和不可见的数据时成功地进行概化,以做出更好的预测
这些发现的发布很快引起了行业专业人士的注意,包括接力疗法首席数据官帕特·沃尔特斯。沃尔特斯建议研究小组在肺癌、白血病和胃肠道肿瘤的现有药物和蛋白质上尝试他们的模型。虽然大多数传统的对接方法无法成功地结合作用于这些蛋白质的配体,但equibind成功了。
沃尔特斯说:“Equibind为对接问题提供了一种独特的解决方案,它结合了姿势预测和结合位点识别。”。“这种方法利用了数千种公开可用的晶体结构的信息,有可能以新的方式影响该领域。”