Alphabet的DeepMind AI实验室今天宣布, AlphaFold系统在生物学领域取得了“重大科学进步” ,可能有助于药物发现过程。
蛋白质对生命至关重要,几乎支持生命的所有功能。它们是由氨基酸链组成的大型复杂分子,蛋白质的作用在很大程度上取决于其独特的3D结构。弄清蛋白质的形状是什么被称为"蛋白质折叠问题" ,过去50年来一直是生物学的一个重大挑战。
科学家们今天通过核磁共振、 X射线晶体学和晶体电子显微镜来确定蛋白质的结构。这些方法需要昂贵的设备,可能需要多年的"广泛试验和错误" 。
解开蛋白质,你会发现它就像一系列由20种不同类型的氨基酸组成的珠子。这些氨基酸之间的相互作用使蛋白质发挥了作用,因为蛋白质的形状几乎是无限的。
DeepMind的任务是使AI解决越来越多的问题,它利用了现有的努力, "仅仅根据其1D氨基酸序列计算预测蛋白质的3D结构" 。
科学界每两年举办一次竞赛,向研究人员提供新的蛋白质结构,而这些蛋白质结构只是以现有方法私下绘制的,以此刺激对这一方法的研究。然后对结果进行比较和评分。
在CASP14使用的最新版本AlphaFold中,我们创建了一个以注意力为基础的神经网络系统,对端到端进行培训,试图解释该图的结构,同时对该图正在构建的隐含图进行推理。它使用与进化相关的序列、多序列调整(MSA)和氨基酸残留配对的代表来完善该图。
DeepMind最新的AlphaFold系统在所有目标中的总得分为92.4 GDT 。90分以上的评级被认为与当今现有的劳力密集型方法相当。
这些令人兴奋的结果为生物学家利用计算结构预测作为科学研究的核心工具提供了可能性。
AlphaFold项目是Alphabet研究实验室为期四年的工作。这一最新进展对于发现治疗疾病的药物以及"发现分解工业废物的酶"特别有希望。
