DeepMind 发布 AlphaFold 3 能够预测所有生命分子结构和相互作用的 AI 模型

Google DeepMind 发布了 AlphaFold 3 ,一个能够预测所有生命分子结构和相互作用的 AI 模型。 该模型能够生成蛋白质、DNA 和其他分子的 3D 结构,并揭示它们是如何组合在一起的。

该模型还能够模拟影响细胞健康的化学变化,并检测可能导致疾病的异常。 AlphaFold 3 将为全球科学研究人员和机构免费开放。它的高精度和新一代架构可支持药物发现和生物学的突破性进展。

在我们体内的植物、动物和人类细胞中,存在着数十亿个分子机器。这些机器由蛋白质、DNA 以及其他分子组成,彼此间不断互动,通过数以百万计的组合,共同决定了生命的运作方式。

AlphaFold 3 的革命性模型,它可以前所未有的精度预测所有生命分子的结构和相互作用。与现有方法相比,它在蛋白质与其他分子的相互作用预测上至少提升了 50% 的准确率,在一些重要领域甚至翻倍。

AlphaFold 3 让我们首次能够精确预测包括蛋白质(proteins)、核酸(nucleic acids)、小分子(small molecules)、离子(ions)和修饰残基(modified residues)在内的复杂生物分子的结构。

为了发挥 AlphaFold 3 在药物设计方面的潜力,Isomorphic 实验室已经开始与制药公司合作,应用这一技术解决现实世界中的药物设计挑战,旨在为患者开发出改变生活的新疗法。

主要功能特点:

  1. 准确预测生物分子相互作用:

    在我们的细胞内部,有无数分子像小机器一样运作,这些包括蛋白质、DNA 和 RNA 等大分子,还有很多作为药物基础的小分子,被称为配体。AlphaFold 3 就是通过输入这些分子的信息,来预测它们在三维空间中如何组合和相互作用的。

    这个模型的强大之处,在于它采用了一种全新的架构和训练方法,覆盖了所有类型的生命分子。其核心是一个升级版的 Evoformer 模块,这是一种深度学习架构,为 AlphaFold 2 提供了强大的支持。在处理了输入数据后,AlphaFold 3 会用所谓的 Diffusion网络来整合预测结果。这个过程开始于一个由原子云组成的模型,然后经过多个步骤,逐步精细化,最终形成一个精确的分子结构。

    AlphaFold 3 的预测能力远超现有的任何系统。它能以一种全局的方式,计算整个分子复合体,从而统一整合科学研究中的洞见。

    • 蛋白质-配体相互作用:
      • AlphaFold 3在蛋白质-配体相互作用的预测上显著超越了传统的对接工具。
      • 通过扩散网络预测蛋白质与药物分子等小分子配体的相互作用,确保高精准度的结合位点和结构预测。
    • 蛋白质-核酸相互作用:
      • 比同类工具更准确地预测蛋白质-核酸(DNA和RNA)复合体的结构。
      • 该功能在研究转录调控、基因表达和RNA翻译等领域尤为关键。
    • 抗体-抗原相互作用:
      • AlphaFold 3在抗体-抗原预测上具备比前代模型更高的准确性,显著提升预测质量和可靠性。

        7PNM 是一种普通感冒病毒(冠状病毒 OC43)的刺突蛋白:AlphaFold 3 对这种感冒病毒刺突蛋白的结构预测显示(蓝色),它与抗体(青绿色)和简单糖分子(黄色)相互作用,结构与实际真实的(灰色)高度一致。动画展示了蛋白质先与抗体结合,再与糖分子结合的过程。深入研究这种免疫系统相互作用的机制可以帮助我们更好地了解冠状病毒,包括 COVID-19,从而有望改进治疗方案。

  2. 全面的多分子建模:

    给定输入的分子列表,AlphaFold 3 生成它们的联合 3D 结构,揭示它们如何组合在一起。它不仅可以建模蛋白质、DNA 和 RNA 等大型生物分子,还可以建模小分子(通常称为配体,ligand)——这是一类包含许多药物的分子。此外,AlphaFold 3 还能模拟这些分子的化学修饰,从而控制细胞的健康功能,而这些功能一旦受到破坏就会导致疾病。
    • 多种生物分子建模:
      • 除了蛋白质与核酸,AlphaFold 3还能处理小分子、离子、修饰残基等各种生物分子及其相互作用。
      • 支持蛋白质的翻译后修饰建模,包括糖基化、磷酸化等修饰类型。
    • 广泛适用的深度学习框架:
      • 模型采用扩散网络,直接预测原子坐标和多尺度分子结构。
      • 框架统一、泛用性强,可应用于各种生物分子结构预测任务。

        7R6R – DNA 结合蛋白:AlphaFold 3 对蛋白质(蓝色)与双螺旋 DNA(粉色)结合的分子复合体的预测,与通过艰难实验得出的真实分子结构(灰色)几乎完全一致。

  3. 高级建模架构:
    • Pairformer模块:
      • 替换了AlphaFold 2的Evoformer模块,简化了多序列比对(MSA)的处理,优化计算效率。
      • 处理一对对的生物分子之间的相互作用。
    • 扩散模块:
      • 通过扩散网络直接对原子坐标进行建模,提高分子复合体的建模灵活性和准确性。
      • 支持生成式训练方式,确保模型对局部和整体结构的学习。
  4. 交叉蒸馏与置信度预测:
    • 交叉蒸馏:
      • 采用AlphaFold-Multimer v2.3的预测结构作为训练数据,减少结构预测中的幻觉行为。
    • 置信度预测:
      • 预测生物分子原子级别和成对相互作用的置信度。
      • 提供LDDT(局部距离测试)、PAE(预测比对误差)等评估指标,以追踪预测准确性。

AlphaFold 3的应用场景:

7BBV – 酶:AlphaFold 3 对一个酶复合体的预测显示,包括酶蛋白(蓝色)、离子(黄色球体)和单糖(黄色)等结构,与实际真实结构(灰色)高度吻合。这种酶存在于土传真菌大丽轮枝菌中,会损害许多植物。深入了解这种酶与植物细胞的相互作用可以帮助科学家开发出更健康、更具抗逆性的作物。

  1. 药物设计与开发:
    • 靶点发现:
      • 精确预测蛋白质结构和配体结合位点,帮助研究人员确定潜在药物靶点。
    • 药物筛选与优化:
      • 预测蛋白质-配体相互作用,提高药物筛选效率,帮助优化分子结构以增强药物效果和安全性。
  2. 生物分子结构与功能研究:
    • 蛋白质结构:
      • 通过预测未知蛋白质的三维结构,帮助科学家探索蛋白质的功能、作用机制及潜在应用。
    • 蛋白质-核酸相互作用:
      • 提供蛋白质与DNA、RNA的相互作用结构,揭示基因调控、RNA加工和翻译的详细机制。
  3. 抗体与免疫疗法:
    • 抗体设计与识别:
      • 预测抗体-抗原结合位点的结构,优化抗体设计用于免疫治疗、诊断和疫苗开发。
    • 抗体-抗原相互作用:
      • 提供抗体与病原体、受体等相互作用的详细结构,帮助理解免疫反应。
  4. 生物合成与工程:
    • 蛋白质工程:
      • 帮助设计和合成新型蛋白质,优化生物分子的功能和稳定性,用于工业、环境和医学应用。
    • 酶催化与生物反应:
      • 揭示酶的三维结构,优化其催化功能和特性,推动生物制造和绿色化学发展。
  5. 基因组与遗传学:
    • 基因调控研究:
      • 提供转录因子与DNA相互作用的结构,研究基因表达和遗传疾病的调控机制。
    • 遗传突变分析:
      • 分析突变对蛋白质结构的影响,帮助理解遗传疾病和制定个性化治疗方案。

引领药物发现

AlphaFold 3 具备预测药物中常用分子(如配体、抗体)的能力,这些分子与蛋白质结合,改变它们在人体健康和疾病中的相互作用方式,为药物设计提供了重要依据。

在预测药物相互作用方面,AlphaFold 3 达到了前所未有的准确性,包括蛋白质与配体的结合,抗体与靶向蛋白的结合。在 PoseBusters 基准测试中,AlphaFold 3 的准确性比最好的传统方法高 50%,且无需任何结构信息输入。这使得 AlphaFold 3 成为首个在生物分子结构预测方面超越基于物理工具的 AI 系统。预测抗体-蛋白结合能力对于理解人类免疫系统反应以及设计新的抗体(这是一种增长中的治疗方法)至关重要。

结合内部互补的 AI 模型,Isomorphic Labs 利用 AlphaFold 3 为内部项目以及与制药合作伙伴的项目进行药物设计。Isomorphic Labs 正在利用 AlphaFold 3 加速并提高药物设计的成功率,帮助科学家研究新疾病靶点,并以全新的方式开发曾无法触及的目标。

免费科研工具

Google DeepMind 还推出了  AlphaFold Server 是全球最精准的工具,用于预测蛋白质如何在细胞中与其他分子相互作用。它是一个全球科学家可免费用于非商业研究的平台。生物学家只需点击几下,即可利用 AlphaFold 3 的力量对蛋白质、DNA、RNA 以及配体、离子和化学修饰组成的结构进行建模。

AlphaFold Server 能帮助科学家在实验室中验证新的假设,加快研究流程,推动创新。无论研究人员是否拥有计算资源或机器学习专业知识,这个平台都能让他们轻松生成预测。

实验性蛋白质结构预测通常需要一整个博士学位的时间,耗费数十万美元。之前的模型 AlphaFold 2 已用于预测数亿个结构,若按当前实验结构生物学的速度来计算,需要耗费数亿研究员年的时间。

8AW3 – RNA 修饰蛋白:AlphaFold 3 对一个包含蛋白质(蓝色)、一条 RNA 链(紫色)以及两个离子(黄色)的分子复合体的预测与真实结构(灰色)高度吻合。这个复合体参与其他蛋白质的生成,这是生命和健康的基本细胞过程。

AlphaFold 3 将生物世界带入高清视野,使科学家能够看到细胞系统的复杂性,包括结构、相互作用和修饰。这个全新视角揭示了生命分子间的联系,帮助我们了解这些联系如何影响生物功能,例如药物作用、激素生成,以及保持健康的 DNA 修复过程。

官方介绍:https://blog.google/technology

nature论文:https://www.nature.com/articles/s41586-024-07487-w

退出移动版