- Published on
AlphaFold:当 AI 读懂生命的三维密码
- Authors
- Name
- Black Halo Labs

头图来源:Wikimedia Commons(请在文件页查看原作者与许可条款)
蛋白质折叠问题
蛋白质由氨基酸链折叠成复杂三维结构,结构决定功能。克里斯蒂安·安芬森 1972 年诺贝尔化学奖工作表明:氨基酸序列原则上应能决定结构。然而,从序列预测结构在计算上极其困难——一个中等长度蛋白质的可能构象数量超过宇宙原子总数,这被称为列文哈尔悖论。
数十年来,生物学家依赖 X 射线晶体学、冷冻电镜等实验手段解析结构,成本高、周期长。每增加一个结构,都意味着巨大的科研投入。
CASP 与 AlphaFold 的突破
CASP(Critical Assessment of Structure Prediction)是结构预测领域的国际盲测竞赛。2020 年 CASP14 上,DeepMind 的 AlphaFold2 在中位 GDT 分数上达到约 92.4,被评委称为"基本解决"单链蛋白质结构预测问题。
Jumper 等人在 Nature 596 卷(2021)发表详细方法:采用 Evoformer 架构,融合多序列比对(MSA)与配对表示,端到端预测原子坐标。AlphaFold 数据库(AlphaFold DB)随后公开超过 2 亿个预测结构,覆盖 UniProt 中绝大多数已知蛋白质,成为生命科学基础设施。
对药物研发与合成生物学的影响
准确结构预测加速靶点发现、抗体设计与小分子对接。制药公司开始将 AlphaFold 预测纳入早期管线;合成生物学团队利用结构信息设计酶催化新反应。2024 年诺贝尔化学奖部分授予 David Baker(计算蛋白设计)及 Demis Hassabis、John Jumper(AlphaFold),标志着 AI 在生命科学中的里程碑地位。
局限与展望
AlphaFold2 对多链复合物、无序区、配体结合态仍有局限。AlphaFold3(2024)扩展至蛋白质-核酸-小分子相互作用预测,但开放程度与学术可及性引发讨论。未来,AI 与实验结构生物学将更紧密耦合:预测指导实验,实验反馈模型。
参考资料
- Jumper, J. et al. (2021). Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589.
- AlphaFold Protein Structure Database. https://alphafold.ebi.ac.uk/
- CASP14 官方评估报告. https://predictioncenter.org/casp14/