
大海捞针 的困境:传统抗体发现的 运气 与 蛮力
要理解这项新技术的颠覆性,我们先来看看传统方法的局限性。
想象一下,你是一名军事工程师,任务是摧毁一座敌方碉堡。你知道碉堡的弹药库是其最薄弱的环节,但你不知道弹药库的具体位置。传统的抗体发现就像是给你一万枚普通的炮弹,让你对碉堡进行地毯式轰炸。你发射了成千上万发炮弹,最终有几发碰巧击中了弹药库,任务完成。但这个过程浪费了大量资源,而且成功与否很大程度上依赖运气。你无法保证下一次面对新碉堡时,还能有同样的好运。
这就是免疫动物或文库筛选的真实写照。当我们将一个靶点蛋白(抗原)注射到小鼠体内,它的免疫系统会被激活,产生千千万万种不同的抗体。这些抗体有的结合力强,有的弱;有的打中要害,有的则无关痛痒。研究人员需要通过复杂的筛选技术,像淘金一样,从这片抗体的汪洋中,找到那几颗真正有价值的金子。
更先进的噬菌体展示(phage display)或酵母展示(yeast display)技术,虽然将筛选过程搬到了体外,构建了数以十亿计的庞大抗体库,但其本质依然是 筛选 而非 设计 。它提高了找到 命中者 的概率,但并未解决 精准瞄准 的核心问题。我们依然是在一个巨大的、随机的可能性空间里进行搜索,希望找到能与我们感兴趣的靶点结合的分子。
这种模式的弊端显而易见:
表位不可控:对于许多疾病,只有抑制靶点蛋白的特定区域才能起到治疗效果。例如,阻止病毒与宿主细胞受体结合的位点,或是一个蛋白激酶的活性口袋。传统方法很难保证产生的抗体恰好就结合在这些 黄金表位 上。
效率低下:整个流程,从免疫/建库到筛选、验证,是一个漫长而昂贵的旅程。
免疫盲点:有些重要的靶点表位在结构上与宿主自身的蛋白相似,动物的免疫系统会产生耐受,无法产生有效的抗体。这被称为免疫系统的 盲点 。
多年来,无数研究人员梦想着能摆脱这种 靠天吃饭 的模式。如果能像建筑师设计蓝图一样,事先规划好抗体的每一个细节,它的骨架结构、负责结合的区域(互补决定区,Complementarity-Determining Regions, CDRs),以及它与靶点表位的精确作用方式,那将是怎样一番景象?
AI的 创世之力 :当RFdiffusion学会了抗体的语言
研究团队所做的,正是将这个梦想照进现实。他们使用的核心工具,是一种被称为 扩散模型 (diffusion model)的深度学习算法。
你或许对扩散模型有所耳闻,近年来火爆的AI绘画工具(如Midjourney, Stable Diffusion)正是基于此。它的工作原理颇具哲学意味:先学习一个物体(比如一张猫的图片)的特征,然后不断地向这张图片添加随机的 噪声 ,直到它变成一片毫无规律的雪花点。这个过程被称为 前向扩散 。接着,AI学习如何从这一片混沌的噪声中,一步步 去噪 ,最终恢复出原始的、清晰的猫的图片。这个逆向过程,就是 生成 。
当AI完全掌握了从噪声到有序结构的秘诀后,它就具备了 创造 的能力。你给它一堆完全随机的噪声,它也能 脑补 并生成一张全新的、世界上从未有过的猫的图片。
研究人员巧妙地将这个思想应用到了蛋白质结构设计上。蛋白质本质上是由氨基酸链折叠成的三维结构。他们将蛋白质的结构信息(原子坐标和方向)视为一幅 3D图像 。RFdiffusion模型通过学习数以万计的真实蛋白质结构,掌握了蛋白质折叠的内在 语法规则 。
然而,通用的蛋白质设计模型并不足以胜任抗体设计这一精细任务。因为抗体的功能核心在于其CDR区,这几个高度可变的环状结构像 手指 一样,需要以极其精确的方式 抓住 抗原的特定表位。通用模型或许能设计出结构稳定的蛋白质,却无法保证这种功能性的、精密的相互作用。
为此,研究人员对RFdiffusion进行了专门的 特训 。他们收集了大量已知的抗体-抗原复合物的晶体结构数据,让模型专注于学习抗体是如何与靶点结合的。在训练中,他们给了模型几个关键的 指令 :
1. 固定框架:抗体的绝大部分结构是相对稳定的框架区(framework region),如同导弹的弹体。研究人员将这个框架区的结构作为 条件 输入给模型,让AI在此基础上进行创作,确保生成的是一个 抗体 而不是别的什么蛋白质。
2. 指定表位:研究人员在靶点蛋白上指定了几个关键的氨基酸残基,作为 热点 (hotspot),告诉AI: 你的任务就是设计出能够与这些点紧密互动的CDR区。
3. 自由创作:在满足以上条件下,模型被赋予了充分的自由度,去生成全新的CDR环的构象,以及整个抗体相对于靶点的最佳结合姿态(即 停靠模式 ,docking mode)。
经过这样的精细调校(fine-tuning),RFdiffusion从一个通用的 结构画家 ,进化成了一位专业的 抗体设计师 。它学会了抗体世界的语言,理解了CDR与表位之间原子级别的 对话方式 。
从 虚拟 到 现实 :AI设计的 纳米抗体 首次实战
理论的优美,终须经过实验的检验。研究团队选择了几种与人类疾病密切相关的靶点,作为AI设计师的 毕业考题 。它们包括:艰难梭菌毒素B(Clostridium difficile Toxin B, TcdB),这是导致严重肠道感染的关键毒素;流感病毒血凝素(influenza haemagglutinin, HA);呼吸道合胞病毒(RSV)以及(SARS-CoV-2)的受体结合域(RBD)。
他们首先将目光投向了一种结构更简单的抗体,骆驼科动物来源的单域抗体(VHHs),也常被称为 纳米抗体 (nanobody)。相比于传统抗体拥有重链和轻链两条肽链(共六个CDR区),VHH仅由一条重链可变区构成(三个CDR区),设计难度相对较低,是检验模型能力的理想起点。
AI模型不负所望,针对每个靶点都生成了数千个不同的VHH设计方案。研究人员通过计算筛选后,挑选出数百到数千个最优设计,并通过基因合成技术,在酵母细胞表面展示这些AI设计的VHH蛋白,进行高通量的结合能力筛选。
结果令人振奋。这些完全由AI凭空创造的VHH,在现实世界中表现出了真实的结合活性。
针对流感病毒HA,筛选出的亲和力最高的VHH,其解离常数(Kd)达到了78 nM。这是一个相当不错的结合强度,通常认为nM级别的亲和力已具备成药潜力。
针对艰难梭菌毒素TcdB,最佳VHH的亲和力为262 nM。针对SARS-CoV-2 RBD,也找到了一个亲和力为5.5 M的结合者。
仅仅证明 能结合 还不够,关键在于是否 按预想的方式结合 。研究人员进行了一项巧妙的竞争实验。以TcdB为例,AI设计的VHH的目标表位,是TcdB上一个已知的与人体Frizzled受体结合的区域。研究人员先将一个已知能结合该区域的、非抗体类的小蛋白分子与TcdB结合,当这个 黄金表位 被占据后,他们再加入AI设计的VHH。实验数据显示,此时VHH几乎完全无法结合TcdB。反之亦然。这有力地证明了,AI设计的VHH确实精准地命中了预设的靶点。针对RBD的VHH也通过类似的竞争实验,被证实结合在了正确的表位上。
这些数据清晰地表明,RFdiffusion不仅能设计出会结合的分子,更能设计出在指定位置结合的分子。AI的 设计图纸 在现实世界中得到了成功的 施工 。
眼见为实 的震撼:冷冻电镜下的原子级精确度
如果说结合和竞争实验是令人信服的证据,那么冷冻电子显微镜(Cryo-electron microscopy, Cryo-EM)的结果,则带来了近乎 震撼 的视觉确认。Cryo-EM技术能够以近乎原子的分辨率,直接 看到 蛋白质复合物的三维结构。
研究人员成功解析了AI设计的抗流感病毒VHH(VHH_flu_01)与天然的、带有糖基化修饰的三聚体流感HA蛋白复合物的结构,分辨率高达3.0 。当他们将实验解析出的真实结构与AI最初的计算机设计模型进行比对时,奇迹发生了:
两者惊人地吻合!
整个VHH分子的骨架结构,实验值与设计模型的均方根偏差(Root Mean Square Deviation, RMSD)仅为1.45 。在蛋白质结构领域,低于2 的RMSD通常被认为是高度一致的。
更令人惊叹的是,负责核心结合功能的CDR3环,其RMSD值仅为0.8 !这意味着,AI不仅预测对了整体构象,甚至连这个最关键、最灵活区域的每一个原子的空间位置都几乎分毫不差。
设计模型中预测的与HA蛋白发生相互作用的几个关键氨基酸侧链(如V100, V101, S103, F108),在真实的结构中,也确实伸向了同样的位置,与靶点形成了预期的相互作用网络。
这幅3D图像所传递的信息是明确的:RFdiffusion的设计精度,已经达到了原子级别。它不是一个模糊的草图,而是一份可以精确到每一个螺丝钉位置的工业级蓝图。
同样,针对TcdB的VHH复合物的结构解析,虽然分辨率稍低,但也明确证实了VHH的结合位点和结合姿态与设计模型高度一致。这进一步证明了该方法的普适性和可靠性。
挑战升级:AI能否驾驭更复杂的 六手连弹 ?
在VHH上取得的巨大成功,鼓舞着研究团队向更宏大的目标迈进:设计标准的、拥有重链和轻链的抗体。这好比一位钢琴家在完美演奏了单手练习曲后,开始挑战需要双手、甚至 六手 (比喻六个CDR区)协同的复杂奏鸣曲。
标准的抗体可变区(scFv或Fab)包含六个CDR环(重链三个,轻链三个),它们必须像六根配合默契的手指,共同抓住抗原。设计的复杂性呈指数级增长。任何一个CDR环的微小失误,都可能导致整个结合功能的丧失。
面对这一挑战,研究人员再次展现了他们的智慧。他们意识到,从头设计一个完美的重-轻链配对非常困难。于是,他们采取了一种 结构引导的组合策略 。
首先,AI针对同一个靶点表位,会生成许多个结构上非常相似、结合模式也几乎一样的设计方案。这些方案可以被归为同一个 结构簇 。理论上,同一个簇里的任何一个重链,都应该能和任何一个轻链很好地 兼容 。
于是,他们不再坚持合成AI设计的固定配对,而是在同一个 结构簇 内,将所有设计的重链和轻链随机组合,构建了一个 智能组合文库 。这种做法极大地增加了找到成功配对的概率,巧妙地绕过了从头设计完美配对的超高难度。
他们将这一策略应用于两个极具挑战性的靶点:一个是前面提到的TcdB的Frizzled结合位点;另一个是临床上极为重要的肿瘤靶点 由PHOX2B蛋白的一个短肽与主要组织相容性复合物(MHC)组成的复合物。后者是开发新型疗法治疗的关键。
实验结果再次验证了这一策略的成功。
他们从针对TcdB的智能组合文库中,筛选到了多个亲和力达到nM级别的scFv分子。其中最优秀的scFv6,亲和力高达72 nM。
更重要的是,对scFv6与TcdB复合物的Cryo-EM结构解析,再次上演了原子级精确度的 神话 。分辨率3.6 的结构显示,这个由两条链、六个CDR组成的复杂分子,其真实的结合模式与AI的设计蓝图(由两个不同的亲本设计拼接而成)完美贴合,整体RMSD仅为0.9 。
六个CDR环的骨架,每一个都达到了惊人的准确度,RMSD值在0.2 到1.1 之间。这表明,RFdiffusion已经具备了同时精确设计多个相互作用环的能力。这是抗体设计领域前所未有的成就。
至此,研究人员已经证明,他们的AI设计平台,无论是面对简单的VHH,还是复杂的scFv,都能够实现从零开始、针对特定表位的、原子级精度的设计。
诚实的 短板 与聪明的 外挂 :从 能用 到 好用 的进化之路
任何一项突破性的技术在诞生之初,都不可能完美无瑕。该研究最可贵的地方之一,在于它不仅展示了惊人的成功,也坦诚地指出了当前的局限,并提出了巧妙的解决方案。
短板一:初始亲和力有待提高。尽管AI设计的抗体能精准结合,但部分设计的初始亲和力还不够高(例如,一些设计在 M级别),离临床应用的要求还有距离。
对此,研究人员引入了一个强大的 外挂 工具,OrthoRep系统。这是一个巧妙的基因定向进化系统。他们将AI设计的VHH基因置于这个系统中,该系统使用一种 粗心 的DNA聚合酶,在酵母细胞内持续地、高速地引入随机突变,并结合酵母展示技术,不断筛选出亲和力更高的后代。
结果非常理想。经过OrthoRep的 催熟 ,AI设计的VHH的亲和力普遍提升了约两个数量级(100倍),轻松进入了高亲和力的单、双位数nM范围,完全满足了后续成药开发的需求。更重要的是,后续的结构分析证实,这种亲和力的成熟过程,并未改变抗体最初设计的结合模式。这形成了一个完美的 组合拳 :AI负责精准的 骨架设计 ,定向进化负责高效的 性能优化 。
短板二:实验成功率依然偏低。另一个现实问题是,尽管AI能生成大量设计,但最终通过实验验证能够成功结合的比例并不高(在0%到2%之间)。这意味着研究人员仍需通过高通量筛选,才能从大量 理论可行 的设计中找到 实际有效 的分子。
如何提高这个成功率?关键在于找到一个更强大的 过滤器 ,在实验开始前,就从计算机层面更准确地预测哪些设计最有可能成功。
研究人员回顾他们的工作时,一个更新、更强大的AI工具,AlphaFold3,恰好发布了。AlphaFold3在预测蛋白质相互作用方面展现出了比其前代更强的能力。于是,他们进行了一项 事后诸葛亮 式的回溯性分析:用AlphaFold3去评估他们之前所有的VHH设计。
分析结果提供了一条清晰的前进道路。AlphaFold3对每个设计给出了一个界面预测模板建模评分(ipTM score),这个分数可以衡量其对复合物结构预测的置信度。研究人员发现,那些实验成功的VHH设计,其AlphaFold3的ipTM分数普遍显著高于失败的设计。他们绘制的受试者工作特征曲线(ROC curve)显示,曲线下面积(AUC)高达0.86,表明ipTM分数是一个非常有效的预测指标。
这意味着什么?如果在未来的研究中,研究人员在合成基因之前,先用AlphaFold3对RFdiffusion生成的设计进行一轮 虚拟筛选 ,只挑选那些ipTM分数高的候选者,那么实验的成功率将有望得到数倍甚至数十倍的提升。
钥匙已被铸造,但门后的世界仍需探索
这项发表在《自然》上的研究,无疑是计算结构生物学和抗体工程领域的一座里程碑。它系统性地构建并验证了一个前所未有的工作流程,使得依据特定功能需求、从原子层面 理性设计 抗体成为可能。
这把由AI铸造的 钥匙 ,为我们打开了一扇通往全新世界的大门。门后的景象,充满了无限的可能性:
速度与成本的革命:传统的抗体发现动辄耗时数年,而计算设计和验证的周期可以被缩短到几个月甚至几周。这将极大地加速新药研发的进程,降低失败风险和研发成本。
攻克 不可成药 靶点:对于那些传统免疫方法难以产生抗体的 免疫盲点 表位,或者病毒上那些为了逃逸免疫而高度保守、但免疫原性不强的关键位点,AI设计提供了一种全新的解决方案。我们可以直接绕过免疫系统的限制,针对这些 软肋 设计武器。
功能的精细定制:除了结合,抗体的功能还包括激活或抑制信号通路、诱导构象变化等。基于结构的精准设计,让我们有能力去创造具有特定调控功能的抗体,而不仅仅是简单的 阻断剂 。
优化成药性:在设计的初始阶段,就可以将溶解度、稳定性、免疫原性等 成药性 相关的参数考虑进去,从源头上避免后续开发中可能出现的种种问题。
当然,我们也要清醒地认识到,这把钥匙刚刚铸成,我们对门后世界的探索才刚刚开始。目前的成功率仍需提升,亲和力的从头设计能力也有待加强,如何让AI设计的CDR序列更接近于人类自身的序列以降低免疫原性,这些都是未来需要解决的重要课题。
但无论如何,一个全新的时代已经拉开序幕。过去,我们是自然的 学徒 ,努力模仿和筛选免疫系统的杰作。而今天,借助AI的强大能力,我们正逐渐成为 设计师 ,开始用自己的智慧和语言,创造出自然界中或许从未存在过的、为解决特定问题而生的生命分子。从一个原子开始,一个由理性设计主导的精准医疗新纪元,正向我们走来。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->
2025-05-01 16:06:26
2025-05-01 16:06:26
2025-05-01 16:06:26
2025-05-01 16:06:26
2025-05-01 16:06:26
2025-05-01 16:06:26