科技日报记者 刘霞
2020年,谷歌下属“深度思维”公司开发的人工智能(AI)工具“阿尔法折叠”横空出世,向世人展示了其高精度预测蛋白质三维(3D)结构的超强能力。
“阿尔法折叠”有助于人类探索整个“蛋白质宇宙”的结构。图片来源:“深度思维”公司
此后,又有多款预测蛋白质结构的AI工具面世,鉴于大多数药物通过与蛋白质上的不同位点相结合来发挥作用,而此类工具可预测以前所知甚少的蛋白质结构,因此化学家们对使用AI程序更快、更低成本地发现药物充满期待。
英国《自然》网站在近日的报道中指出,AI预测蛋白质虽然还无法代替实验,但无疑给蛋白质研究领域带来了新的助力。但类似“阿尔法折叠”等预测蛋白质结构的AI工具能否真正撼动制药行业,仍有待时间的检验。
AI工具竞相推出
2020年底,“深度思维”公司首次宣布,他们研发出一种工具——“阿尔法折叠”来精准预测蛋白质的折叠结构。2021年中,“阿尔法折叠”已绘制出人体中98.5%的蛋白质的结构图。2022年,该公司发布了2亿多种蛋白质的结构,全球公认的蛋白质数据库UniProt中收录的所有蛋白质几乎都在其中。蛋白质的3D结构决定了其在细胞中的功能,明确蛋白质的结构信息,在药物研发等领域十分重要。
由“阿尔法折叠”预测的一种蛋白质结构,这种蛋白质是核孔复合体的一部分,核孔复合体是分子进入细胞核的门户,也是药物靶点。图片来源:“深度思维”公司
今年7月,美国生物技术公司Recursion宣布,他们已计算出360亿种潜在的药物化合物如何与“阿尔法折叠”预测的15000多种人类蛋白质结合。为完成大规模计算,该公司利用了自己开发的AI工具MatchMaker,以预测蛋白质组水平上小分子之间的相互作用。
除上述工具外,预测蛋白质结构“赛道”上的另一位“网红”RoseTTAFold也不容小觑。其由华盛顿大学蛋白质设计研究所科学家主导开发,能“绘制”或“想象”出自然界中尚不存在的蛋白质结构,这是继“阿尔法折叠”之后蛋白质研究中的又一个里程碑。RoseTTAFold目前已创造出一些原始化合物,用于工业反应、癌症治疗以及开发预防呼吸道合胞病毒(RSV)的候选疫苗。
预测助推药物研发
美国南加州大学计算生物学家弗谢沃洛德·卡特提克指出,借助AI工具,制药公司可能只需要在实验室中测试几百种而非数千种化合物,这不仅可节省数百万美元的成本,而且能在几年而非几十年内将化合物推向市场。
药物研发之所以烧钱且耗时,是因为要找到管用的药物就像大海捞针。以靶向药物为例,在人体细胞表面有很多药物接收站——受体,药物分子(如咖啡因、多巴胺等)只有与各种受体相结合才能发挥作用。据估计,世界上类药物分子数量高达1060个,但只有很少的分子能与受体结合,在细胞内产生期望的化学反应。
欧洲生物信息学研究所指出,“阿尔法折叠”和RoseTTAFold等工具,在预测蛋白质3D结构方面非常出色,在其预期的2亿个蛋白质结构中,35%的结构的准确性可与实验确定的相媲美;另外45%的结构的准确度足以用于某些应用,因此有望进一步动摇制药行业。
效果仍待时间检验
对于“阿尔法折叠”等AI工具是否能彻底改变药物发现,并非所有人都持乐观态度。在今年8月发表于《eLife》上的一篇论文中,美国斯坦福大学的玛莎·卡特里娜等人指出,像“阿尔法折叠”这样的模型在预测蛋白质结构方面确实表现优异,但需要思考如何将它们用于药物发现。
其他接受《自然》杂志采访的科学家也认为,“阿尔法折叠”等工具提供了大量令人印象深刻的数据,但其质量如何仍是未知数。
英国帝国理工学院的基思·威利森指出,虽然“阿尔法折叠”等工具往往极其精准,但其绘制的结构图始终是预测结果,而非经过明确计算的结果。而且,预测出来的结构可能不具有药物开发人员需要的原子级分辨率(使其能确定最强结合可能发生在哪里)。美国加州大学旧金山分校的药物化学家布莱恩·肖伊切特则表示,预测的化学药物与蛋白质之间的相互作用数量极多,意味着即使是很小比例的假阳性也可能让科学家付出高昂的时间代价。
总部位于伦敦的查姆制药公司首席执行官兼联合创始人拉克西·萨尼与卡特里娜都认为,RoseTTAFold和“阿尔法折叠”在确定小分子对接时表现不佳。鉴于此,查姆公司正在尝试一种不同的评估蛋白质—药物结合的方法。该技术使用名为DragonFold的蛋白质—配体共折叠,模拟结合在一起的蛋白质和配体的3D形状,使研究人员能够解释与配体结合时蛋白质形状的变化,并对潜在的药物进行修饰,以产生更紧密、更有选择性的结合,从而加速开发针对癌症和其他治疗领域以前难以靶向的小分子治疗药物。