检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome EdgeFirefox X

首页科技前沿与新兴产业生物产业生物医药

AI技术在生物大分子创制研究实现突破

供稿人:邓桦供稿时间:2023-04-26 13:06:47关键词:AI技术,蛋白质分子,生物创制

一直以来,生物医药产业受困于研发周期长、研究难度大以及成功率低等因素,使整个行业发展进展缓慢。近年,伴随AI技术的深入渗透,AI技术在小分子制药领域取得一定进展,但却很难在大分子制药阶段实现质的突破,而大分子制药却是推动整个行业提质增效的关键环节。

一、AI技术在大分子研究领域难以突破的瓶颈

AI技术很难在大分子研究领域实现应用原因主要有以下两点:第一,究其字面,大分子相较小分子而言,结构与功能关系对应复杂,较难获取有关研究数据;第二,基于前一点,与大分子相关的研究数据缺失,致使AI技术无法进行深入分析研究阶段。

二、产业界实现AI技术对蛋白质分子结构的预测

蛋白质作为生物大分子研究的主要代表,实现对蛋白质序列与结构的认识,便能将生物医药发展带入全新阶段。

20217谷歌发布的蛋白质结构从头计算程序AlphaFold2达到可以预测近98%的人类蛋白质且58%的可信水平。事隔一年,DeepMind公司在新闻发布会宣布:成功完成了现有蛋白质数据库中全部2.14亿种蛋白质的结构预测,高度准确率达35%。随后于202210月,Meta公司(原名Facebook)拓宽了蛋白质世界的边界利用自开发的大型语言模型算法ESMFold预测了6.17亿种来自宏基因组信息的微生物蛋白质结构。ESMFold算法的准确度虽略逊于AlphaFold,但它的优势在于能以60倍于AlphaFold的速度去预测短序列蛋白质结构,这就使得它在预测结构相对简单的微生物蛋白质上有很大优势。

三、科学界实现AI技术创制蛋白质研究重大突破 产业界也在该领域发力

如果说蛋白质预测已经实现了对生命科学探索的巨大跨越,那么利用前沿技术创造蛋白质将是一种颠覆。在创制蛋白质研究领域,美国华盛顿大学医学院的David Baker绝对是无法忽视的存在。其实几乎与谷歌宣布Alphafold2产品同一时间,David团队也开发出一款名为“RoseTTAFold”的软件工具用以预测蛋白质结构;随后,2022年下半年先后发文对预测工具方法进行改进研究;20234月的最新研究实现了对蛋白质创造的突破(见下表),以上成果均刊登在《科学》杂志。

华盛顿大学David Baker团队蛋白质研究相关成果

发表时间

文章标题

成果简介

20218

Accurate prediction of protein structures and interactions using a three-track neural network

开发了RoseTTAFold软件工具,工具利用深度学习技术,根据有限信息准确、快速进行蛋白质结构预测

20229

Robust deep learningbased protein sequence design using ProteinMPNN

聚焦基于深度学习的蛋白质序列设计方法ProteinMPNN的研究,ProteinMPNN在解决序列设计问题的时间比Rosetta等基于物理的方法所需时间少,同时该方法可进行大规模侧链包装计算,在天然骨架上实现更高的蛋白质序列恢复

202210

Hallucinating symmetric protein assemblies

研究结果突出了使用深度学习产生新蛋白质结构的丰富多样性,并为设计用于纳米机器和生物材料日益复杂的组件铺平道路

20234

Top-down design of protein architectures with reinforcement learning

团队在最新研究中采用了“自上而下”的强化学习方案,使用蒙特卡洛树搜索算法生成蛋白质复合物。设计思路直接根据预想的结构特性来优化蛋白质片段,进而构建单体亚基,颠覆了传统方案的全新突破不仅可能带来更有效的疫苗及药物,还有望引领蛋白质设计的全新时代

值得一提的是,David Baker团队的研究并未仅停留在实验研究阶段,产业化方面,David本人以科学联合创始人身份加入英国AI创新药企CHARM Therapeutics,去年该公司获得了5千万美元融资,用以蛋白质创制研究。此外,近年已有欧美AI生物医药初创企业(如美国的Generate Biomedicines、立陶宛的Biomatter designs)正在从头构建类似天然蛋白质的物理特性全新蛋白质”研究领域发力。

参考资料:

1. Isaac D. Lutz, Shunzhi Wang, David Baker, et al. Top-down design of protein architectures with reinforcement learning[J]. Science, 2023, 380: 266-273.

2. 知乎网. 今日《科学》: 彻底颠覆蛋白质设计!AI又带来一项重大飞跃[EB/OL]. (2023-04-21). [2023-04-26]. https://zhuanlan.zhihu.com.

3. 36Kr. AI对于生物学, 早就不只是AIphaFold[EB/OL]. (2023-04-21). [2023-04-26]. https://36kr.com.