当前位置:首页   >>   资讯中心   >>  行业资讯   >>  2024年“数据要素×”大赛优秀项目案例集——科技创新案例之二 | 提高蛋白质从头设计的效率和可控性

2024年“数据要素×”大赛优秀项目案例集——科技创新案例之二 | 提高蛋白质从头设计的效率和可控性

发布时间:2025-02-21 11:14    来源:本网    阅读:72次

当前,国际上蛋白质算法预测的多是蛋白的静态结构,由于自然界中存在的活性蛋白都是运动的,因此,如何了解蛋白的运动规律,对靶点和药物的研究至关重要。北京大学深圳研究生院研究团队积极探索大数据驱动的蛋白质设计科研范式,提升蛋白质设计效率,并实现蛋白的可控设计,推动研发的药物对靶点更强针对性,更小毒副作用。

一是积极探索大数据驱动的蛋白质设计科研范式。团队在“AI+蛋白质”设计领域取得了重大突破,提出了一种新的冷冻电镜成像算法,即重建蛋白酶体底物降解动态自由能面,并收集了200T特有的四维冷冻电镜独有数据。根据该数据库模拟了蛋白酶体构象的连续体动力学变化,研发了国际领先(First in Class)的靶点机制。同时,基于收集的独有数据集,进行多模态大模型训练,进行蛋白质设计、生成和筛选,并将成果进行了商业转化,目前已获得多轮天使融资,与多家企业开展了合作。

image.png

图1 基于审计的蛋白质设计大模型

二是丰富数据的来源、扩充数据规模。数据主要来源于公司自己采集、分析和建模,以及公共数据的分析。其中,约200T私有数据利用了北大的成像装置采集、纯化得到。同时也辅助加入国际上公开约60P的蛋白质数据库。

三是利用大数据训练蛋白质可控生成大模型。将训练好的大模型用于任意给定靶点的药物设计。通过结合虚拟筛选和物理驱动等策略,可以进一步甄别高质量药物候选物,将湿实验门槛降低到可快速验证的数量级。

四是利用蛋白生成大模型生成特定的靶向药物。目前主要围绕“蛋白酶+炎症小体”,研发世界级领先的药物,为抗癌、抗病毒、抗细菌等方面的蛋白质药物研发提供新思路和解决方案。

通过蛋白质设计、生成和筛选,逐步形成和掌握蛋白为核心的制药关键大数据,形成数据为基础的真正的核心竞争力。

image.png

       五是积极探索项目的社会经济效益。项目有利支持多特异药物研发,先导药物发现的时间从24个月缩短至5个月。深圳埃空间生物科技公司完成了种子轮融资,自研了候选药物用于治疗心梗等心血管疾病。目前完成动物实验阶段,已与江苏某医药民企合作开发创新药物,同时与慢性病管理机构达成战略合作。

      信息来源:国家数据局

办公地址:四川省广元市利州区东坝办事处利州东路、兴安路康隆·财富旺角6#16-1

邮编:628400  联系电话:0839-3617508

Copyright©2025  广元广财企业服务有限公司  All Rights Reserved

0839-3617508