大连理工大学携手升华AI,共同孵化分子模拟大模型,

摘要:依托大连人工智能生态创新中心,为新药研发注入创新活力!

最近,大连理工大学计算机科学与技术学院申彦明教授小组携手使AI上升,构筑着基于图神经网络(Graph Neural Networks,GNN)的分子模拟的大模型。该模型可广泛应用于生物分子性质预测、蛋白质-配体对接预测及药物设计等领域,帮助医药领域缩短药物研发周期、降低研发成本、推进研发进程。

分子模拟可以深入阐述分子间的相互作用,结合图神经网络技术,充分利用大规模分子数据集与图神经网络模型的互补优势,构建ldquo。多尺度建模-神经网络-大模型rdquo;的研究模型,在保证预测准确性的同时,提高了计算效率,是科学智能的典型应用。

大连理工大学计算机科学与技术学院教授、博士生导师申彦明教授致力于图神经网络技术及生物分子领域的相关研究和产业应用。团队开发的图神经网络模型在国际权威图数据评估数据集Open Graph Benchmark(OGB)中的蛋白质相互作用数据集ppa中排名第一。在分子化合物数据组ZINC中获得第一名,并在国际著名的数据科学竞赛KDD Cup2021中击败了谷歌DeepMind、百度、蚂蚁金服等多支队伍,获得冠军。

2022年12月,在大连人工智能生态创新中心的支持下,大连理工大学申彦明教授团队将GNN算法过渡到全场景AI框架昇思MindSpore,基于Atlas900AI集群加速训练效率,实现了分子模拟大模型能力的进一步提升。该模型采用强表达能力的图神经网络方法对生物小分子和蛋白质高分子进行建模,同时支持不同的分子表现形式作为输入,支持分子属性预测、蛋白质-分子对接位点预测、亚结构生成等多种任务场景的模拟。另外,模型的表达能力更优异,对同质性高的分子结构具有更强的区分能力,在各水平的下游任务中取得SOTA性能

分子模拟大模型的下游任务和关键技术

分子模拟大模型的孵化将大大提高药物研究的效率和成功率,推动药物研发进程。下一步,大连人工智能生态创新中心将全力支持大模式落地产业相关应用:

应用一:生物分子特性预测

生物分子的性质是药物研制过程中极为重要的因素,特别是在临床实验前的候选药物筛选阶段,需要考虑药物分子自身天然存在的水溶性、毒性、人体器官吸收性等性质。

传统的实验方法是通过生物体内实验筛选出大规模分子库中数以万计的小分子,导致研发周期长、生产成本高。分子模拟大模型可以直观地将分子建模成图,利用图神经网络实现分子的化学结构表征,在保证准确预测的同时,加速药物发现进程。

小分子基酸碱解离常数值的预测

应用二:蛋白质-配体对接预测

蛋白质往往可以通过与其他生物分子或药物分子(配体)的相互作用来执行其生物学功能,对于药物开发来说,了解蛋白质-配体对接关系是了解小分子药物作用机制和潜在副作用的重要环节。

目前可用的蛋白质-配体复合结构只有约140种,通过分子模拟大模型对蛋白质和配体结构进行模拟,可以快速准确地预测对接部位和对接方位可以发现更多可用的蛋白质-配体复合结构。

分子和蛋白质结构同时建模成图,更细粒度可结合位点的预测

应用三:辅助药物设计

分子设计是药物发现过程中的关键,从开发一种新药到上市需要数亿资金。

相比用传统方法通过化学实验筛选和验证药物分子,分子模拟大模型可以用经济快捷的方法探索化学空间,得到具有特定性质的药物分子,从而加速药物设计过程,降低成本。

将神经网络和生成模型相结合以获得具有特定性质的药物分子

未来,大连人工智能生态创新中心将以澎湃计算力和平台优势,支持大连理工大学分子模拟大模式研发和产业落地,推动人工智能技术药物研发加快,为AI产业生态繁荣贡献力量!

返回列表
上一篇:
下一篇:

文章评论