速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现


☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

编辑 | 白菜叶

机器学习为快速准确地预测结合亲和力提供了巨大的希望。然而,目前的模型缺乏稳健的评估,无法完成(命中到)先导化合物优化中遇到的任务,例如对一系列同类配体的结合亲和力进行排序,从而限制了它们在药物发现中的应用。

牛津大学的研究团队首先提出了一种新的基于注意力的图神经网络模型 AEV-PLIG(原子环境向量-蛋白质配体相互作用图),以解决这些问题。其次,他们提出了一种新的、更真实的分布外测试集(out-of-distribution test set),称为 OOD 测试。

研究人员在这个包含 CASF-2016 和用于自由能扰动 (FEP) 计算的测试集上,对该模型进行基准测试,突显了 AEV-PLIG 的竞争性能,同时对具有严格基于物理的方法的机器学习模型提供了现实的评估。

团队还展示了如何利用增强数据(使用基于模板的建模或分子对接生成)来显著改善结合亲和力预测相关性和 FEP 基准上的排名。

该研究以「Narrowing the gap between machine learning scoring functions and free energy perturbation using augmented data」为题,于 2025 年 2 月 8 日发布在《Communications Chemistry》。

图片

预测蛋白质与配体结合时自由能的变化是计算小分子药物发现的基石。它在命中识别过程中至关重要,在命中识别过程中,人们旨在识别对目标具有高亲和力的结合物,以及在命中到先导和先导优化过程中,必须优化结合亲和力以及与安全性和生物功效相关的许多其他特性。

机器学习算法和架构可以预测这些特性,但是由于缺乏相关数据,其应用受的了限制。基于结构的方法需要准确的结合亲和力测量以及以足够分辨率解析蛋白质-配体复合物(尤其是结合口袋)的相应三维 (3D) 结构。

增加训练数据的数量和多样性的一种策略是使用数据增强,其中生成合成数据来模拟真实世界的观察或通过修改现有的实验确定的示例。这类方法已被证明可用于计算机视觉和自然语言处理应用。

然而,由于一些固有的复杂性和物理化学限制,从头生成有意义的生物和化学数据可能具有挑战性。

新策略

在最新研究中,牛津大学的研究人员提出了多种策略来增强机器学习(ML)评分功能的适用性并对其性能提供更现实的评估,特别关注药物发现应用。

他们提出了一种新颖的结合亲和力预测方法 AEV-PLIG,将原子环境向量 (AEV) 与蛋白质-配体相互作用图 (PLIG) 相结合,采用注意力 GNN 架构来捕捉决定结合亲和力的复杂相互作用。

图片
图示:AEV-PLIG 架构。(来源:论文)

研究人员将 AEV-PLIG 与 RFScore、Pafnucy、OnionNet-2、PointVS、SIGN、AEScore 一起进行了评估,使用了多种旨在评估 OOD 数据(OOD 测试)和药物相关系统(FEP 基准)或惩罚记忆(0 配体偏差)的性能的基准,结果显示其性能明显差于广泛使用的评分函数基准 CASF-2016。

MedPeer科研绘图 MedPeer科研绘图

生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新

MedPeer科研绘图 166 查看详情 MedPeer科研绘图

在比较不同的 ML 模型时,AEV-PLIG 表现良好,但没有一个模型在所有基准测试中取得明显更好的性能,这凸显了需要一组多样化的测试用例来评估新模型、特性和架构。

图片

图示:AEV-PLIG 模型在 FEP 基准测试中的性能。(来源:论文)

这些策略共同缩小了与 FEP 计算的性能差距(FEP+ 在 FEP 基准上实现了加权平均 PCC 和 Kendall 的 τ 0.68 和 0.49),同时速度提高了约 400,000 倍。

这些测试集最初设计用于对 FEP 的性能进行基准测试和验证,它们不仅为 CADD 应用提供了更真实的预测准确性指示,而且还可以直接比较当前基于 ML 和 MD 的方法。

图片
图示:FEP+ 与 AEV-PLIG 模型针对 FEP 基准中具有 25 个或更多配体的目标进行性能比较。(来源:论文)

鉴于生化领域普遍存在数据稀缺的问题,研究人员探索了使用增强数据,通过对实验结合数据进行训练的模型,但使用基于模板的比对或对接来建模 3D 蛋白质-配体结构。

事实证明,这种数据增强策略是一种有效的方法,可以显著提高 AEV-PLIG 在药物发现系统中的排名能力,其中通过引入小的结构修改来串联设计化合物,旨在增加它们对特定目标的结合亲和力。

研究人员表示,额外的增强数据可以提高未来的性能;鉴于最近引入了精确的(蛋白质-配体)结构预测模型,例如 AlphaFold 3、Umol 和 NeuralPlexer,这些数据很快就会随时可用。

结语

总而言之,AEV-PLIG 在各种基准测试中始终表现出与各种其他基于 ML 的方法相当或更好的性能。使用增强数据进行训练还提供了一种非常有效的方法,可以显著提高药物发现中经常遇到的同类系列的预测相关性和排名。

此外,AEV-PLIG 比 FEP 快几个数量级,需要的每个系统准备最少,并且产生绝对结合亲和力而不是相对自由能差异。

这项研究强调了捕捉蛋白质-配体相互作用的新特征化的潜力、对更强大基准的需求,以及增强数据在训练基于 ML 的评分函数以实现快速准确的结合亲和力预测的新兴作用。

论文链接:https://www.nature.com/articles/s42004-025-01428-y

以上就是速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现的详细内容,更多请关注其它相关文章!


# 图神经网络  # 理论  # 还能  # 过程中  # 牛津  # 牛津大学  # 相互作用  # 提出了  # Type  # 2025  # cad  # 药物发现  # 基准  # 机器学习  # 江西营销seo推广  # 网络营销产品推广方案  # 本溪网站建设好处  # 怎样优化移动网站流量  # seo人才专业知识  # seo1最新域名  # 外贸seo怎么选域名  # 创新创业营销推广  # 西安电脑网站建设  # 旅游网站建设课程总结  # 开源  # 播客  # 首个  # 腾讯 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 利好来了,AI再起一波?  人工智能正在弥合认知和表达之间的鸿沟  人工智能如何改变未来语言?  Zoom远程会议应用:AI培训需经用户授权  探索AI前沿理念 2025全球人工智能技术大会在杭州开幕  映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动  特斯拉门店可能启动机器人卖车?也许不是你想的那样  “智能体动作生成技术”现身WAIC:游戏AI技术为机器人科创注入新动力  焊接协作机器人或将成为26届埃森展最大看点  利用AI探索抗体“钥匙”、加速药物研发——访百图生科团队  到中国科技馆体验“一滴油的奇妙旅行”,线上元宇宙展厅同步开启  亚马逊确认今年不举办re:MARS人工智能大会  “风乌”气象大模型科学家团队:用AI预报极端天气未来不是梦!  《上古卷轴5》AI高清材质包优化游戏中所有怪物  湖北科技职业学院举行工业机器人及智能制造技术专精特新产业学院建设启动仪式  华为HarmonyOS 4:享流畅提升20%,AI大模型更智能一览无余  苹果AR头显商标与华为撞车,在中国或改名  将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?  【趋势周报】全球元宇宙产业发展趋势:ChatGPT的出现,将元宇宙实现至少提前了10年  腾讯TRS之元学习与跨域推荐的工业实战  大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务  先进技术在防止全球数据丢失方面的作用  城市在采用人工智能方面进展如何?  百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧  可按用户语气自动回复消息,Zoom 推出基于生成式 AI 的新功能  央视报道车载人机交互技术!MWC上海魅族表现亮眼,现场热火朝天  新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实  猿编程参加人工智能高峰论坛,推动人工智能教育解决方案在千所学校推行  全面拥抱大模型浪潮,ISC 2025打造全球首场AI数字安全峰会  人工智能:解决劳动力短缺的关键策略  看懂AI,找到增长新势能 | 笔记侠AI峰会等你来  美的推出 AI 双视精准避障的自动集尘扫拖机器人 V12,售价仅为2999元  宇宙探索下一阶段,机器代替人类,AI会在太空探索中取代人类吗?  Unity 内测 Safe Voice 服务,利用 AI 自动识别玩家不当聊天内容  笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据  Snap宣布研发出新技术 可大幅提升AI生成图像速度  ChatGPT大更新!OpenAI奉上程序员大礼包:API新增杀手级能力还降价,新模型、四倍上下文都来了  再度重仓 AI 赛道,SaaS 巨头 Salesforce 扩大 AIGC 风投基金规模  马斯克发推讽刺人工智能,机器学习本质是统计?  昇腾AI & 讯飞星火:深度联手,共话国产大模型“大未来”  苹果AI战略与微软谷歌大相径庭,到底是领先还是落后?  普林斯顿Infinigen矩阵开启!AI造物主100%创造大自然,逼真到炸裂  微软向美国政府提供GPT的大模型,安全性如何保证?  优傲机器人的人机协作技术 助力中小企发展  XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏”  浪潮KaiwuDB:“快人一步” - 打造更懂物联网的数据库  微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析  微软最新推出的NaturalSpeech2语音合成模型:提供更准确的语音重构,避免棒读效果  OpenAI大神Karpathy最新分享:为什么OpenAI内部对AI Agents最感兴趣  人工智能在重症监护室的未来 

 2025-02-24

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.