清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1


图片

编辑 | ScienceAI

2025 年初,DeepSeek给全球引发了 AI 大模型的新一轮热议。多家市场咨询公司指出,在 DeepSeek 的影响下,从大模型供应商到基础设施和平台供应商的整个 AI 产业生态都掀起了一波「新浪潮」。 DeepSeek R1 以其强大的推理能力,为各行各业带来了智能化升级新机遇。而生物医药领域,也正在迎来它的 DeepSeek 时刻。

2025 年 2 月 20 日,清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司(水木分子)携手推出了升级版的生物医药多模态开源基础大模型 BioMedGPT-R1。

此前,在 2025 年,双方合作发布了开源可商用、生物医药多模态百亿参数开源基础大模型 BioMedGPT,水木分子发布了自研千亿参数多模态生物医药专业大模型 Chat DD-FM 和新一代 AI 驱动药物发现工具 Chat DD。这次 DeepSeek 版 ChatDD- R1 基座模型也已同步上线 ChatDD,赋能生物医药企业的药物研发。

自发布以来,BioMedGPT 受到了开源社区和产研界的广泛欢迎和好评,清华大学 AIR 与水木分子也在 ICML、NeurIPS 和 KDD 等国际顶级会议上围绕生物医药研发场景联合发表了多篇学术论文。BioMedGPT-R1 与 ChatDD-R1 将 DeepSeek-R1 运用到生物医药多模态大模型和医药研发助手中,进一步降低计算成本、升级智能能力、提高研发效率,开源与商业「双管齐下」、推动「AI+医药」DeepSeek 浪潮。

BioMedGPT-R1新一代开源生物医药多模态大模型

BioMedGPT 是清华大学智能产业研究院(AIR)携手水木分子开源的全球首个可商用多模态生物医药百亿参数大模型,该模型在生物医药专业领域问答能力比肩人类专家水平,发布时在自然语言、分子、蛋白质跨模态问答任务上达到SOTA。BioMedGPT 能够同时处理多种生物医学任务,具有广泛的适用性、更多的可能性。

在BioMedGPT的基础上,清华大学AIR与水木分子再次携手推出了 BioMedGPT-R1 (图 1),用 DeepSeek R1 蒸馏版本模型更新了 BioMedGPT 中现采用的文本基座模型,从而引入了更优的文本推理能力。通过跨模态特征对齐,BioMedGPT-R1 实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。通过训练对齐翻译层(Translator),BioMedGPT-R1 将生物模态编码器(Molecule Encoder 与 Protein Encoder)输出映射到自然语言表征空间,从而在 DeepSeek R1 基础上增加了生物模态数据的理解能力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

图 1:BioMedGPT-R1 模型框架和主要训练步骤

BioMedGPT-R1 的训练分为两个主要步骤(图1):首先,仅训练对齐翻译层 Translator,使其能将编码后的生物模态表征映射到语义表征空间;然后,同时微调对齐翻译层 Translator 和基座大语言模型,激发其在下游任务上的多模态深度推理能力。

以化学小分子 X为例,在 BioMedGPT-R1 中,X经过化学分子编码器提取特征,生成中间表示 ZM,然后通过对齐翻译层进行映射,得到化学分子表征EM,进而与经过处理和编码的语言指令表征 EQ共同输入至基座语言模型,使语言模型能够结合两个模态信息进行综合推理,生成最终的文本回复。

基于上述模型架构与训练策略,BioMedGPT-R1 支持跨模态自然语言和生物语言的交互式问答推理,可应用到药物分子深度理解分析、药物靶点探索与挖掘等领域。例如,当需要了解某个化学分子时,BioMedGPT-R1 可以从分子结构、官能团组成、生化性质和可能的应用等方面逐步推理分析,最终形成文本回复(图 2)。生物医药从业人员日常工作既离不开文本,也离不开小分子、蛋白质等生物模态信息,BioMedGPT-R1 将「强推理慢思考」从单文本模态,进一步推广至生物多模态场景,赋能生物医药行业。

MedPeer科研绘图 MedPeer科研绘图

生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新

MedPeer科研绘图 166 查看详情 MedPeer科研绘图

图片

图 2:跨模态对齐后,模型实现多模态问答场景下的理解分析

清华大学 AIR 和水木分子研究团队长期持续维护 OpenBioMed 开源平台(https://github.com/PharMolix/OpenBioMed),团队现阶段探索方向是如何在强推理语言模型的基础上更好地适应性地实现跨模态对齐,团队正在以 BioMedGPT-R1 为基础进行系统性研究与综合评估,目前已经观察到其在化学分子理解任务上的性能提升,如在 CheBI-20 化学分子描述任务上相比上一版本效果提升超 15%(表 1),后续也将依托 OpenBioMed 平台开源 BioMedGPT-R1 模型和生物医药研发 Agent 系统框架。

表1:在CheBI-20化学分子描述任务上产生明显性能提升

图片

BioMedGPT-R1 在生物医药相关文本问答任务上也展现出了较优的效果,如在 USMLE美国医师资格考试上达到了 67.1% 正确率,效果逼近闭源商用大模型和人类专家水平(图 3),并在专家级医疗推理与理解评测集 MedXpertQA 上达到和闭源商用大模型相当的效果(图 4),团队正在探索生物医药场景下的多个深度推理能力应用,期待让「强推理慢思考」赋能医药研发。

图片

图 3:在 USMLE 美国医师资格考试评测集上效果逼近闭源商用大模型和人类专家水平

图片

图 4:在 MedXpertQA 专家级医学推理与理解评测集上效果与闭源商用大模型相当

ChatDD-R1:药企全流程智能化升级,显著提升药物研发效率

水木分子开发的对话式医药研发助手 ChatDD,基于分子、蛋白质和单细胞等多模态生物医药大模型,服务药物研发全流程,包括立项调研、靶点挖掘、早期药物发现、临床前研究、生物标记物发现和精准患者招募等场景。DeepSeek 版 ChatDD-R1 将是多模态生物医药大模型 ChatDD-FM 的升级版本大幅提升了推理规划能力,为广大药企提供更强的研发能力、更高的研发效率和更低的研发成本。ChatDD-R1 与水木分子专属知识图谱结合,为药企用户提供更加专业、实时、全面的深度检索与思考;同时也与药物研发专家经验流程结合,在特定场景给予专业思路引导,例如药物竞品分析、上市药物的专利过期时间、信号通路推荐等。

以上就是清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1的详细内容,更多请关注其它相关文章!


# 基础上  # 淘宝店铺的营销推广方法  # 重庆企业品牌营销推广  # b2b免费网站推广平台排名  # seo关键解码书籍  # 常州关键词排名教程  # 网站建设 seo模块  # 搜索关键词排名怎么投放  # 优化网站配色穿搭  # 竞价推广是seo吗  # 建网站 网站建设  # 腾讯  # 还能  # 首个  # 理论  # 基座  # 自然语言  # 模态  # 多模  # 开源  # type  # 2025  # deepseek  # ai  # 工具  # git  # 语言模型  # 清华大学 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 美图影像节演讲实录:191次提及AI,发布7款影像生产力工具  微软 Copilot 团队主管呼吁用户与 AI 交流时应使用恰当的礼貌用语  贫穷让我预训练  干货满满,2025昆山元宇宙国际装备展等你来打卡!  高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案  【澎湃原动力】人工智能产业协同创新中心:全产业链资源在这里汇聚  特斯拉首发人形机器人“擎天柱”亮相世界人工智能大会  AI创作广告文案等同2.47年工作经验,且消费者无法区分|AI营销前沿  软通动力多项AI创新产品及应用亮相2025世界人工智能大会  人工智能在商业中的风险和局限性  探展WAIC | 第四范式“式说”聚焦toB大模型,布局生成式AI重构企业软件  看了天美对AI的布局,我感觉它想得是真明白  揭秘AI数字人语录:抖音AI小和尚、老者语录能赚钱吗?  周星驰支持的人工智能与 Web3 初创公司 Moonbox 完成 100 万美元融资  鸿蒙生态带来了哪些新的流量可能性,包括AI、服务分发和原生智能等方面?  AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑  美图吴欣鸿:希望更多人用上AI时代的影像生产力工具  无需照相馆,AI证件照生成软件即将推出  AI教父Bengio:我感到迷失,对AI担忧已成「精神内耗」!  新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实  如何成功实施人工智能?  聚焦人工智能大模型、AIGC 徐汇十余场重磅论坛等你来  腾讯企点客服接待与营销分析能力升级!企业操作更高效、人机交互更智能  击败LLaMA?史上超强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞  人工智能自己玩自己  云深处与昇腾CANN携手合作:开设ROS四足机器狗开发训练营  靠游戏更靠AI 英伟达成唯一首季度两位数增长的公司  AI赋能艺术 超现实达利奇幻之旅在沪开启  英伟达CEO宣称生成式AI已迎来“划时代时刻”  通用医疗人工智能如何革新医疗行业?  DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU  Bing Chat 和 Bing Search 正式引入深色模式  云鲸发布全新的扫拖机器人J4系列  普林斯顿Infinigen矩阵开启!AI造物主100%创造大自然,逼真到炸裂  人工智能在重症监护室的未来  华为HarmonyOS 4将集|成人|工智能大型模型  【首发】首款“消化内镜手术机器人”进入临床尾声,ROBO医疗获数千万元A轮融资  百川智能发布Baichuan-13B AI模型,号称“130亿参数开源可商用”  NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉  华为4G5G通信物联网收费标准公布,多年研发成果,十年花费近万亿  黄仁勋:5年前,我们对AI抱有巨大期望  30+大模型齐聚,大模型成世界人工智能大会“顶流”  助力人工智能产业高质量发展 龙岗区算法训练基地正式启用  探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网  大疆 Air 3 无人机售价和实物照片曝光  Xreal AR 眼镜用投屏盒子 Beam 发布:分体式设计,到手 699 元  人工智能产业协同创新中心:全产业链资源在这里汇聚  网易云音乐和小冰推出AI歌手音乐创作软件,首发内置12名AI歌手  Vision Pro头显重磅发布;苹果收购AR厂商Mira  IBM和NASA合作发布可追踪碳排放的开源AI基础模型 

 2025-02-22

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.