多个异构大模型的融合带来惊人效果


随着LLaMA、Mistral等大语言模型的成功,许多公司开始创建自己的大语言模型。然而,从头训练新的模型成本高昂,且可能存在能力冗余。

近日,中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM,用于「融合多个异构大模型」。

与传统的模型集成和权重合并方法不同,FuseLLM提供了一种新的方式来融合多个异构大语言模型的知识。与同时部署多个大语言模型或要求合并模型结果不同,FuseLLM使用轻量级的持续训练方法,将各个模型的知识和能力转移到一个融合的大语言模型中。这种方法的独特之处在于它能够在推理时使用多个异构大语言模型,并将它们的知识外化到融合模型中。通过这种方式,FuseLLM有效地提高了模型的性能和效率。

该论文刚刚在 arXiv 上发布就引起了网友的大量关注和转发。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效


有人觉得在另一种语言上训练模型很有趣,我一直在思考这个问题。


Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

目前该论文已被 ICLR 2025 接受。

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效


  • 论文标题:Knowledge Fusion of Large Language Models
  • 论文地址:https://arxiv.org/abs/2401.10491
  • 论文仓库:https://github.com/fanqiwan/FuseLLM

方法介绍

FuseLLM 的关键在于从概率分布表征的角度来探讨大语言模型的融合,对于同样的输入文本,作者认为由不同大语言模型生成的表征可以反映出它们在理解这些文本时的内在知识。因此,FuseLLM 首先利用多个源大语言模型生成表征,将它们的集体知识和各自优势外化,然后将生成的多个表征取长补短进行融合,最后经过轻量级的持续训练迁移到目标大语言模型。下图展示了 FuseLLM 方法的概述。

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

考虑到多个异构大语言模型的 tokenizer 以及词表存在差异,在融合多个表征时,如何对齐分词结果是一大关键: FuseLLM 在 token 级别的完全匹配之上,额外设计了基于最小编辑距离的词表级别对齐,最大程度地保留了表征中的可用信息。

为了在结合多个大语言模型的集体知识的同时保持其各自的优势,需要精心设计用于融合模型生成表征的策略。具体而言,FuseLLM 通过计算生成表征和标签文本之间交叉熵来评估不同大语言模型对这条文本的理解程度,然后引入了两种基于交叉熵的融合函数:

  • MinCE: 输入多个大模型为当前文本生成的表征,输出交叉熵最小的表征;
  • AvgCE: 输入多个大模型为当前文本生成的表征,输出基于交叉熵获得的权重加权平均的表征;

在持续训练阶段,FuseLLM 使用融合后的表征作为目标计算融合损失,同时也保留了语言模型损失。最终的损失函数为融合损失和语言模型损失之和。

实验结果

在实验部分,作者考虑了一个通用但具有挑战性的大语言模型融合场景,其中源模型在结构或能力上具备较小的共性。具体来说,其在 7B 规模上进行了实验,并选择了三个具有代表性的开源模型:Llama-2、OpenLLaMA,和 MPT 作为待融合的大模型。

作者在通用推理、常识推理、代码生成、文本生成、指令跟随等场景评估了 FuseLLM,发现其相较于所有源模型和继续训练基线模型取得了显著的性能提升。

通用推理 & 常识推理

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

在测试通用推理能力的 Big-Bench Hard Benchmark 上,经过持续训练后的 Llama-2 CLM 相较于 Llama-2 在 27 个任务上取得了平均 1.86% 的提升,而 FuseLLM 则相较于 Llama-2 取得了 5.16% 的提升,显著优于 Llama-2 CLM,说明 FuseLLM 能结合多个大语言模型的优势取得性能提升。

在测试常识推理能力的 Common Sense Benchmark 上,FuseLLM 超过了所有的源模型和基线模型,在所有任务上都取得了最佳的性能。

代码生成 & 文本生成

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

在测试代码生成能力的 MultiPL-E Benchmark 上,FuseLLM 在 10 个任务中,有 9 个超过了 Llama-2,取得了平均 6.36% 的性能提升。而 FuseLLM 没有超过 MPT 和 OpenLLaMA 的原因可能是由于使用 Llama-2 作为目标大语言模型,其代码生成能力较弱,且持续训练语料中的代码数据比例较低,仅占约 7.59%。

在多个测量知识问答(TrivialQA)、阅读理解(DROP)、内容分析(LAMBADA)、机器翻译(IWSLT2017)和定理应用(SciBench)的文本生成 Benchmark 上,FuseLLM 也在所有任务中超过了所有源模型,并在 80% 的任务中超过了 Llama-2 CLM。

指令跟随

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

由于 FuseLLM 仅需提取多个源模型的表征进行融合,然后对目标模型持续训练,因此其也能适用于指令微调大语言模型的融合。在评估指令跟随能力的 Vicuna Benchmark 上,FuseLLM 同样取得了出色表现,超过了所有源模型和 CLM。

FuseLLM vs. 知识蒸馏 & 模型集成 & 权重合并

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

考虑到知识蒸馏也是一种利用表征提升大语言模型性能的方法,作者将 FuseLLM 和用 Llama-2 13B 蒸馏的 Llama-2 KD 进行了比较。结果表明,FuseLLM 通过融合三个具有不同架构的 7B 模型,超过了从单个 13B 模型蒸馏的效果。

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

为了将 FuseLLM 与现有融合方法进行比较(例如模型集成和权重合并),作者模拟了多个源模型来自相同结构的底座模型,但在不同的语料库上持续训练的场景,并测试了各种方法在不同测试基准上的困惑度。可以看到虽然所有的融合技术都可以结合多个源模型的优势,但 FuseLLM 能达到最低的平均困惑度,表明 FuseLLM 具备能比模型集成和权重合并方法更有效地结合源模型集体知识的潜力。

最后,尽管社区目前已经关注大模型的融合,但目前的做法大多基于权重合并,无法扩展到不同结构、不同规模的模型融合场景。虽然 FuseLLM 只是一项初步的异构模型融合研究,但考虑到目前技术社区存在大量不同的结构和规模的语言、视觉、音频和多模态大模型,未来这些异构模型的融合会迸发出怎样惊人地表现呢?让我们拭目以待!

以上就是多个异构大模型的融合带来惊人效果的详细内容,更多请关注其它相关文章!


# 过了  # 黔西南网站推广渠道  # 供电公司网站建设规范  # 故城求职网站建设管理  # 文山抖音seo推广  # 建设家园团购网站  # 快速seo排名软件  # 烧腊营销推广方案怎么写  # 网站建设 pdf  # 从0开始做seo  # 鄂州网站建设规划心得  # 相较  # 模型  # 超过了  # 开源  # 丰田  # 中国科学院  # 考虑到  # 取得了  # 异构  # 多个  # llama  # ai 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 前特斯拉总监、OpenAI大牛Karpathy:我被自动驾驶分了心,AI智能体才是未来!  Midjourney创始人:AI应该成为人类思想的延伸  AI技术加速迭代:周鸿祎视角下的大模型战略  360发布AI数字人广场,可同孙悟空、爱因斯坦等古今中外角色对话  【搞事】时隔4年 谷歌更新安卓logo 机器人头更饱满了  人工智能加速走进百姓生活:从2025全球人工智能技术大会看行业新趋势  笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据  联想举办2025创新开放日,展出260余项算力及AI产品技术  先进技术在防止全球数据丢失方面的作用  AI成政客博弈工具,美国大选真假难辨,律师们的生意来了  Unity 内测 Safe Voice 服务,利用 AI 自动识别玩家不当聊天内容  鸿蒙OS 4将实现AI大模型集成,余承东表示坚持AI辅助而非AI取代  大型无人机FH-98国内首次夜航转场成功  郭帆谈ChatGPT:电影行业需要创新,否则人工智能将让电影变得平庸  张朝阳与陆川谈AI:ChatGPT是鹦鹉学舌思维,不可能取代人类 | 把脉AI大模型  网易云音乐内测上线“私人DJ” 打造AI推荐音乐助手  马斯克WAIC2025演讲全文:AI将对人类文明产生深远影响  大模型新品出现井喷,AI产业迎来新时代  乐天派桌面机器人加入小米米家生态系统,实现与其他智能设备的互联  马斯克发推讽刺人工智能,机器学习本质是统计?  当TS遇上AI,会发生什么?  Adobe旗下Illustrator引入生成式AI工具Firefly  科普:什么是AI大模型  家电行业观察:AI加持下,全屋智能将成为智能家电未来?  ChatGPT会成为你家新的语音助手吗?  Meta 发布 Voicebox AI 模型:可生成音频信息,用于 NPC 对话等  午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|  优化J*a与MySQL合作:分享批处理操作的技巧  昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布  鉴智机器人发布基于地平线征程5的标准视觉感知产品  微软在德国举办MR研讨会,向女性分享元宇宙潜力  新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实  特斯拉人形机器人将亮相 预计售价不超过15万元  第四范式「式说」大模型入选《2025年通用人工智能创新应用案例集》  调研海尔智家:AI名,家电命?  人工智能助力精准学习,猿辅导小猿学练机满足学生个性化学习需求  NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉  标小智LOGO推出AI公司起名生成器“Name.GPT”  无人机自主巡检为高海拔输电线路运维添“新彩”  搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验  华为HarmonyOS 4:享流畅提升20%,AI大模型更智能一览无余  生成式人工智能如何改变云安全的游戏规则  马斯克讽刺人工智能炒作:什么“机器学习”,其实就是统计  「社交达人」GPT-4!解读表情、揣测心理全都会  阿里云全面支持Llama2训练部署,助力企业快速构建自有大型模型  Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%  “聚智启新,‘蓉’力同行” 成都市人工智能产业融通对接会成功举办  人工智能改变网络安全和用户体验的三种方式  智能机器人正在彻底改变客户服务  抢占新赛道 加快机器人产业集聚发展 

 2024-01-29

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.