MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o


☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

metagpt开源自动生成智能体工作流,4.55%成本超gpt-4o

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

AFLOW 作者团队来自于 MetaGPT 开源社区。AFLOW 论文共同第一作者为香港科技大学(广州)的博士生张佳钇和 DeepWisdom 研究员向劲宇,共同通讯作者为 DeepWisdom 创始人兼 CEO 吴承霖(MetaGPT 代码作者、论文通讯作者)和香港科技大学(广州)的助理教授骆昱宇。作者还包括中国人民大学的于兆洋、滕枫蔚和程信,南京大学 LAMDA 实验室博士生陈雄辉,复旦大学的陈家祺和郑炳南,阿卜杜拉国王科技大学的博士生诸葛鸣晨(MetaGPT 论文共同一作),DeepWisdom 研究员洪思睿(MetaGPT 论文共同一作)和王金淋,蒙特利尔大学与 MILA 实验室的助理教授刘邦。

对于 LLM 从业者来说,让 LLM 落地应用并发挥作用需要手动构建并反复调试 Agentic Workflow,这无疑是个繁琐过程,一遍遍修改相似的代码,调试 prompt,手动执行测试并观察效果,并且换个 LLM 可能就会失效,有高昂的人力成本。许多公司甚至专职招聘 Prompt Engineer 来完成这一工作。

现在,Agentic Workflow 也有自己的自动优化工具了。

MetaGPT 开源了 AFLOW,它使用 MCTS 进行 Agentic Workflow 的自动搜索,可以完全自动地构建与优化 Agentic Workflow 问题,让我们不再需要手写代码、调试提示词。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

                                                AFLOW 通过蒙特卡洛树搜索优化工作流,极低成本实现 GPT-4o 级能力

这是对提示词自动优化的进一步探索,通过蒙特卡洛树搜索,完全接管了 Agentic Workflow 的生成与优化过程,表现远超其他工作流自动优化工作,甚至超越了对比的所有手工工作流基线。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

  • 论文标题:AFlow: Automating Agentic Workflow Generation
  • 论文地址:https://arxiv.org/abs/2410.10762
  • 项目地址:https://github.com/geekan/MetaGPT/tree/main/examples/aflow

什么是自动工作流优化问题?

现有的 Agentic Workflow 自动生成工作难以生成有效的工作流,它们往往需要人工介入初始设置,且无法全面捕捉到完成任务所需的工作流多样性。为了克服这些挑战,研究人员提出了 AFLOW 框架。利用蒙特卡洛树搜索(MCTS)技术来系统地探索和优化 LLM 的工作流。AFLOW 通过将工作流定义为代码可表示的节点和边,从而有效地捕捉 LLMs 调用之间的复杂交互。通过引入操作符的概念,AFLOW 进一步简化了搜索空间,提高了搜索效率。在多个基准数据集上的实验结果表明,AFLOW 能够自动发现和优化工作流,显著提高了任务执行的性能,同时减少了对人工干预的依赖。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

                                    AFLOW 的动态演示。通过不断迭代的选择、扩展、评估和反向传播实现工作流的自动化生成和优化

AFLOW 首先将工作流优化问题重新构建为一个搜索问题,其中工作流被表示为代码化的节点序列,每个节点代表 LLM 的一个具体操作,节点之间的边定义了操作的逻辑、依赖关系和执行流程。这种表示方法将工作流转化为一个可以搜索和优化的图结构。具体来说,工作流 W 被定义为一个 LLM 调用节点序列MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o,其中每个节点MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o包含模型 M,提示 P,温度,输出格式 F(如 xml、json、markdown、raw)四个参数。节点通过边连接,边可以由各种结构表示,如图,神经网络,代码。

自动化工作流优化的目标是在给定任务 T 和评估函数 G 的情况下,发现一个工作流 W ,使得 G(W,T) 最大化。这可以被表述为一个搜索过程,其中算法 A 探索搜索空间 S 来确定最优的工作流配置。搜索空间 S 包括所有可能的节点参数和边结构的配置。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

                                    Node、Operator 和 Edge 示例。此处展示 Node 的可选参数、Operator 常见结构和 Edge 的常见表示

AFLOW 如何自动优化工作流?

AFLOW 利用蒙特卡洛树搜索(MCTS)来自动化地生成和优化 Agentic Workflow。在 AFLOW 框架中,Operator 扮演着至关重要的角色,它们是预定义的、可重用的节点组合,代表常见的智能体操作(比如审查,投票,生成)。这些 Operator 作为构建工作流的基础构件,被集成到搜索空间中,确保探索过程可以利用已知的有效智能体操作模式。引入 Operator 能够显著提升 AFLOW 框架的搜索效率和工作流的优化效果,减少在庞大搜索空间中的盲目探索。

AFLOW 的目标是在给定任务和评估函数的情况下,发现一个能够最大化任务性能的工作流。AFLOW 算法开始于初始化模板工作流,这个模板提供了一个基本的工作流框架,包括 LLM 节点的调用和 Operator 的使用。然后,算法通过 MCTS 的四个主要步骤进行迭代:选择(Selection)、扩展(Expansion)、评估(Evaluation)和反向传播(Backpropagation)。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

Remover Remover

几秒钟去除图中不需要的元素

Remover 304 查看详情 Remover

AFLOW 整体框架:通过设置一个由仅具有灵活 prompt 参数的节点、给定的运算符集和表示边的代码组成的搜索空间,AFLOW 在此空间内执行基于 MCTS 的搜索。通过为工作流优化而设计的 MCTS 变体,AFLOW 迭代执行软混合概率选择、基于 LLM 的扩展、执行评估和经验反向传播的循环,直到达到最大迭代次数或满足收敛标准

选择阶段 AFLOW 使用软混合概率选择机制来选择一个节点进行扩展。这种机制结合了均匀概率分布和基于分数的加权概率分布,以平衡探索和利用,避免陷入局部最优解。选择过程中,AFLOW 会考虑候选节点的得分和探索的需要,从而选择一个既有可能带来性能提升又具有探索价值的节点。

扩展阶段 AFLOW 使用 LLM 作为优化器来生成新的工作流。优化器利用选定工作流的经验来生成新的提示或通过修改代码来改变节点连接,从而产生新的工作流变体。这些新的工作流变体是通过对现有工作流的微小调整来实现的,例如添加、修改或删除节点和边。

评估阶段 AFLOW 直接执行生成的工作流以获得反馈。由于推理任务具有明确的评估函数,AFLOW 可以通过在验证集上多次运行工作流来计算平均分和标准差,从而获得更准确的优化器反馈。

反向传播阶段 工作流的性能信息被反向传播到 MCTS 的树结构中,用于更新节点的得分,并指导未来的搜索迭代。这些信息包括工作流的执行结果和相对于其父工作流的优化成功与否。通过这种方式,AFLOW 能够从每次迭代中学习,并逐渐改进工作流的性能。

为了避免在优化达到极限后继续执行的不必要成本,当连续几轮中分数优先的前 k 个工作流没有改进时,AFLOW 将停止上述迭代过程。

AFLOW 带来的 Agentic Workflow 变革

显著的性能优势 AFLOW 选取了六个文本推理的任务,覆盖了代码(HumanEval, MBPP),数学(GSM8K, MATH),知识问答(HotpotQA, DROP)三个场景。相比现有手动方法平均提升 5.7%,较其他自动化方法更是提升了 19.5%。在所有六个任务中,AFLOW 展现出全面的领先优势,证明了其在不同任务类型上的稳定性和适应性。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

与其他方法的性能比较。为了评估该方法的性能,我们在不同的数据集中采用了各种指标:Math 和 GSM8K 的求解率、HotpotQA 和 DROP 的 F1 分数以及 HumanEval 和 MBPP 的 pass@1。我们的 AFLOW(以黄色突出显示)在所有六个基准测试中始终优于所有自动工作流程优化和手动设计的方法

显著成本降低 AFLOW 为 Agent 领域带来的最大变革在于其显著的成本降低。较小尺寸的模型通过 AFLOW 找出的工作流,仅需 GPT-4o 推理成本的 4.55% 就能实现同等性能。这一突破意味着企业可以用更小的模型实现大模型的效果,为 AI 应用的规模化部署提供了经济可行的解决方案。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

成本(Cost)指执行分割后 HumanEval 测试集的总费用。AFLOW(模型)指 AFLOW 使用该模型执行工作流,获得反馈。图例中的颜色代表在测试数据集中执行工作流所使用的不同 LLM

自动化的效率提升 AFLOW 彻底改变了传统的人工调试模式。通过自动化的工作流生成与优化机制,显著减少了人工参与的需求。开发者不再需要花费大量时间进行反复调试和优化,系统能够自动发现最优的工作流组合,大幅缩短了开发周期。

广泛的适用性 实验结果表明,AFLOW 展现出优秀的迁移能力。它不仅支持多种主流 LLM 模型,还能适应不同类型的任务需求。在问答、代码生成、数学问题求解等多个领域的测试中,AFLOW 都表现出色,证明了其作为通用优化框架的价值。此外,用户可以通过简单的提供数据集与 Evaluation Function 来将 AFLOW 使用在自己的任务上。

展望

AFLOW 提出了一种有效生成 Agentic Workflow 的方法,并全面展示了其在降低人力与推理成本上的惊人能力。这一研究成果有望加速 Agent 在各个领域落地的速度,将 Agentic Workflow 的构建过程从专家手工构建转变为小白自动构建。

使用

目前,作者已在 GitHub 上开源了完整代码。用户可通过自定义 Benchmark 与数据集,快速为个性化任务搜索最佳性能或性能成本平衡的工作流方案,帮助个人和企业节省大量时间。

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

                                        AFLOW 的 Github 指南。可以参照分步指南配置和运行 AFLOW,高效生成和优化工作流

以上就是MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o的详细内容,更多请关注其它相关文章!


# 蒙特  # 黄色网站seo优化  # 黄平县网站建设  # 桐乡短视频营销推广包括什么  # 广州抖音获客营销推广  # seo搜索铺文章  # 如何修改账号关键词排名  # 无锡个人网站建设代加工  # 俄罗斯独立网站怎么推广  # 内乡附近网站建设公司  # seo的行业秘密  # 是在  # 科技大学  # 卡洛  # 自己的  # 产业  # 这一  # 迭代  # 自动生成  # 开源  # 工作流  # type  # operator  # cos  # 邮箱  # ai  # git  # aflow  # metagpt 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 写出优质文章的妙招:利用"稿见AI助手"的实用指南  午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|  沐曦首款AI推理GPU亮相:INT8算力达160TOPS!  真全息产品,亮相深圳文博会——dipal数伴拓展元宇宙非沉浸式体验  意大利警察拟用AI预测犯罪 该算法被指种族歧视严重  揭晓2025年玻尔兹曼奖:Hopfield网络创始人荣获奖项  马斯克称人类是半机器人,记忆外包给了电脑  航拍无人机怎么选?大疆无人机盘点推荐  自己动手使用AI技术实现数字内容生产  英伟达CEO宣称生成式AI已迎来“划时代时刻”  人工智能加速走进百姓生活:从2025全球人工智能技术大会看行业新趋势  大疆 Air 3 无人机售价和实物照片曝光  小米9号员工李明宣布创业:打造首款安卓桌面机器人  五个出色的人工智能应用实例  不到2S创作AI图像!Snap发布图像生成器SnapFusion  WPS AI 官网上线:可申请体验官资格,支持 Windows、安卓端下载  数字文明尼山对话 | 在东方圣城与AI潮流梦幻联动,看“智慧大脑”让数字山东更美好  站在社会的高度理解人工智能  微软在 Build 大会上宣布的新 Microsoft Store AI Hub 现已开始推出  西班牙小鲜肉*视频在网上疯传,本人发文澄清:是AI换脸的假视频!  云鲸发布全新的扫拖机器人J4系列  人工智能大胆预测:银河系至少有2万个地球,36种外星文明  Meta发布音频AI模型,仅需2秒片段模拟真人语音  令人震惊的特斯拉机器人  Unity 内测 Safe Voice 服务,利用 AI 自动识别玩家不当聊天内容  国宝级文物“铜兽驮跪坐人顶尊铜像”完成模拟拼接,腾讯AI立功  洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!  彬州市第三届青少年机器人创新大赛成功举办  人工智能如何用于家庭安全  游族AI创新院揭牌成立 推进AI赋能游戏业务  甲骨文与Cohere合作为企业提供生成式人工智能服务  618京东3C数码趋势产品备受青睐 AR设备成交额同比增长15倍  微软AR/VR专利提出使用时间复用谐振驱动产生双极性电源  中国AI公有云市场2025年逆势蓬勃增长,增速高达80.6%  调查显示:实际上没有那么多人在用 ChatGPT  智能化解决方案:保障数据安全阻击泄露和丢失  Intel酷睿Ultra发布会官宣!迈向全新的AI时代  13万个注释神经元,5300万个突触,普林斯顿大学等发布首个完整「成年果蝇」大脑连接组  两型无人机完成交付!国家级机动观测业务正式启动  AMD在AI方面奋起直追,与英伟达的差距缩小了吗?  海南省公安机关警用无人机培训班结业并举行警航比武演练  生成式人工智能来了,如何保护未成年人? | 社会科学报  人形机器人概念大热!这些产业链标的或受提振  Meta Connect 2025已确定时间为9月27-28,主题涵盖Quest 3与AI技术  DragGAN开源三天Star量23k,这又来一个DragDiffusion  社区里,孩子们体验“机器人竞技”  人工智能如何帮助制造业?  金山办公:AI是重要的产品战略之一  Nature封面:量子计算机离实际应用还有两年  人形机器人打开精密齿轮市场全新空间!受益上市公司梳理 

 2024-11-09

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.