DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU


目录:


  1. Faster sorting algorithms discovered using deep reinforcement learning
  2. Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding
  3. Patch-based 3D Natural Scene Generation from a Single Example
  4. Spatio-temporal Diffusion Point Processes
  5. SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression
  6. UniControl: A Unified Diffusion Model for Controllable Visual Generation In the Wild
  7. FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance

论文 1:Faster sorting algorithms discovered using deep reinforcement learning

  • 作者:Daniel J. Mankowitz 等
  • 论文地址:https://www.nature.com/articles/s41586-023-06004-9

摘要:「通过交换和复制移动,AlphaDev 跳过了一个步骤,以一种看似错误,但实际上是捷径的方式连接项目。」这种前所未见、违反直觉的思想不禁让人回忆起 2016 年那个春天。

七年前,AlphaGo 在围棋上击败人类世界冠军,如今 AI 又在编程上给我们上了一课。Google DeepMind CEO 哈萨比斯的两句话引爆计算机领域:「AlphaDev 发现了一种全新且更快的排序算法,我们已将其开源到主要 C++ 库中供开发人员使用。这只是 AI 提升代码效率进步的开始。」

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU

推荐:AI 重写排序算法,速度快 70%:DeepMind AlphaDev 革新计算基础,每天调用万亿次的库更新了

论文 2:Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding

  • 作者:Hang Zhang 等
  • 论文地址:https://arxiv.org/abs/2306.02858

摘要:近期,大语言模型展现出了令人瞩目的能力。我们能否给大模型装上 “眼睛” 和 “耳朵”,让它能够理解视频,陪着用户互动呢?

从这个问题出发,达摩院的研究人员提出了 Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA 能够感知和理解视频中的视频和音频信号, 并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音 / 视频描述,写作,问答等。目前论文,代码,交互 demo 都已开放。另外,在 Video-LLaMA 的项目主页中,该研究团队还提供了中文版本的模型,让中文用户的体验更丝滑。

下面两个例子展示了 Video-LLaMA 的视听综合感知能力,例子中的会话围绕有声视频展开。

Seede AI Seede AI

AI 驱动的设计工具

Seede AI 713 查看详情 Seede AI

deepmind用ai重写排序算法;将33b大模型塞进单个消费级gpu

推荐:给语言大模型加上综合视听能力,达摩院开源 Video-LLaMA。

论文 3:Patch-based 3D Natural Scene Generation from a Single Example

  • 作者:Weiyu Li 等
  • 论文地址:https://arxiv.org/abs/2304.12670

摘要:北京大学陈宝权团队联合山东大学和腾讯 AI Lab 的研究人员,提出了首个基于单样例场景无需训练便可生成多样高质量三维场景的方法。

DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU

推荐:CVPR 2025 | 三维场景生成:无需任何神经网络训练,从单个样例生成多样结果。

论文 4:Spatio-temporal Diffusion Point Processes

  • 作者:Yuan Yuan 等
  • 论文地址:https://arxiv.org/abs/2305.12403

摘要:清华电子工程系城市科学与计算研究中心最新提出时空扩散点过程,突破已有方法建模时空点过程的受限概率形式和高采样成本等缺陷,实现了灵活、高效且易于计算的时空点过程模型,可广泛用于城市自然灾害、突发事故和居民活动等时空事件的建模与预测,促进城市规划和管理的智能化发展。下表展示 DSTPP 相比已有点过程解决方案的优势。

DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU

推荐:扩散模型还能预测地震和犯罪?清华团队最新研究提出时空扩散点过程。

论文 5:SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression

  • 作者:Tim Dettmers 等
  • 论文地址:https://arxiv.org/pdf/2306.03078.pdf

摘要:为了解决准确性问题,来自华盛顿大学、苏黎世联邦理工学院等机构的研究者提出了一种新的压缩格式和量化技术 SpQR(稀疏 - 量化表征),首次实现了 LLM 跨模型尺度的近无损压缩,同时达到了与以前方法相似的压缩水平。

SpQR 通过识别和隔离异常权重来工作,这些异常权重会导致特别大的量化误差,研究者将它们以更高的精度存储,同时将所有其他权重压缩到 3-4 位,在 LLaMA 和 Falcon LLMs 中实现了不到 1% 的困惑度相对准确率损失。在单个 24GB 的消费级 GPU 上运行 33B 参数的 LLM,而不会有任何性能下降,同时还能提高 15% 的速度。下图 3 为 SpQR 的总体架构。

DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU

推荐:将 330 亿参数大模型「塞进」单个消费级 GPU,加速 15%、性能不减。

论文 6:UniControl: A Unified Diffusion Model for Controllable Visual Generation In the Wild

  • 作者:Can Qin 等
  • 论文地址:https://arxiv.org/abs/2305.11147

摘要:本文中,Salesforce AI、东北大学、斯坦福大学的研究者提出了 MOE-style Adapter 和 Task-aware HyperNet 来实现 UniControl 中的多模态条件生成能力。UniControl 在九个不同的 C2I 任务上进行训练,展示了强大的视觉生成能力和 zero-shot 泛化能力。UniControl 模型由多个预训练任务和 zero-shot 任务组成。

DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU

推荐:多模态可控图片生成统一模型来了,模型参数、推理代码全部开源。

论文 7:FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance

  • 作者:Lingjiao Chen 等
  • 论文地址:https://arxiv.org/pdf/2305.05176.pdf

摘要:成本和准确性之间的平衡是决策制定的关键因素,尤其是在采用新技术时。如何有效和高效地利用 LLM 是从业者面临的关键挑战:如果任务相对简单,那么聚合来自 GPT-J (其规模比 GPT-3 小 30 倍)的多个响应可以实现与 GPT-3 类似的性能,从而实现成本和环境上的权衡。然而,在较为困难任务上,GPT-J 的性能可能会大大下降。因此,如何经济高效地使用 LLM 需要采用新的方法。

最近的一项研究尝试提出解决这一成本问题的方法,研究者通过实验表明,FrugalGPT 可以与最佳个体 LLM(例如 GPT-4) 的性能相媲美,成本降低高达 98%,或者在相同成本下将最佳个体 LLM 的准确性提高 4%。该研究讨论了三种降低成本的策略,即 prompt 适应、LLM 近似和 LLM 级联。

DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU

推荐:GPT-4 API 平替?性能媲美同时成本降低 98%,斯坦福提出 FrugalGPT,研究却惹争议。

以上就是DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU的详细内容,更多请关注其它相关文章!


# 清华  # 谁有好的推广网站靠谱  # 各种网站都在推广自家的APP  # 百捷seo推广作用  # 济南网站seo价格  # seo网站优化方案新手  # 新邵县电商网站优化  # 如何在短时间内推广网站  # 仙游网站建设设计  # 莘县外贸网站优化  # seo新闻的撰写  # 实现了  # 论文  # 还能  # 多个  # 太多  # 达摩  # 提出了  # 开源  # 塞进  # 重写  # udio  # llama 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 借力AI!PCB全球巨头,有爆发潜质吗?  从数据中心到发电站:人工智能对能源使用的影响  选对AI智能写作软件,让创作游刃有余!  世界人工智能大会|“AI领航,共筑未来”高端保险论坛成功举办  如何用AI重塑你的工作流(一)  当一切设备都受到人工智能的控制  业内领先 四川大学华西第四医院甲状腺乳腺外科成功进入手术机器人时代  《自然》杂志拒绝刊登人工智能生成的图片和视频  机器人加速!稀土永磁也被带火,持续性如何?  企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  华为昇腾AI原生支持30多种基础大模型,包括GPT  移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速  游族AI创新院揭牌成立 推进AI赋能游戏业务  12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词  最大助力35公斤 外骨骼机器人或在养老、医疗领域“大展身手”  AI在教育中的角色:AI如何改变我们的学习方式  微幼科技推出全自动晨检机器人,助力幼儿园校园健康检测  AI大模型火了!科技巨头纷纷加入,多地政策加码加速落地  英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练  世界人工智能大会(WAIC 2025)点燃魔都,博尔捷数字科技携前沿技术产品亮相  微软在 Build 大会上宣布的新 Microsoft Store AI Hub 现已开始推出  华为推出全新操作系统HarmonyOS 4,AI和新引擎完美融合  今年,全球客服中心支出将增长 16.2%,迎接对话式 AI 的浪潮,根据 Gartner 报告  华为云盘古大模型3.0发布 AI云服务同时上线:200亿亿次性能  写出优质文章的妙招:利用"稿见AI助手"的实用指南  尼康尼克尔Z 180-600mm f/5.6-6.3 VR镜头发布:12499元 拍鸟神器  中国联通推出“极光一号”5G机载终端,适配大疆等品牌无人机设备  如何用Transformer BEV克服自动驾驶的极端情况?  Win11 的画图应用将包含 Windows Copilot 的 AI 工具整合  国内首款大尺寸仿鸵双足机器人“大圣”亮相,穿戴红色战袍  不止“文心一言”,消息称百度将推出全新 AI 对话软件“万话”  优地网络助力新媒体拥抱人工智能时代  抖音在Android平台获得VR|直播|软件著作权  借助ChatGPT快速上手ElasticSearch dsl  【澎湃原动力】人工智能产业协同创新中心:全产业链资源在这里汇聚  当孔子遇见AI|尼山的“数字”  Intel酷睿Ultra发布会官宣!迈向全新的AI时代  13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了  网易云音乐和小冰推出AI歌手音乐创作软件,首发内置12名AI歌手  无需照相馆,AI证件照生成软件即将推出  人工智能“Aria”现身 Opera浏览器100版本更新:新功能“标签岛”  管提需求,大模型解决问题:图表处理神器SheetCopilot上线  无人机在电力巡检中的应用:全面解析高效巡检流程  令人震惊的特斯拉机器人  值得买科技入选“北京市通用人工智能产业创新伙伴计划”应用伙伴  首个算网生态体!中国移动元宇宙产业联盟正式成立  第 66 届格莱美奖规定,AI 作品将无法获得评奖资格  成都大运会闭幕式引入人形机器人展示表演  世界上第一个完全由人工智能驱动的图像编辑器! 

 2023-06-12

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.