华为诺亚方舟实验室推出高效选择性注意力算法esa,攻克大模型长文本处理难题!deepseek和月之暗面在长序列技术领域取得突破后,华为诺亚方舟实验室紧随其后,发布了全新高效选择性注意力算法(esa)。该算法通过巧妙的稀疏注意力机制设计,有效解决了大模型处理长文本时面临的计算瓶颈。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
论文地址:https://www.php.cn/link/860df126db301831a32055bea29fb4da
ESA算法在显著提升计算效率的同时,保持了与全注意力方法相当甚至更高的准确率。它能够将大模型的上下文长度有效扩展至数倍,为长序列任务的应用开辟了新的可能性。
大语言模型的长序列推理一直是业界难题。模型训练需要巨大的算力和数据,而理想的方案是将短序列训练成果外推至长序列。然而,注意力计算复杂度随序列长度平方级增长,使得高效准确的长序列推理成为巨大挑战。
ESA算法正是针对这一挑战提出的创新解决方案。它通过对query和key进行低维压缩,大幅降低了token选择的计算复杂度。ESA算法灵活高效地选择关键token进行注意力计算,有效减轻了大模型处理长文本的计算负担。尤其是在高倍外推场景下,其性能甚至超越了全注意力算法。
ESA算法的核心:
高效选择: ESA采用基于query感知的token粒度选择机制,结合邻域影响力,避免了单纯选择top-ranked token导致的性能损失,精准定位关键信息。
注意力计算: ESA仅使用选择的关键token进行完整query和key的注意力计算,而非所有前序token,从而大幅降低计算复杂度。
ESA算法的创新之处在于其token粒度选择性注意力机制。不同于现有方法,ESA在预填充和解码阶段动态选择关键token,而非固定block选择或永久丢弃不重要token。它将query和key压缩至原维度的约3.2%,在低维空间计算重要性分数,显著降低计算复杂度。然后,选择topk token进行注意力计算,将复杂度从平方级降低至线性级。
MedPeer科研绘图
生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新
166
查看详情
ESA算法示意图
ESA的具体实现细节包括:将输入序列token分为四部分,结合全局注意力和局部窗口注意力,并通过offline方式训练降维MLP,无需模型微调。 为了确保分数的相对大小,ESA对分数进行修正,并引入邻域影响力,进一步提升准确性。最终的注意力计算复杂度在长序列场景下可降低至原有的1.6%左右。



实验结果表明,ESA在多个公开的长序列基准测试中,性能优于full attention方法和其他同类型方法,尤其在多针检索任务中表现突出。
总结: ESA算法有效平衡了长序列外推场景下选择性注意力的灵活性和计算效率,在不增加模型参数的情况下扩展了上下文长度,为大模型的长序列应用带来了新的突破。 未来的研究方向将集中于探索更准确高效的token选择方法以及软硬件协同的高效外推方案。
以上就是稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA的详细内容,更多请关注其它相关文章!
# 首个
# 易学seo
# 哈尔滨网站推广营销
# 仪陇县推广营销
# seo培训引流优化
# 吕梁搜索seo团队
# 户型优化看哪个网站
# 邹平县b2c网站建设
# 二手车网站网络推广
# 国外电子产品推广网站
# 网站标题优化错误
# 工程
# 而非
# 多项
# 腾讯
# 还能
# 首次
# 奥迪
# 诺亚
# 诺亚方舟
# 华为
# deepseek
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
OpenAI限制网络爬虫访问以保护数据免被用于AI模型训练
生成式人工智能来了,如何保护未成年人? | 社会科学报
音乐制作元工具AudioCraft发布开源AI工具
大型无人机FH-98国内首次夜航转场成功
美踏控股推出创新人工智能大数据模型“心乐舞河”:虚拟人音舞社交的新体验
特斯拉 Optimus 人形机器人入驻北美门店,帮助提升汽车销量
Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来
科技有狠活|时光修复师 :用AI让昨日重现
喜马拉雅在国际会议挑战赛中突破语音重叠难题斩获第一 加速AI创新
13 个提高生产力的 AI 工具
乐天派桌面机器人加入小米米家生态系统,实现与其他智能设备的互联
马斯克嘲讽人工智能:机器学习本质就是统计学
借力AI!PCB全球巨头,有爆发潜质吗?
优傲机器人的人机协作技术 助力中小企发展
日新月异,脑机接口技术都有哪些新应用?
图灵奖得主Hinton:我已经老了,如何控制比人类更聪明的AI交给你们了
AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲
AI与5G的强强联合:唤醒数字时代的无尽潜能
深剖Apple Vision Pro中暗藏的“AI”
技术如何使人变得懒惰?
智能客服进入AI 2.0时代 容联云发布语言大模型“赤兔”
当一个网站的内容被 AI 完全接管
500元一张的AI艺术二维码制作,详细教程来了!
当一切设备都受到人工智能的控制
万魔推出AI主攻的运动耳机,开启十年研发新纪元
如布科技发布新产品AI口袋学习机S12
微软 Azure AI 文本转语音服务升级:新增男性声音和扩展语言支持
苹果AI战略与微软谷歌大相径庭,到底是领先还是落后?
Unity 内测 Safe Voice 服务,利用 AI 自动识别玩家不当聊天内容
日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
联想首发AI PC于今年秋季,英特尔CEO确认AI PC时代来临
生成式AI对云运维的3大挑战
全场景智能车:智能无处不在|芯驰亮相世界人工智能大会
WHEE安装教程
上天下海登极,青岛与昇腾AI握手一起探索星辰大海
联合国秘书长称支持建立全球人工智能监管机构
AI在教育中的角色:AI如何改变我们的学习方式
扎克·施奈德新片《月球叛军》曝剧照 机器人首度现身
网易云音乐内测上线“私人DJ” 打造AI推荐音乐助手
磐镭发布全新 GeForce RTX 4080 ARMOUR 显卡,售价为 9499 元
英伟达的AI领域垄断地位:一直无法撼动吗?
探索人工智能在物联网领域的影响与改变
腾讯机器狗进化:通过深度学习掌握自主决策能力
时隔 4 年:谷歌更新安卓机器人 LOGO,形象更立体
多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展
央广车联网亮相2025世界人工智能大会
英伟达推出 L40S GPU,AI 推理性能超过 A100 约 1.2 倍
自然语言生成在智能家居设备中的应用
“思享荟”沙龙热议AIGC与元宇宙 复旦大学赵星畅谈深度数字化
2025-02-24
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。