YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世


yolov12:兼顾速度与精度的新一代实时目标检测器

AIxiv专栏持续报道全球顶尖AI研究成果。本文介绍由纽约州立大学布法罗分校和中国科学院大学的研究人员合作完成的最新研究——YOLOv12,该模型在保持实时性的前提下,显著提升了目标检测精度。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

YOLOv12架构图

YOLO系列模型一直以其速度著称,但以往版本对Transformer中高效的注意力机制应用有限,主要原因是注意力机制的高计算复杂度难以满足实时性要求。YOLOv12突破了这一瓶颈,在性能上取得了显著提升。

YOLOv12性能图

论文链接:https://www.php.cn/link/cea82cba7b2d06851ba0448f43b1fdc1 代码链接:https://www.php.cn/link/409072cb60e202d2797a91e395909240

核心改进

YOLOv12的核心改进在于引入了高效的区域注意力模块(Area Attention, A2)和残差高效层聚合网络(R-ELAN),并对传统注意力机制架构进行了优化。

A2模块通过简单的特征图划分,有效降低了注意力机制的计算复杂度,提升了计算速度,同时保持了较大的感受野。

R-ELAN则在原始ELAN的基础上,加入了残差连接和缩放技术,优化了梯度流动,并重新设计了特征聚合方法,提高了模型的优化效率。

此外,YOLOv12还采用了FlashAttention解决内存访问问题,移除位置编码以简化模型,并调整了MLP ratio,减少了堆叠块的深度,从而提升整体效率。

Area Attention模块示意图

MedPeer科研绘图 MedPeer科研绘图

生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新

MedPeer科研绘图 166 查看详情 MedPeer科研绘图

实验结果

在COCO数据集上的实验结果显示,YOLOv12在不同规模的模型(N、S、M、L、X)上均取得了优于现有YOLO系列模型和RT-DETR的性能,同时保持了极高的推理速度。 YOLOv12在参数量和CPU推理速度方面也实现了显著突破,在精度-参数量平衡方面表现出色。

R-ELAN模块示意图

YOLOv12与其他模型的性能对比

YOLOv12热力图

YOLOv12参数量/CPU速度-精度的trade-offs比较

结论

YOLOv12通过巧妙地结合注意力机制和高效的网络结构设计,在实时目标检测领域取得了显著进展,为未来实时目标检测器的研究提供了新的方向。

以上就是YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世的详细内容,更多请关注其它相关文章!


# 基础上  # 江苏seo教程方法  # 惠阳网站建设在哪做  # 淘宝联盟网站推广如何找pid  # 漳州定制网站建设  # 鄱阳网站优化  # 企业网站建设方案价位  # 永济网站关键词优化  # 烟台运营推广网站官网  # 余姚网站优化推广  # dz如何完善seo  # 纽约  # 产业  # 为核心  # 这一  # 祝福语  # 中国科学院  # 内测  # 首个  # 取得了  # 一言  # ai  # git  # yolov12 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: Unity发布Sentis和Muse AI工具,助力创作游戏和3D内容  苹果在韩举办首届中小企业智能制造论坛,加速推动工业4.0发展  AI进军债券交易,BondGPT来了!  外科医生的智能助手,“机器人手术”得到补充商业医保覆盖  从谷歌到亚马逊,科技巨头们的AI痴迷  ChatGPT大更新!OpenAI奉上程序员大礼包:API新增杀手级能力还降价,新模型、四倍上下文都来了  令人惊叹!AI模型能够以iPhone照片为基础创作诗歌  国内通用人形机器人将发布、产业加速突破  苹果推出全新沉浸式 AR 体验应用“Deep Field”  会模仿笔迹的AI,为你创造专属字体  马斯克反讽人工智能AI炒作:“机器学习”本质就是统计  V社回应拒绝上架含 AI 生成内容的游戏:审核政策正在调整中  OpenAI CEO 阿尔特曼到访日本,对全球 AI 协调合作表示乐观  消息称 Meta Quest 将推 VR 游戏订阅:每月 7.99 美元,任选两款  AI框架生态峰会本周开幕 华为昇腾“朋友圈”再聚首 全球首个全模态大模型将登场  专家解读国家网信办深度合成服务算法备案信息公告:不等于百度、阿里、腾讯等生成式AI产品获批  昆仑万维与全球领先的元宇宙公司Meta达成商务合作,共同认可昆仑万维在XR领域的技术实力  IBM 与 NASA 携手开源地理空间 AI 模型,促进气候科学研究进步  人工智能赋能无人驾驶:商业化进程再提速  站在社会的高度理解人工智能  复盘MWC上海:AI大模型时代到来 通信网络将会怎样改变?  VR健身应用《FitXR》将取消Quest 1端会员服务  Midjourney 5.2震撼发布!原画生成3D场景,无限缩放无垠宇宙  即时 AI再次升级 30秒生成自带动效的网页 生成速度提升100%  腾讯机器狗进化:通过深度学习掌握自主决策能力  改变城市交通:智慧城市中的智能交通  Bing Chat 和 Bing Search 正式引入深色模式  “聚智启新,‘蓉’力同行” 成都市人工智能产业融通对接会成功举办  看懂AI,找到增长新势能 | 笔记侠AI峰会等你来  AI新视野,增长新势能,伙伴云受邀出席笔记侠创业讲真话AI峰会  人工智能加速走进百姓生活:从2025全球人工智能技术大会看行业新趋势  探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网  【原创】奥比中光:与英伟达合作开发的3D开发套件正式发布 连接英伟达AI应用生态  马斯克讽刺人工智能炒作:什么“机器学习”,其实就是统计  放弃自动驾驶,也是一种和解  微软推出人工智能模型 CoDi,可互动和生成多模态内容  猿编程参加人工智能高峰论坛,推动人工智能教育解决方案在千所学校推行  可按用户语气自动回复消息,Zoom 推出基于生成式 AI 的新功能  马斯克发推讽刺人工智能:机器学习的本质就是统计  构建人机交互创新模式,微美全息研究AIGC智能交互界面生成技术  联想首发AI PC于今年秋季,英特尔CEO确认AI PC时代来临  元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者  独家视角:首次展示有人与无人协同打击的7000米高空察打一体无人机  OpenAI宣布组建新团队 以控制“超级智能”人工智能  闪电快讯|京东推出言犀AI大模型 面向零售、医疗、物流等产业场景  一文看懂基础模型的定义和工作原理  插画师对AI绘画软件的态度是怎样的?  AI智能室内效果图设计软件效果,确实惊到我了!  大型无人机FH-98国内首次夜航转场成功  无人机自主巡检为高海拔输电线路运维添“新彩” 

 2025-02-22

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.