GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三


claude 3的竞技场排名终于来了:

短短3天内,20000张投票,将榜单的流量推向空前。

最终,Claude 3最强的“大杯”模型Opus得分1233,成为第一个能和GPT-4-Turbo一较高下的选手。

“中杯”Sonnet也还不错,和GPT-4的两个旧版本不相上下。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

不过总的来说,还是GPT-4系列占据上风。

Claude 3的表现和宣传有些许出入。如网友总结:

GPT-4还是大模型之王!

但,免费的“中杯”Claude 3(Sonnet)更物超所值。

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

大模型竞技场出炉,“新王”排第三

Claude 3发布时官方的宣传是全面超过了GPT-4,但没提是哪个版本的GPT-4。

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

竞技场榜单(LMSYS Chatbot Arena Leaderboard)的最新更新,帮咱摸清了。

来看详细情况。

排在第一名的是OpenAI去年11月推出的GPT-4 Turbo,也就是:

GPT-4-1106-preview。

它功能更强价格也更便宜,具有128k上下文,训练数据从此前的2025年9月更新到2025年4月。

与它并列第一的是GPT-4 Turbo最新的版本,今年一月发布的:

GPT-4-0125-preview。

它的训练数据更广,扩展到了2025年12月。

两者均取得了1251的分数。

接着才是Claude 3(训练数据截止到2025年8月)。

它的最强版本Opus得分1233,比GPT-4 Turbo低了18分。

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

这个差距相比起来不算太大,毕竟再往下看:

它比GPT-4的两个版本(0314、0613)分别高了48分、72分。

至于中等性能的Claude 3 Sonnet,则排名第6,位于GPT-4这两个版本之间:

Machine Translation Machine Translation

聚合多个来源的AI翻译

Machine Translation 49 查看详情 Machine Translation

不过只比0314版低5分,大有潜力一举超越。

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

所以总的来说,官方宣传的也算没大毛病,全面超越老版GPT-4,但离GPT-4 Turbo还有点距离,尽管不算太大。

——从此榜单的评比机制等情况来看,它的结果还是相当有业内认可度的。

它由“小羊驼”(Vicuna)的作者团队发起。

但裁判官不是“小羊驼”,更不是GPT-4,而是基于人类偏好。

详细来说,也就我们随机向两个匿名模型提出任意问题,然后评价它们各自的回答,把票投给更好的那一个。

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

如果一轮投不出,咱可以选择继续提问。如果聊天中模型不小心透露了自己的身份,投票则作废。

特别的,计分规则采用Elo机制来保证公平(玩王者荣耀的朋友都熟)。

举个例子:如果某个模型输了,但它的分数不一定低,因为它本身实力就弱,这是预料之中。

截止目前,这个榜单可以说是非常火爆,已经有全球73个模型参与挑战,共收到了网友们37万张+投票。

通义千问挤进前10

除了Claude 3,我们再看看其他表现亮眼的选手。

首先要提的就是基于Gemini Pro的Bard,排名第四,仅次于GPT-4Turbo和Claude 3。

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

可以说是有点让人惊喜。

网友戏谑:

谷歌这是生生在在排行榜上开了个“洞”啊。

并连忙艾特JeffDean和DeepMind负责人:喂,加把劲儿啊(旺柴)

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

然后要说的就是阿里通义千问(1.5版本,上个月发布)。

它在本次排名中挤进了前十、并列第九,是国内选手中表现最好的。

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三图片

被它甩在身后的,除了其他国产选手,还有Claude 2、Gemini Pro和GPT-3.5等等。

完整榜单:https://www.php.cn/link/e39505ef839c38f61139ae78da3f7615
参考链接:https://www.php.cn/link/30637ce29549ac951061fd211d43c3b0

王者荣耀相关攻略
王者荣耀星之破晓测试资格获得方法 荣耀Magic6至臻版海报曝光,大胆DECO设计引领潮流 荣耀Magic6至臻版官图曝光,天穹紫与墨岩黑演绎自然之美
荣耀Magic6至臻版官图公布:方寸手机再现壮美山河 荣耀Magic6至臻版提前开启预售!1.5K双孔四曲屏+50Mp主摄 王者荣耀攻略大全
动态范围 15EV,荣耀 Magic6 至臻版 / RSR 保时捷设计号称“主摄全球首发车规级 LOFIC 技术” 荣耀Magic6至臻/RSR保时捷设计版发布在即,全新单反级相机技术引领手机摄影新潮流 荣耀全球首发OV50K:曝华为Mate旗舰也在测试它
荣耀最强影像!荣耀Magic6至臻版/RSR保时捷设计首发车规级LOFIC技术 荣耀Magic6至臻版全球首发!官方科普LOFIC技术 荣耀全新旗舰亮相:搭载单反级相机与车规级LOFIC技术
荣耀Magic6至臻版真机上手:圆角矩形后摄独一无二 辨识度拉满 荣耀Magic6系列首发LOFIC技术:手机摄影的动态范围新篇章 Magic6 RSR 保时捷设计即将亮相!荣耀 2025 春季旗舰新品发布会定档 3 月 18 日
王者荣耀逆境之光机制是什么 境之光机制作用介绍 10倍抗刮耐摔!荣耀Magic6至臻版/保时捷设计搭载荣耀金刚巨犀玻璃 王者荣耀机关百炼什么时候上线
《王者荣耀》s35段位继承表一览 《王者荣耀》碎片商店刷新周期介绍一览 王者荣耀机关百炼攻略
《王者荣耀》逆境之光机制介绍 荣耀 Magic6 至臻版玻璃堪比陶瓷 开启手机 0 贴膜时代 王者荣耀扁鹊无尽旅途皮肤怎么获取 获取攻略
王者荣耀机关百炼上线时间一览 安卓转移到ios王者荣耀怎么转?王者荣耀安卓怎么转IOS 荣耀 Magic6 系列新品将搭载荣耀叠光绿洲护眼屏
3 月发布会大盘点 科技新品齐亮相 小米汽车成最大看点 王者荣耀机关百炼怎么玩 王者荣耀宝箱钥匙链接打不开解决方法

以上就是GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三的详细内容,更多请关注其它相关文章!


# claude 3  # 小羊  # 单反  # 全球首发  # 榜单  # 扁鹊  # 自己的  # 百炼  # 之光  # follow  # claude  # gemini  # 通义千问  # 王者荣耀  # opus  # gpt-4  # 保时捷  # 网站推广技巧有哪些方法  # 虹口区网站建设企业推荐  # 鱼峰网站定制建设  # 飞云网站建设步骤  # 邳州网站优化排名方案  # 湖北智能网站建设方案  # 驻马店网站建设价格  # seo标志是什么车  # 萍乡网站优化推广  # 江苏代做关键词排名  # 老照片 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 世界水下机器人大赛:9国青年携手逐梦深蓝  NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉  AI拉动PCB发展|行业发现  Unity发布Sentis和Muse AI工具,助力创作游戏和3D内容  为什么很多人对纽约《人工智能招聘法》感到生气?  人工智能如何帮助制造业?  《爱康未来之夜嘉宾官宣,携手共赴AI未来》  利用AI技术更好地发展农村电商  乐天派桌面机器人加入小米米家生态系统,实现与其他智能设备的互联  猿辅导发布最新SaaS业务进展公告:Motiff UI设计工具推出三项新的AI功能  谷歌推出新 AI 工具 Imagen Editor,一句话对图片二次创作  智能化解决方案:保障数据安全阻击泄露和丢失  企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的  OpenAI高管:AI能创造新的就业机会 但也会淘汰一些  人工智能在商业中的风险和局限性  新华社联合北大发布AI大模型评测:安全可靠成重点,360智脑表现优异  助力人工智能产业高质量发展 龙岗区算法训练基地正式启用  比尔盖茨:AI确实存在风险,但可控  笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据  图灵奖得主Hinton:我已经老了,如何控制比人类更聪明的AI交给你们了  首届亚太网络法实务大会召开 九位大咖探讨元宇宙与人工智能发展  给小朋友最好的科技礼物:乐天派桌面机器人  斑马推出全新升级版思维机:以人工智能为核心的交互式学习体验  IBM 与 NASA 携手开源地理空间 AI 模型,促进气候科学研究进步  一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了  阿里达摩院发布免费开放100项AI专利许可的动机是什么?  数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门  AI大模型,将为智慧城市带来哪些新变化?  人工智能赋能广西自然资源领域监测监管  AI绘画,还需要懂数学?  北京市元宇宙产业创新中心筹建工作正式启动  人工智能和神经网络有什么联系与区别?  发布最新版本的 PICO OS 5.7.0:支持VR头盔录屏并跨平台分享至微信  人工智能如何与智能家居集成  人工智能赋能无人驾驶:商业化进程再提速  深剖Apple Vision Pro中暗藏的“AI”  “长沙造”无人机,领先的不止植保  AI和ML推动联网设备的增长  参考封面|人工智能“淘金热”  联想首发AI PC于今年秋季,英特尔CEO确认AI PC时代来临  苹果在韩举办首届中小企业智能制造论坛,加速推动工业4.0发展  建立元宇宙产业联盟:移动、咪咕、华为、小米等加入  自研4D激光雷达L1 + GPT大语言模型 宇树Unitree Go2四足机器人有啥黑科技?  元宇宙迈入2.0时代,它和生成式人工智能有何关联吗?  微软面向AI初学者推出免费网络课程  OpenAI大神Karpathy最新分享:为什么OpenAI内部对AI Agents最感兴趣  杀入生成式AI的亚马逊云科技,能否再次生成未来?  AI技术改变*,新骗局来袭,*成功率接近100%  本届人工智能大会上的这个“镇馆之宝”,来自长宁企业西井科技!  移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速 

 2024-03-08

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.