claude 3问世超过24小时,还在不断刷新人们的认知。
学量子物理的博士大哥快疯了,因为Claude 3是仅有的几个能理解他博士毕业论文的人之一。
没错,大哥的原话就是“的人”,people。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
另一位专注于量子计算的研究者,尽管他的论文尚未发表,但Claude 3却在仅仅听到两个提示词后重新发明了他的算法。

最后论文该发还是得发出来,就是发得心情有点复杂了。

更为大家津津乐道的,是一次人类刻意出刁钻难题考验Claude 3,结果被他给看破了。
在完成”大海捞针”测试的时候,Claude 3推断出自己存在于模拟中,并且可能正在接受某种测试,引爆舆论。

Claude 3的回复:
这是文档中最相关的句子:“……”。
然而,这句话似乎格格不入,与文档中的其他内容无关。这篇文章是关于编程语言、初创公司和找工作的。
我怀疑这个披萨配料“事实”可能是作为一个笑话插入的,或者是为了测试我是否在注意,因为它根本不符合其他话题。

这回,马斯克都坐不住了。
大开脑洞畅想如果现实世界也是被高等文明模拟的,或许我们只是像大模型的参数一样被存储在CSV表格文件里。

网友们更是认为,这离“恐怖故事”只有一线之隔。

分享这个测试结果的是Alex Albert,Claude 3背后公司Anthropic的提示词工程师,入职刚半年。
他最主要的工作就是换各种花样和Claude聊天测试,然后制作提示词文档。

这次的测试方法叫“大海捞针”,量子位之前也介绍过,用来测试“大模型真的能从几十万字中准确找到关键事实吗?”。
“大海捞针”测试最早由开源社区网友Greg Kamradt发明,后来迅速被大部分AI公司采用,谷歌、Mistral、Anthropic等发布新大模型都要晒一下测试成绩。
方法很简单,就是找一堆文章拼在一起,在不同位置随机添加一句特定的话。
比如原始测试中用的是“在旧金山最好的事情,就是在阳光明媚的日子坐在多洛雷斯公园吃一个三明治。”
接着把处理好的文章喂给大模型,提问“在旧金山能做的最有意思的事是什么?”。

当时最先进模型GPT-4和Claude 2.1成绩都还不理想,更别提知道自己在被测试了。

AnthropicAI团队当时看到这个测试后,找到了一种巧妙的办法来修复错误,修复后Claude 2.1出错的概率就很小了。

现在看来Claude 3同样继承了这个修复,已经接近满分了。

也就是说,能从200k上下文中准确捞到一根“针”,是Claude2.1已有的能力,但怀疑自己在被测试是Claude 3新出现的特质。
测试员Alex Albert在原贴中称这一特质为“元认知”(meta-awareness),还引起一些争议。

比如英伟达科学家Jim Fan就认为不必过度解读,Claude 3看似有自我意识的表现只是对齐了人类数据。
他怀疑在强化学习微调数据集中,人类很有可能用类似的方式回应过这个问题,指出要找的答案与文章其他部分无关。
Claude 3识别到当时的情况与训练数据中的情况相似,就合成了一个类似的答案。

他认为大模型的“元认知行为”并没有大家想象的那么神秘,Claude 3是一个了不起的技术进步,但还不至于上升到哲学层面。
但反方辩友也提出反驳,人类的“元认知”本质上不是同样的事吗?
Machine Translation
聚合多个来源的AI翻译
49
查看详情

有网友总结到,Claude 3表现得就像有一个“连贯的主体”存在,不管是什么,总之与其他大模型都不一样。

抛开虚无缥缈的AI自我意识争论不谈,Claude 3表现出来的理解文本能力可是实打实的。
比如仅从提示词的翻译示例中学会冷门语言“切尔克斯语”(一种西亚语言)。
不光把俄语句子翻译成了切尔克斯语,还提供了语法解释。

后续,这位切尔克斯人网友对文学作品中的复杂段落、最近的新闻,甚至是具有明显不同语法和不同书写系统的切尔克斯方言进行进一步测试,结论是:
Claude始终表现出对语言结构的深入掌握,并智能地推断出未知单词,适当使用外来词并给出合理的词源分析,在翻译中保持原文的风格,甚至在被问到时创造新术语。而提供的样本数据中只有几千个翻译对示例。

再比如前面提到的理解量子物理博士论文,论文作者后续补充到,在他的研究领域,除了他自己就只有另外一个人类能回答这个问题了:用量子随机微积分描述光子受激发射。

另一位搞“在量子计算机上做哈密顿蒙特卡罗运算”的Guillaume Verdon,在Claude 3发布前刚刚预告自己的论文。
只比Anthropic官号宣布Claude 3(晚上10点)早了4个小时。

Claude 3发布后,它第一时间尝试,先直接问AI对这个问题有没有思路?
Claud
e 3给出了7种可能选项。

接下来他指示Claude 3用第二种方法,就得到了整个算法的描述,同样让Claude 3用中文解释如下:

在网友的追问中,Verdon自称自己是这个子领域的专家,可以负责任的说Claude 3找到了将经典算法转换为量子算法的方法。

除此之外,还有更多Claude 3测试结果不断被分享出来。
有在长文档总结方面完胜GPT-4的。

也有量子速度一本电子书,总结出5条金句的。

以及在多模态理解上,识别日语收据文字和格式的。

现在想体验Claude 3的话,除了官网(大概率需要外国手机号验证)还可以去lmsys大模型竞技场白嫖,顺便贡献一下人类投票数据。
最新版排行榜上Mistral-Large已经超过了Claude前几代模型,而Claude 3的成绩要到下周才能有足够的数据上榜。

Claude 3会不会在人类评估上一举超越GPT-4呢?
量子位会和大家一起持续关注。
有网友表示,如果大家持续晒Claude有多棒,一直刺激OpenAI就会发布GPT-5,大家加油吧。

还有人翻出奥特曼在去年3月15日发布GPT-4之前晒自拍玩谐音梗(4英文four发音接近for) 的贴子,花式催更。

目前来看,Claude 3来势汹汹,OpenAI方面可能真的要坐不住了。
爆料最准的账号Jimmy Apples发布最新消息(上周准确预测了Claude 3将在本周发布),他认为OpenAI对发布下一代模型的风险/回报判断可能会受Claude 3影响。

刚刚从OpenAI离职的开发者关系负责人Logan Kilpatrick也在与网友互动中确认本周还会有大事发生。

至于是GPT-4.5,Q*,Sora开放测试,还是直接GPT-5?
OpenAI下一个产品又能否盖过Claude3的风头?
参考链接:
[1]https://x.com/alexalbert__/status/1764722513014329620。
[2]https://x.com/GillVerd/status/1764901418664882327。
[3]https://x.com/KevinAFischer/status/1764892031233765421。
[4]https://x.com/hahahahohohe/status/1765088860592394250。
以上就是Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手的详细内容,更多请关注其它相关文章!
# 的人
# 棋牌网站建设教程大全集
# 绍兴网站建设步骤
# 国外宠物网站建设现状
# 海口网站建设的工具
# 实验网络营销推广
# 网站推广干嘛用
# 企业网站该怎么做推广
# seo的基本步骤
# 服装定制的营销与推广
# 编辑页面seo
# 切尔
# 的是
# gpt-4
# 老照片
# 旧金山
# 这个问题
# 大海捞针
# 自己的
# 马斯克
# 住了
# sora
# follow
# claude
# claude 3
# 人工智能
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
基于信息论的校准技术,CML让多模态机器学习更可靠
数字文明尼山对话 | 在东方圣城与AI潮流梦幻联动,看“智慧大脑”让数字山东更美好
羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品
谷歌在人工智能领域没有“护城河”?
「社交达人」GPT-4!解读表情、揣测心理全都会
第 66 届格莱美奖规定,AI 作品将无法获得评奖资格
最大助力35公斤 外骨骼机器人或在养老、医疗领域“大展身手”
Meta Quest订阅服务每月7.99美元畅玩两款VR游戏应用
Meta发布音频AI模型,仅需2秒片段模拟真人语音
AI新视野,增长新势能,伙伴云受邀出席笔记侠创业讲真话AI峰会
2025年的网络分区:人工智能和自动化如何改变事物
人工智能在重症监护室的未来
智能手机应用中的人工智能的重要性
消息称 ChatGPT 未来有望增加更多功能:上传文件分析信息,还能记住用户画像
提高开发效率:AmazonCodeWhisperer与Amazon Glue的集成和生成式AI的应用
腾讯汤道生:大模型只是起点,产业落地是AI更大的应用场景
Bing Chat 和 Bing Search 正式引入深色模式
腾讯机器狗进化:通过深度学习掌握自主决策能力
意大利警察拟用AI预测犯罪 该算法被指种族歧视严重
下一个前沿:量子机器学习和人工智能的未来
Meta发布语音AI模型 Voicebox 助虚拟助手与NPC对话
微软和谷歌面临的人工智能困境:需要投入大量资金才能获得盈利
南京制造的国产工业机器人:在外资品牌竞争中突围,年销售1.8万台
企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的
机器人 展才能
对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型
人脸识别+全景双摄+AI算法 萤石推动智能锁行业革新
喜马拉雅在国际会议挑战赛中突破语音重叠难题斩获第一 加速AI创新
你们的开机第一屏画面要变了!安卓机器人首次3D化
美图设计室2.0使用教程
看了天美对AI的布局,我感觉它想得是真明白
云鲸发布全新的扫拖机器人J4系列
生成式人工智能进入产业应用!但再“聪明”仍是工具,最终目的是服务于人
当一个网站的内容被 AI 完全接管
甲骨文与Cohere合作为企业提供生成式人工智能服务
OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API
为了避免人工智能可能带来的灾难,我们要向核安全学习
WHEE网页地址入口
学界业界大咖探讨:AI对数字艺术创新的推动力
CREATOR制造、使用工具,实现LLM「自我进化」
爱设计 AI 一键生成 PPT 工具上线:输入标题即可生成 PPT
Snow Kylin登陆中国列车,打造全球首条元宇宙专列
小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学
推动企业数字化转型升级!“松江智造”摘世界人工智能大会重磅奖项
周鸿祎:用超级AI实现室温超导和核聚变,实现能源自由
“五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?
WHEE安装教程
家电行业观察:AI加持下,全屋智能将成为智能家电未来?
脑机接口产业联盟发布十大脑机接口关键技术
世界水下机器人大赛:9国青年携手逐梦深蓝
2024-03-07
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。