andrej karpathy,openai 创始成员及特斯拉前 ai 高级总监,近日对大型语言模型(llm)的“智能”程度提出了质疑,引发业内热议。他认为,人们对 llm 回答问题的解读过于理想化,将其视为对互联网平均数据标注员的“询问”更为贴切。
Karpathy 指出,LLM 主要通过模仿人工标注数据进行训练。当用户提问(例如,“阿姆斯特丹十大景点”)时,模型实际上是在复现数据标注员曾通过搜索引擎等工具整理出的答案。如果问题不在训练数据集中,模型则会基于预训练阶段(互联网文档语言建模)的知识进行推测。
针对强化学习与人类反馈(RLHF)技术,Karpathy 认为其作用被夸大了。RLHF 并非创造“超越人类”的结果,而是将模型性能从“人工生成”提升到“人工判别”级别。这种提升源于人类对结果的判断更容易于生成结果本身。 LLM 的性能更接近于“人类整体水平”而非个体专家水平,因此所谓的“超人”能力是有限的,真正的“超人”能力需要更高级的强化学习方法,而非 RLHF。
Karpathy 此前已多次批评 RLHF。他以 AlphaGo 为例,指出 RLHF 方法可能导致奖励机制失效,无法实现像 AlphaGo 打败人类世界冠军那样的突破性成果。他认为,LLM 的奖励模型(RM)只是对人类偏好的一种近似,而非解决问题的真正目标。 此外,过度使用 RLHF 还会
导致模型学习到一些在人类看来荒谬但 RM 却认为“很棒”的回应。
神笔马良
神笔马良 - AI让剧本一键成片。
320
查看详情
近期,来自 VRAIN 和剑桥大学的研究也佐证了 Karpathy 的观点,指出 LLM 在一些简单任务上表现不佳,甚至会在复杂任务中给出错误答案却不自知。
尽管 LLM 的参数量和训练数据不断增加,性能也在提升,但其基础机制的可靠性仍值得商榷。 目前,OpenAI 提出的基于规则的奖励(RBR)方法或许能为解决 LLM 的“指令遵循”问题提供新的思路,但 LLM 的“智能”本质仍有待进一步探索。
以上就是Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿的详细内容,更多请关注其它相关文章!
# 一言
# 阿尔山门户网站建设
# 免费网站建设的书
# 淄博网站建设动态
# 小米网站推广方案
# 莘县网站优化售价
# 企业seo优化视频
# 广宗网站建设性价比
# 抖音营销推广的图怎么做
# 营销推广解决企业问题
# 高质量的郑州网站建设
# 剑桥大学
# 理论
# 文档
# 生命科学
# 解决问题
# 不存在
# 多家
# 互联网
# 而非
# 自定义
# ai
# rlhf
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
阿里大文娱CTO郑勇:生成式AI将引发内容行业巨变,*制作机会挑战并存
华为余承东表示:鸿蒙可能拥有强大的人工智能大模型能力
美图设计室2.0使用教程
人工智能产业竞跑“未来赛道” 创新发展放大“赋能”效应
人工智能助力林草行业高质量发展
英国前首相:AI可能被用来制造“生物恐怖武器”
7大探索区域打造沉浸式玩乐“元宇宙” 昆明京东MALL未来科技探索官全城招募中
脑虎科技:奔跑在“脑机接口”最前沿 跨界融合取得阶段性成果
工信部信通院发布《2025大模型和AIGC产业图谱》 360智脑覆盖全产业链
阿里达摩院发布免费开放100项AI专利许可的动机是什么?
科普:什么是AI大模型
IBM 与 NASA 携手开源地理空间 AI 模型,促进气候科学研究进步
两型无人机完成交付!国家级机动观测业务正式启动
国宝级文物“铜兽驮跪坐人顶尊铜像”完成模拟拼接,腾讯AI立功
英媒:硅谷有些人太鼓吹AI,宣扬“学习无用”
WHEE功能介绍
可按用户语气自动回复消息,Zoom 推出基于生成式 AI 的新功能
马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧
找对了风口想不火都难,乐天派机器人,安卓机器人的最终形态?
“一般智力”与工艺学批判是认识AI的重要入口 | 社会科学报
生成式AI爆发,亚马逊云科技持续专注创新,助力企业数字化转型
人工智能框架生态峰会即将召开,聚焦AI大模型技术与科学智能探索!
Win11 AI 助手 Windows Copilot 被吐槽:套皮的 Edge 浏览器
泗洪:畅通城市“血管” ,管下机器人来帮忙
第 66 届格莱美奖规定,AI 作品将无法获得评奖资格
智能技术提高现代商业运营的7七种方式
解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能
传Meta 2025年推出首款AR眼镜,采用军用级别材料,计划生产1000台
AYANEO 安卓掌机 Pocket AIR 配置公布:天玑 1200 + 5.5 英寸屏
微软新出热乎论文:Transformer扩展到10亿token
微盟宣布联合腾讯云共建行业大模型:加快激活AI大模型智能应用
AI大模型产品集体奔赴高考考场,教育赛道的讯飞星火能赢吗?
【澎湃原动力】人工智能产业协同创新中心:全产业链资源在这里汇聚
飒智智能机器人核心技术与应用论坛暨一体化控制器发布会成功举办
人工智能和你聊天 成本有多高
全国青少年无人机大赛重庆市选拔赛开赛 1252名中小学生参加
轻量级的深度学习框架Tinygrad
即时 AI再次升级 30秒生成自带动效的网页 生成速度提升100%
Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲
利用AI技术更好地发展农村电商
实测 AI 建筑设计软件的自动生成效果图能力
旷视入选北京市通用人工智能产业创新伙伴计划
微软bing聊天推出AI购物工具 可进行比价并查看历史最低价
7条线路感受智慧美好生活,“2025 世界人工智能大会民营企业社会开放日”主题活动启动
WHEE安装教程
联想创投携手12家被投企业MWC展示元宇宙、机器人等技术
食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心
【趋势周报】全球元宇宙产业发展趋势:ChatGPT的出现,将元宇宙实现至少提前了10年
周鸿祎:360智脑开放API接口 AI大模型将赋能百行千业
华为推出两款商用 AI 大模型存储新品,支持 1200 万 IOPS 性能
2024-12-01
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。