斯坦福团队抄袭清华系大模型事件后续来了——
Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。
最新致歉推文,由Siddharth Sharma(悉达多)和Aksh Garg(阿克什)发出。
不在其中、来自南加利福尼亚大学的Mustafa Aljadery(简称老穆)被指是主要过错方,并且自昨天起人就失踪了:
我们希望由老穆首发声明,但自昨天以来一直无法联系到他。
悉达多、我(阿克什)和老穆一起发布了Llama3-V,老穆为该项目编写了代码。
悉达多和我的角色是帮助他在Medium和Twitter上推广这个模型。我询查了最近的论文以验证工作的创新性,但我们没有被告知和发现面墙智能先前的工作。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
被指跑路的老穆本人,X主页目前已经开启保护锁定状态,申请才能关注:

整体来看,这条致歉推文和昨天那条发出后又急忙删掉的推文内容大差不差,主要是突出了道歉和进一步甩锅。
毕竟连斯坦福人工智能实验室主任Christopher Manning都下场开喷:
这是典型的不承认自己错误!
他认为团队在事发后避重就轻,用“架构相似”、“MiniCPM比我们更快实现”的借口推脱,拒不承认是抄袭。

但全新道歉声明,并没有止住网友们的质疑。并且最新爆料还指出,这几位老哥根本就是抄袭惯犯,之前写的教材也是一整个大抄特抄。


而原作者团队面壁智能这边,除CEO李大海昨天回应“也是一种受到国际团队认可的方式”外,首席科学家刘知远也已在知乎出面“亲自答”:
已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳。
人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。我们这次开源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。他们在受到质疑后已在Huggingface删库,该团队三人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉。
还是先来简单回顾一下这个大瓜。
一句话总结就是,有网友发现,最近在开源社区大火的斯坦福团队多模态大模型Llama3-V,架构和代码与国产MiniCPM-Llama3-V 2.5几乎一毛一样,并列举了诸多证据直指Llama3-V抄袭。
随着事件逐渐发酵,斯坦福AI团队删库跑路,面壁智能团队也就此事展开了调查。
面壁智能首席科学家、清华大学长聘副教授刘知远给出的判断Llama3-V是MiniCPM-Llama3-V 2.5套壳的一大理由,正是对于清华简的识别能力。
这是MiniCPM-Llama3-V 2.5的“彩蛋”能力,是他们用了从清华简逐字扫描并标注的数据集训练的,并未公开。而Llama3-V的表现和MiniCPM-Llama3-V 2.5一模一样,不仅做对的题一样,出错的地方都一样。
今天,在第一波证据的基础之上,又有其他网友扒出了新线索。
有人研究后发现,Llama3-V几乎每一层的权重差值都符合均值为0、标准差为1.4e-3的高斯分布。

于是推测,Llama3-V只是直接在MiniCPM的权重上添加了低方差噪声。

除此之外,那个跑路的大兄弟老穆还被曝之前写了本关于“计算机网络设计”的书,也是抄的。

从书中随便抽出一章,用抄袭检测器检测一下就是一堆红点:



以及,这本书的作者栏里,据网友爆料也有悉达多的名字。
也有网友认为抄书这事儿是不是真的还有待考究。不过,现在这本书也404了。


说回这次的抄袭,悉达多和阿克什的致歉声明中也有提到他们之所以和穆哥一起宣传这个项目,最初也是被这个多模态模型惊艳到了,特别喜欢穆哥所描述的基于Idefics、SigLip和UHD的架构扩展。
灵感PPT
AI灵感PPT - 免费一键PPT生成工具
308
查看详情

但实际上网友一早扒出Llama3-V在空间模式等很多方面的具体实现都和LLaVA-UHD不同,却跟MiniCPM-Llama3-V 2.5出奇一致。
根据MiniCPM-Llama3-V 2.5主页介绍,MiniCPM-Llama3-V 2.5是面壁智能MiniCPM-V系列的最新开源模型,基于SigLip-400M和Llama3-8B-Instruct构建,总共8B参数。
从性能上讲,MiniCPM-Llama3-V 2.5在OpenCompass上取得了65.1的平均分,性能超过如GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max等专有模型,且显著超越其他基于Llama 3的多模态语言模型。

此外,MiniCPM-Llama3-V 2.5的OCR能力也很强,在OCRBench上得分700+,超越GPT-4o、GPT-4V-0409、Qwen-VL-Max和Gemini Pro。

基于最新的RLAIF-V方法,MiniCPM-Llama3-V 2.5在Object HalBench上的幻觉率为10.3%,也低于GPT-4V-1106的13.6%。
尽管甩锅甩得飞快,但网友们很快又从阿克什和悉达多童鞋的道歉声明里发现了华点:
合着你俩啥也没干,帮着搞搞推广就算项目作者啦?
宣发的时候说是你们仨的项目,出事了就把锅全甩给一个人?

如果是老穆一个人写了所有代码,那你俩是干啥的,就发发帖吗?

还有网友挑起了一个更关键的话题,进一步引发热议——
开源社区是否忽视了来自中国的大模型成果?
谷歌DeepMind研究员、ViT作者Lucas Beyer就提到,Llama3-V是抄的,但成本低于500美元,效果却能直追Gemini、GPT-4的开源模型确实存在:
但相比于Llama3-V,MiniCPM得到的关注要少得多,包括我自己也有所忽略。
主要原因似乎是这样的模型出自中国实验室,而非常春藤盟校。

抱抱脸平台和社区负责人Omar Sanseviero说的更加直接:
社区一直在忽视中国机器学习生态系统的工作。他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情。
包括Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、InternLM、OpenBMB、Skywork、ChatTTS、Ernie、HunyunDiT等等。

对此,不少网友表示赞同,“他们推出了目前最好的开源VLM”。

从更客观的大模型竞技场的角度看,此言不虚。
在模型一对一PK的视觉大模型竞技场中,来自零一万物的Yi-VL-Plus排名第五,超过了谷歌的Gemini Pro Vision。智谱AI和清华合作的CogVLM也跻身前十。

此外,DeepSeek、通义千问和这次遭到抄袭的MiniCPM系列多模态模型,也都有不错的表现。

在更受到广泛认可的LMSYS Chatbot Arena Leaderboard竞技场榜单中,来自中国的大模型也同样在不断刷新“最强开源”的新纪录。

正如刘知远老师所说:
从横向来看,我们显然仍与国际顶尖工作如Sora和GPT-4o有显著差距;同时,从纵向来看,我们已经从十几年前的nobody,快速成长为人工智能科技创新的关键推动者。
此瓜甚巨,吃瓜者众,或许更重要的是,一些成见正在破壁。你觉得呢?
MiniCPM原论文https://arxiv.org/abs/2404.06395
以上就是套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型的详细内容,更多请关注其它相关文章!
# ai
# 模型
# 中国
# 开源
# 斯坦福
# qwen
# claude
# gemini
# chattts
# openbmb
# 通义千问
# deepseek
# 智能科技
# 昆明网站排名seo
# 高端网站推广价格
# 营销推广策划公司怎么做
# 关键词排名怎么看
# 长阳企业智能营销推广公司
# 整站营销推广价钱
# 关键词seo排名就选火星下拉
# 鱼洞网站推广营销
# 钟山推广营销
# 定西网页设计与网站建设
# 昨天
# 多模
# 这是
# 阿克
# 写了
# 也有
# 清华
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
这效果能打几分?AI真人化《名侦探柯南》
「从未被制造出的最重要机器」,艾伦·图灵及图灵机那些事
看似低调,实则稳健:字节在AI路上会遇到什么?
美图公司:Wink国内首发AI画面拓展功能
360发布AI数字人广场,可同孙悟空、爱因斯坦等古今中外角色对话
从谷歌到亚马逊,科技巨头们的AI痴迷
焊接协作机器人或将成为26届埃森展最大看点
马斯克称人类是半机器人,记忆外包给了电脑
杀入生成式AI的亚马逊云科技,能否再次生成未来?
人工智能产业协同创新中心:全产业链资源在这里汇聚
关于开展“与AI共创未来”——2025年全国青少年人工智能创新实践活动的通知
1000万张照片训练AI模型 科学家找到水下定位新方法
食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心
人工智能在项目管理中的作用
先进技术在防止全球数据丢失方面的作用
本届人工智能大会上的这个“镇馆之宝”,来自长宁企业西井科技!
机器人 展才能
人工智能如何改变未来语言?
华为昇腾AI原生支持30多种基础大模型,包括GPT
构建AI绘画网站的方法:使用API接口和调用步骤
前特斯拉总监、OpenAI大牛Karpathy:我被自动驾驶分了心,AI智能体才是未来!
不止“文心一言”,消息称百度将推出全新 AI 对话软件“万话”
禁止艺术家使用 AI 创作《龙与地下城》游戏插图的决定已在 D&D Beyond 生效
航拍无人机怎么选?大疆无人机盘点推荐
谷歌推出 SAIF 框架,倡导安全环境下探索和发展人工智能
北京市通用人工智能产业创新伙伴计划名单公布,京东科技入选“算力伙伴”
中美陷入囚徒困境,人工智能变得不可控?可参考核不扩散条约规范
百亿量化私募:量化投资进入“精耕细作”时代 AI带来行业新变革
石头扫拖机器人 G20 618 福利来袭:4999 元,超值配件领到手软
基于信息论的校准技术,CML让多模态机器学习更可靠
马斯克回应“人工智能让一切变得更好”:我们已经是半机器人了
找对了风口想不火都难,乐天派机器人,安卓机器人的最终形态?
AMD在AI方面奋起直追,与英伟达的差距缩小了吗?
用AI技术点亮老照片:Deep Nostalgia带给照片新生动感
一文读懂自动驾驶的激光雷达与视觉融合感知
跟着AI大热的“光模块”到底是什么?
CREATOR制造、使用工具,实现LLM「自我进化」
AI智能室内效果图设计软件效果,确实惊到我了!
Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲
用人工智能技术,亚马逊为用户生成产品评论摘要,帮助他们轻松选购
朱民:普通人炒股炒不过机器人是很正常的 AI已经能理解市场情绪
首届亚太网络法实务大会召开 九位大咖探讨元宇宙与人工智能发展
微软更新服务协议,以防止通过AI服务进行逆向工程和数据抓取
了解 AGI:智能的未来?
全场景智能车:智能无处不在|芯驰亮相世界人工智能大会
刊·见 | 捕捉人工智能领域最新动态?收藏Applied Artificial Intelligence
XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏”
机智云AI离线语音识别模组,让家电变得更加智能便捷
GPT-4不能在麻省理工学院获得计算机科学学位
阿里云连续两年进入Gartner云AI开发者“挑战者象限”
2024-06-04
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。