快科技6月3日消息,近日,斯坦福AI团队(dui)被曝出了(le)抄袭事(shi)件,而且(qie)抄袭的还是中国国产的大模型成(cheng)果,模型结构和代码,几乎一模一样。
斯坦福的Llama3-V项目在(zai)5月29日发布,宣称仅需500美元就(jiu)能训练出一个性能超越GPT-4V、Gemini Ultra、Claude Opus等的多模态大模型。
然而,一位(wei)网(wang)友发现,Llama3-V的模型结构和代码与出自清华系明星创业公司面(mian)壁智能的MiniCPM-Llama3-V 2.5几乎一模一样,只是变量名有所变化。
面(mian)对抄袭的指控,斯坦福团队(dui)选择了(le)删库跑路,目前(qian)在(zai)GitHub和HuggingFace上的相关项目均显示(shi)404,无法访问。
面(mian)壁智能的MiniCPM-Llama3-V 2.5项目具有独特的功能,如识(shi)别清华简——一种罕见的中国古代文字(zi)。
Llama3-V在(zai)未公开的实验性特征上与MiniCPM-Llama3-V 2.5表(biao)现出高度相似的行为,这(zhe)些特征是根据MiniCPM-Llama3-V 2.5团队(dui)内部数据训练的。
面(mian)对抄袭的质疑,斯坦福团队(dui)最初辩称,他们的工作早于面(mian)壁智能的MiniCPM,只是使用了(le)他们的tokenizer。
然而,随后他们在(zai)Medium上的声明被删除,且(qie)最新的回应(ying)也被撤回。
面(mian)壁智能CEO李大海对此事(shi)件做出了(le)正式回应(ying),要求Llama3-V作者对这(zhe)个问题给出一个正式的解释,目前(qian),此事(shi)仍在(zai)持续发酵中。
【本文结束】如需转载请务必注明出处:快科技