快科(ke)技(ji)6月3日消息,近日,斯坦福(fu)AI团队被曝出了抄袭事件,而且抄袭的还是中国(guo)国(guo)产的大(da)模型成果,模型结构和代码,几乎(hu)一模一样。
斯坦福(fu)的Llama3-V项目(mu)在5月29日发布,宣称仅需500美元就能(neng)训练出一个性能(neng)超越GPT-4V、Gemini Ultra、Claude Opus等的多模态大(da)模型。
然而,一位网友发现,Llama3-V的模型结构和代码与出自清华系明星创业公司面壁智(zhi)能(neng)的MiniCPM-Llama3-V 2.5几乎(hu)一模一样,只是变量名有所变化。
面对抄袭的指控,斯坦福(fu)团队选(xuan)择(ze)了删库跑路,目(mu)前在GitHub和HuggingFace上的相(xiang)关项目(mu)均显示404,无法访问(wen)。
面壁智(zhi)能(neng)的MiniCPM-Llama3-V 2.5项目(mu)具有独特的功(gong)能(neng),如识(shi)别(bie)清华简——一种罕见的中国(guo)古代文字。
Llama3-V在未公开的实验性特征上与MiniCPM-Llama3-V 2.5表现出高度相(xiang)似的行为,这些特征是根据(ju)MiniCPM-Llama3-V 2.5团队内部数据(ju)训练的。
面对抄袭的质疑,斯坦福(fu)团队最初辩称,他们的工作(zuo)早于面壁智(zhi)能(neng)的MiniCPM,只是使(shi)用了他们的tokenizer。
然而,随(sui)后他们在Medium上的声明被删除,且最新的回应也(ye)被撤(che)回。
面壁智(zhi)能(neng)CEO李大(da)海对此事件做(zuo)出了正(zheng)式回应,要求Llama3-V作(zuo)者对这个问(wen)题给出一个正(zheng)式的解释,目(mu)前,此事仍在持续发酵中。
【本文结束】如需转载请务必注明出处:快科(ke)技(ji)