业界动态
科工力量:斯坦福AI团队抄袭中国大模型?背后还有更值得关注的信息,Llama,企业,事件
2024-06-19 00:58:34
科工力量:斯坦福AI团队抄袭中国大模型?背后还有更值得关注的信息,Llama,企业,事件

【文/观察(cha)者网专栏作者 科工力量(liang)】

斯坦福团队抄袭中(zhong)国(guo)开(kai)源大模型,事(shi)件曝光后连夜删库跑路。

对这条新闻,恐(kong)怕不少人第一反应和科工力量(liang)一样,有种(zhong)一吐胸中(zhong)郁闷的感受。此前很长一段时间,从美(mei)国(guo)朝野锁死中(zhong)国(guo)AI研究能力的叫嚣,到中(zhong)文网络上对国(guo)产大模型怪话连篇的调侃,让很多人对中(zhong)国(guo)AI产业的发(fa)展倍感焦虑,而通过(guo)这次(ci)事(shi)件,这样的焦虑恐(kong)怕可以得到相当程(cheng)度(du)的纾解。

经过(guo)近两(liang)天的发(fa)酵,这起事(shi)件本身毫无疑问已经“实锤”,不仅Llama3-V团队发(fa)布道歉声明(ming),作为被抄袭方的面壁智(zhi)能,也由CEO李(li)大海透露了核查结(jie)果,Llama3-V和MiniCPM-Llama3-V-2.5这两(liang)个模型即(ji)便在高(gao)斯扰动验证后,在正确和错误表现方面都高(gao)度(du)相似。

两(liang)个模型的代码对比

不过(guo)继续挖掘信(xin)息(xi)的话可以发(fa)现,其实所谓的斯坦福团队只是两(liang)个印度(du)裔(yi)本科生自己攒的局,闯祸后,他们还第一时间把锅甩给了实际干活的枪手(shou),声称自己是被阿拉伯裔(yi)码农描绘的多模态架构忽悠了,他们实际只是在社交(jiao)媒体平台帮着后者宣传推广。

而扛下了所有的码农“枪手(shou)”Mustafa Aljadery,也是个妙人,根据(ju)其网上简历,目前同时写(xie)了三份全职工作,除了两(liang)个自己注册的小微企(qi)业,还包括量(liang)化投资大厂Citadel“即(ji)将入职的暑期实习生”。

总之,这个“斯坦福团队”里的卧龙凤雏,倒是让人见识到了美(mei)国(guo)科技产业最底层(ceng)的一个微观切片,相互忽悠攒项目、海投注水论文“抽奖”、绞劲脑汁(zhi)包装履(lu)历,湾区大学生的求职“内卷”也着实不容易。

斯坦福的作者在中(zhong)午做出了最新回应,但现在这条回应已删除 图源:网友(you)截图

Aljadery之所以抄上MiniCPM-Llama3-V-2.5,很可能是因为这个模型前一段时间在HuggingFace趋势(shi)榜上连续霸榜,性能表现非常亮眼,OpenCompass性能基(ji)准榜单上平均得分65.1,甚至(zhi)超过(guo)了GPT-4V、Gemini Pro 这些主流(liu)商用模型,而开(kai)发(fa)者在美(mei)国(guo)似乎又没有什么关注度(du),所以他们认(ren)为抄过(guo)来交(jiao)差应该(gai)没什么风险。但这次(ci)东(dong)窗事(shi)发(fa)之后,几(ji)个年轻人恐(kong)怕都会面临“偷鸡不成蚀把米”的后果。

斯坦福人工智(zhi)能实验室主任Christopher Manning发(fa)文谴责抄袭行为,他认(ren)为团队在事(shi)发(fa)后避重就(jiu)轻,并(bing)对MiniCPM 这一中(zhong)国(guo)开(kai)源模型表示赞扬。

在科工力量(liang)看来,这次(ci)事(shi)件背后,还有着更值得关注和探(tan)讨的信(xin)息(xi)。

自从ChatGPT亮相以来,有关国(guo)内AI产业发(fa)展的讨论中(zhong),已逐渐形成了所谓的技术派和市场派分野,前者以入局企(qi)业为代表,往往用“相当于GPT-x.x”来衡量(liang)技术能力,力求追上乃至(zhi)反超美(mei)国(guo)巨头,而后一派则以PE/VC投资人为代表,认(ren)为OpenAI等(deng)企(qi)业连续不断的突破已经说明(ming),国(guo)内没有可能也没有必要继续在基(ji)础大模型上苦苦追赶,应该(gai)利用开(kai)源大模型成果,聚焦于挖掘场景应用价值。基(ji)于这样的认(ren)识,甚至(zhi)有人喊出了“不会投场上任何一家中(zhong)国(guo)大模型公司(si)”。

在过(guo)去一两(liang)年内,这样的争论或许是各有理据(ju)的,不过(guo)今天的中(zhong)国(guo)毕竟不同于技工贸和贸工技只能二选(xuan)一的年代了,我们所拥有的基(ji)础和资源,已经足以支撑“成年人不做选(xuan)择”。

所以我们会看到,一方面,技术派的突破在2024年已经有加速(su)态势(shi),像月之暗面Kimi、幻方DeepSeek这些产品,近期在美(mei)国(guo)业界引发(fa)广泛关注;而另一方面,就(jiu)像这次(ci)事(shi)件所展现的,国(guo)内基(ji)于开(kai)源大模型的派生模型开(kai)发(fa)水平也越来越高(gao),像MiniCPM-Llama3-V 2.5是基(ji)于SigLip-400M和Llama3–8B-Instruct构建,而开(kai)发(fa)者面壁智(zhi)能最新发(fa)布的开(kai)源大模型Eurux-8x22B,则是基(ji)于Mixtral-8x22B,号称早于Llama3、比肩Llama3、推理超越Llama3,刷新开(kai)源大模型推理性能SOTA。

月之暗面Kimi与幻方DeepSeek的平台界面

这些进展当然(ran)令人欣(xin)喜,不过(guo)无论技术派还是市场派,未来要走的路还很长。比如,国(guo)内基(ji)础大模型开(kai)发(fa)者在实现GPT-4o乃至(zhi)未来GPT-5的技术能力后,如何培育开(kai)发(fa)工具链(lian)和应用生态,仍将是一大挑战;而对于聚焦场景与领域应用落地的企(qi)业,则有必要回答这样一个追问:开(kai)源大模型是否永(yong)远是免费的午餐?

诚然(ran),目前开(kai)源大模型社区,尚未受到地缘因素的明(ming)显干扰,但即(ji)便没有人兴(xing)风作浪“拖后腿”,长期安(an)于使用别(bie)人的基(ji)础模型成果,也意味着将制高(gao)点拱手(shou)让给他人。

更值得注意的是,在开(kai)源大模型原始创新上,欧洲、特别(bie)是法国(guo)正占据(ju)不容忽视的地位,AI大模型的美(mei)中(zhong)法“三国(guo)杀”格局已隐约(yue)可见。

具体来看,上文提到的Mixtral-8x22B,就(jiu)来自于法国(guo)初创企(qi)业Mistral AI;至(zhi)于Llama系(xi)列,尽管名义上是美(mei)国(guo)巨头Meta的产品,但其开(kai)发(fa)团队则主要位于法国(guo),相关人才和知识自然(ran)也主要在法国(guo)流(liu)动。

在斯坦福大学编制的《AI指(zhi)数(shu)报告2024》中(zhong),主要机(ji)器学习模型的“原产地”排名上,美(mei)、中(zhong)、欧盟(meng)已分别(bie)占据(ju)前三排名

可资参照的是,在斯坦福大学编制的《AI指(zhi)数(shu)报告2024》中(zhong),主要机(ji)器学习模型的“原产地”排名上,美(mei)、中(zhong)、法已分别(bie)占据(ju)前三排名;欧盟(meng)加英国(guo)合计,更是已超越中(zhong)国(guo)。

这样的格局中(zhong),蕴含着不言自明(ming)的威胁性,如果国(guo)内AI产业界继续对开(kai)源基(ji)础模型秉(bing)持“拿来主义”,长此以往则可能进一步增强欧洲在产业竞争中(zhong)的主动性,毕竟在基(ji)础模型之外,欧洲获得高(gao)端算力的便利性也远强于国(guo)内。

总体而言,以这一事(shi)件为标(biao)志,随着中(zhong)国(guo)AI大模型产业的迅速(su)成长,其对美(mei)国(guo)产业生态的“反作用力”也会越来越频繁(fan)而显著,能否在多边博弈中(zhong)稳中(zhong)求进,离不开(kai)每一个产业人的共同努力。

本文系(xi)观察(cha)者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授(shou)权,不得转(zhuan)载,否则将追究法律责任。关注观察(cha)者网微信(xin)guanchacn,每日阅读趣味文章。

发(fa)布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7