AI模型抄袭中国？背后有更值得关注的信息,Llama,团队,企业20240619-业界动态-szhfh.com

AI模型抄袭中国？背后有更值得关注的信息,Llama,团队,企业

2024-06-19 01:47:15

AI模型抄袭中国？背后有更值得关注的信息,Llama,团队,企业

斯坦福团队(dui)抄袭中国开源大(da)模型(xing)，事件曝光后连夜删库跑路。

对这条(tiao)新闻，恐怕不少人第一反应和科工力量一样，有种一吐胸中郁闷的(de)感受。此前很长一段时间，从(cong)美(mei)国朝野锁死中国AI研究能(neng)力的(de)叫嚣，到中文(wen)网络上(shang)对国产大(da)模型(xing)怪话连篇的(de)调侃，让很多人对中国AI产业的(de)发展倍感焦虑，而(er)通过这次(ci)事件，这样的(de)焦虑恐怕可以得到相当程(cheng)度的(de)纾解。

经过近两天的(de)发酵，这个事件本身(shen)毫无疑问已经“实锤”，不仅Llama3-V团队(dui)发布了道歉(qian)声明，作(zuo)为被抄袭方的(de)面壁智能(neng)，也由CEO李大(da)海透露了核查结果(guo)，Llama3-V和MiniCPM-Llama3-V-2.5这两个模型(xing)即便在高斯扰动验证后，在正确和错误表现方面都高度相似。

两个模型(xing)的(de)代码(ma)对比(bi)

不过继续挖掘信息的(de)话可以发现，其实所谓的(de)斯坦福团队(dui)只是两个印度裔本科生自己攒(zan)的(de)局，闯祸之后，他们还第一时间把锅甩给了实际干活的(de)枪手，声称自己是被阿拉伯(bo)裔码(ma)农描绘的(de)多模态架构忽悠(you)了，他们实际只是在社(she)交媒体平台(tai)帮着后者(zhe)宣传推广。

而(er)扛下了所有的(de)码(ma)农“枪手”Mustafa Aljadery，也是个妙人，在网上(shang)简(jian)历目(mu)前同时写了三份全职工作(zuo)，除了两个自己注册(ce)的(de)小微企业，还包括量化投资大(da)厂Citadel“即将入(ru)职的(de)暑期实习生”。

总之，这个“斯坦福团队(dui)”里的(de)卧龙凤雏，倒是让人见(jian)识(shi)到了美(mei)国科技产业最底层的(de)一个微观切片，相互忽悠(you)攒(zan)项目(mu)、海投注水论文(wen)“抽奖”、绞劲脑汁包装履历，湾区大(da)学生的(de)求职“内卷”也着实是不容易。

斯坦福的(de)作(zuo)者(zhe)在中午时间做出了最新的(de)回应，但现在这条(tiao)回应已删除图(tu)源：网友截图(tu)

Aljadery之所以抄上(shang)MiniCPM-Llama3-V-2.5，则很可能(neng)是因为这个模型(xing)前一段时间在HuggingFace趋势榜上(shang)连续霸榜，性能(neng)表现非常亮眼，OpenCompass性能(neng)基准榜单上(shang)平均得分65.1，甚(shen)至(zhi)超过了GPT-4V、Gemini Pro 这些主(zhu)流商用模型(xing)，而(er)开发者(zhe)在美(mei)国似乎又没有什么关注度，所以认为抄过来交差(cha)应该没什么风险，不过这次(ci)东窗事发之后，几个年轻(qing)人恐怕都会面临“偷(tou)鸡不成蚀把米”的(de)后果(guo)。

斯坦福人工智能(neng)实验室主(zhu)任(ren)Christopher Manning也发文(wen)谴责抄袭行为，他认为团队(dui)在事发后避重就轻(qing)，并对MiniCPM 这一中国开源模型(xing)表示赞扬。

在科工力量看来，这次(ci)事件背后，其实还有着更值得关注和探讨的(de)信息。

自从(cong)ChatGPT亮相以来，有关国内AI产业发展的(de)讨论中，已逐渐形成了所谓的(de)技术派和市场(chang)派分野，前者(zhe)以入(ru)局企业为代表，往往用“相当于GPT-x.x”来衡(heng)量技术能(neng)力，力求追上(shang)乃至(zhi)反超美(mei)国巨(ju)头，而(er)后一派则以PE/VC投资人为代表，认为OpenAI等企业连续不断(duan)的(de)突破已经说明，国内没有可能(neng)也没有必要继续在基础大(da)模型(xing)上(shang)苦苦追赶，应该利用开源大(da)模型(xing)成果(guo)，聚焦于挖掘场(chang)景应用价值。基于这样的(de)认识(shi)，甚(shen)至(zhi)有人喊出了“不会投场(chang)上(shang)任(ren)何一家中国大(da)模型(xing)公司”。

在过去一两年，这样的(de)争论或(huo)许是各有理据(ju)的(de)，不过今天的(de)中国毕竟不同于技工贸和贸工技只能(neng)二选一的(de)年代了，我们所拥有的(de)基础和资源，已经足以支撑“成年人不做选择”。

所以我们会看到，一方面，技术派的(de)突破在2024年已经有加速态势，像月之暗面Kimi、幻方DeepSeek这些产品，近期在美(mei)国业界也引(yin)发了广泛关注，而(er)另一方面，就像这次(ci)事件所展现的(de)，国内基于开源大(da)模型(xing)的(de)派生模型(xing)开发水平也越来越高，像MiniCPM-Llama3-V 2.5是基于SigLip-400M和Llama3–8B-Instruct构建(jian)，而(er)开发者(zhe)面壁智能(neng)最新发布的(de)开源大(da)模型(xing)Eurux-8x22B，则是基于Mixtral-8x22B，号称早(zao)于Llama3、比(bi)肩Llama3、推理超越Llama3，刷新开源大(da)模型(xing)推理性能(neng)SOTA。

月之暗面Kimi与幻方DeepSeek的(de)平台(tai)界面

当然，这些进展令人欣喜，不过无论技术派还是市场(chang)派，未来要走(zou)的(de)路还有很长，比(bi)如国内基础大(da)模型(xing)开发者(zhe)在实现GPT-4o乃至(zhi)未来GPT-5的(de)技术能(neng)力后，如何培(pei)育开发工具链(lian)和应用生态，仍将是一大(da)挑战，而(er)对于聚焦场(chang)景与领域应用落地的(de)企业，则有必要回答这样一个追问：开源大(da)模型(xing)是否(fou)永远(yuan)是免费的(de)午餐？

诚(cheng)然，目(mu)前开源大(da)模型(xing)社(she)区，尚未受到地缘因素的(de)明显干扰，但即便没有人兴风作(zuo)浪“拖(tuo)后腿(tui)”，长期安于使用别人的(de)基础模型(xing)成果(guo)，也意味着将制(zhi)高点拱手让给他人。

值得注意的(de)是，在开源大(da)模型(xing)原始创新上(shang)，欧洲、特(te)别是法国正占据(ju)不容忽视的(de)地位，AI大(da)模型(xing)的(de)美(mei)中法“三国杀”格局已隐约可见(jian)。

具体来看，上(shang)文(wen)提到的(de)Mixtral-8x22B，就来自于法国初创企业Mistral AI，至(zhi)于Llama系列，尽管名义上(shang)是美(mei)国巨(ju)头Meta的(de)产品，但其开发团队(dui)则主(zhu)要位于法国，相关人才和知识(shi)自然也主(zhu)要在法国流动。

在斯坦福大(da)学编制(zhi)的(de)《AI指数(shu)报告2024》中，主(zhu)要机器学习模型(xing)的(de)“原产地”排名上(shang)，美(mei)、中、欧盟已分别占据(ju)前三排名

可资参照(zhao)的(de)是，在斯坦福大(da)学编制(zhi)的(de)《AI指数(shu)报告2024》中，主(zhu)要机器学习模型(xing)的(de)“原产地”排名上(shang)，美(mei)、中、法已分别占据(ju)前三排名，而(er)欧盟加英国合计，更是已经超越中国。

这样的(de)格局中，蕴含着不言自明的(de)威胁(xie)性，如果(guo)国内AI产业界继续对开源基础模型(xing)秉持“拿来主(zhu)义”，长此以往则可能(neng)进一步增强欧洲在产业竞争中的(de)主(zhu)动性，毕竟在基础模型(xing)之外，欧洲获得高端算力的(de)便利性也远(yuan)强于国内。

总体而(er)言，以这一事件为标志，随着中国AI大(da)模型(xing)产业的(de)迅速成长，其对美(mei)国产业生态的(de)“反作(zuo)用力”也会越来越频(pin)繁而(er)显著，能(neng)否(fou)在多边博弈中稳中求进，离不开每一个产业人的(de)共同努(nu)力。

发布于：上(shang)海市

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多