5月(yue)16日,针对网传华为大模(mo)型文生图现场疑似(si)人工调取预置图片的(de)消息,华为昇腾(teng)社区回(hui)应(ying)称,现场图片为实时生成,调用(yong)的(de)是开源大模(mo)型,并非调取预置图片。
事件起源于(yu)5月(yue)10日的(de)鲲鹏昇腾(teng)开发者大会(hui),当时在一场面向开发者的(de)技术讨论(lun)会(hui)上,华为演示了mxRAG SDK功(gong)能,展示如何通过十几行代码即(ji)可完成RAG应(ying)用(yong)开发。
网传视频及(ji)聊(liao)天截(jie)图显示,华为在演示文生图功(gong)能时,按下Crtl-C中断,显示对应(ying)代码为time.sleep(6),有网友解释称,代码的(de)意思(si)是暂停6秒,然后调取预置图片展示出来(lai)。
此消息一出,立刻引发网友对技术能力真(zhen)实性的(de)讨论(lun)。有部(bu)分观点质疑,这是华为大模(mo)型能力演示造假,指控华为利用(yong)time.sleep(6)来(lai)模(mo)拟生成,实际是人工调取预置图片。
网传鲲鹏昇腾(teng)开发者大会(hui)现场图片
针对网络上的(de)质疑,昇腾(teng)社区回(hui)应(ying)称,现场图片为实时生成,调用(yong)的(de)是开源大模(mo)型。代码中有time.sleep(6)等表(biao)述,是命令等待读(du)取外部(bu)开源大模(mo)型实时生成的(de)图片,并非调取预置图片。本(ben)次展示的(de)均为真(zhen)实代码,也将在昇腾(teng)社区上开放,欢迎开发者使(shi)用(yong)并提出宝贵建议。
根据公开资料(liao),mxRAG的(de)功(gong)能为检(jian)索(Retrieval)、增强(Augmentation)和生成(Generation)。这一能力是目前(qian)开发大语言(yan)模(mo)型(LLM)所需的(de)重(zhong)要能力之一。
一些(xie)学术资料(liao)显示,LLM+RAG被应(ying)用(yong)于(yu)包(bao)问答系统、聊(liao)天机器人、事实验证、金融领域的(de)决(jue)策支持(chi)等多个领域,未来(lai)还可以提高模(mo)型的(de)可信度,开发多语言(yan)和多模(mo)态的(de)RA-LLMs等。
尽管(guan)华为已公开回(hui)应(ying),对于(yu)此次事件,网上多种观点仍在辩论(lun)。
华为昇腾(teng)社区官网截(jie)图
一些(xie)行业人士认为,time.sleep(6)可能是为了确保(bao)程序在演示过程中不会(hui)出现意外情(qing)况,而预设的(de)一个缓冲步骤。这样的(de)做法在技术演示中并不少(shao)见,目的(de)是为了展示过程的(de)平稳(wen)和可控。
也有专家指出,大模(mo)型的(de)计算和生成过程确实需要时间,而time.sleep(6)可能是为了展示模(mo)型计算的(de)实际耗时。在AI领域,模(mo)型的(de)计算速度是衡量技术先进性的(de)重(zhong)要指标之一。
但同时也有开发者认为,文生图过程理论(lun)上“完全没必要sleep(6)”。
截(jie)止目前(qian),华为此次展示的(de)mxRAG SDK功(gong)能,还未在开发者资源下载中心上线(xian)。而由于(yu)昇腾(teng)社区暂未公布源代码,开发者目前(qian)也仅能通过网传代码截(jie)图进行经验判断和讨论(lun)。