业界动态
抢在ChatGPT前发布语言助手!法国实验室演示自带70种情绪AI,Kyutai,Moshi,OpenAI
2024-07-15 00:24:38
抢在ChatGPT前发布语言助手!法国实验室演示自带70种情绪AI,Kyutai,Moshi,OpenAI

本文作者:李丹

来源:硬(ying)AI

OpenAI被超越(yue)了,而且还是“栽在”已经公开演示过的语音助手上。

当地时间7月3日周三(san),法国独(du)立非盈利AI研究实验室Kyutai公开演示了一款语音助理Moshi的实验性原型。Kyutai介绍,Moshi由该(gai)实验室的八人研究团队耗时六个月从零开始开发(fa),是全球首款全体大众都可使用(yong)的实时生成(cheng)式语音AI。

Moshi具有多种类似人类的情绪(xu)。Kyutai的科学家们表示,Moshi系统能够带着70种情绪(xu)和风格讲话。他们现场演示了,Moshi如何就攀登珠穆(mu)朗玛峰提供建(jian)议,还让Moshi用(yong)浓(nong)重的法国口音朗诵一首它自己创作的诗歌。

Kyutai宣布,周二晚些时候可在其网站查看Moshi的交互式演示。从周二起,就可以在线免费测试Moshi。Kyutai致力于为AI的开放研究和整个生态系统的发(fa)展做出贡献,Moshi模型的代码(ma)和权重将很快免费共享(xiang),这对(dui)于此类技术来说(shuo)也是前所未(wei)有的。Kyutai的一名代表表示,Moshi模型和相关研究将在未(wei)来几周内发(fa)布,没有透露具体日期。

Kyutai认为,Moshi有潜(qian)力彻底改变数(shu)字世界中语音的使用(yong)方式,并举例称,在表达情感和多种声音之间的互动方面,它的文本转语音功能非常出色。

Kyutai的CEO Patrick Pérez称,Moshi可以“边(bian)说(shuo)话边(bian)思考”,还说(shuo)“我们相信 Moshi 具有巨大的潜(qian)力,可以改变我们与机器交流的方式。”

研究者Lucas Beyer在社交媒体发(fa)帖(tie)评论,Kyutai的Moshi是首个实时音频大语言(yan)模型(LLM)。Kyutai的演示种,Moshi基本上没有延迟,甚至(zhi)还打(da)断了演讲者几次。它实际上有点急于快速回答。而且Moshi是全部开源的。虽然声音质量还有点机械化,但作为初版(ban),它还是表现不错。总体来说(shuo)很酷。

Beyer指(zhi)出,演示时,在苹果电脑macbook设备上的模型有一些实时拒绝误报(bao),也许Kyutai对(dui)安全调整有点太急切了。然而,这只是证实了演示确实是实时的,甚至(zhi)可能是自由发(fa)挥的,他喜欢(huan)这点。

有网友评论称,有趣的是,看到日语单词以赛博朋克的方式融入西方文化。在日语中,Kyutai 的意思是球体,moshi 是电话里(li)的口语问候语,所以这两者结合起来就是“你好球体”。

Moshi被视为ChatGPT的最新挑战者。包括(kuo)Anthropic、Cohere和谷歌在内,越(yue)来越(yue)多初创公司和科技巨头推出模型与GPT-4 竞争,尽管(guan)一些行业专家担心这项新兴技术带来危险。

Moshi的问世让Kyutai成(cheng)为抢(qiang)跑OpenAI推出语音助手的先锋。OpenAI之前打(da)算在机器人聊天工具ChatGPT上提供类似功能,不到两个月前正式向公众展示了基于GPT-4升级版(ban)GPT-4o模型的语音助手。

在OpenAI今年5月中展示过程中,语言(yan)助手表现得(de)像一个真(zhen)正的成(cheng)年人,能听能说(shuo)能看,还能有情绪(xu)变化,最关键是几乎可以即时回应请求。它不仅可以讲睡前故事,能通过外表观察人的情绪(xu)变化,还能像一位朋友般安抚人紧张的情绪(xu),甚至(zhi)还可以像个经验丰富的数(shu)学老(lao)师般指(zhi)导解代数(shu)方程,让一些观众联想到了2013年电影《她》中的AI虚拟助手。

但一个多月后,OpenAI又宣布因安全顾虑推迟发(fa)布上述语音助手。6月25日上周二,OpenAI在社交媒体发(fa)帖(tie)称,推迟上线ChatGPT语音助手功能是因为,需要确保它能安全有效地处(chu)理来自数(shu)百万用(yong)户的请求,还需要一个月才能达到公司的发(fa)布标准。

有网友本周二评论称,Kyutai推出Moshi基本上等于,把OpenAI还没公开发(fa)布的客户产品开源了,向Kyutai致敬。

不同(tong)于微软150亿美(mei)元支持的“美(mei)系”资本背景(jing)OpenAI,Kyutai致力于研究通用(yong)AI,去年11月“出生”起得(de)到合计3亿欧元支持,其中主(zhu)要来自欧洲实业资本。

Kyutai是法国亿万富翁Xavier Niel去年表示将对(dui)AI领域投资2亿欧元的投资对(dui)象(xiang)之一。Niel旗下的电信集团Iliad去年公布,将为Kyutai项目(mu)投入1亿欧元。另一位法国亿万富翁、法国航运(yun)和物(wu)流巨头CMA CGM的CEO Rodolphe Saadé也对(dui)Kyutai投资了1亿欧元。前谷歌CEO Eric Schmidt也参与了Kyutai的投资,未(wei)披露金额。

Niel本周二表示,Moshi表明,欧洲可以成(cheng)为AI发(fa)展的全球参与者。Kyutai“今天展示的所有产品都是全球一流的,我们很高兴能在欧洲推出这款产品。”

在安全方面,Kyutai的首席科学官(guan) Hervé Jégou介绍,Kyutai将使用(yong)索(suo)引和水(shui)印工具识别和跟踪其 AI 生成(cheng)的音频。

发(fa)布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7