业界动态
2024澳门免费正版资料大全258十二生肖双肖哪几只-响应时间接近人类水平,OpenAI发布新款AI模型GPT-4o,语音,美国,文本
2024-06-03 05:14:35
2024澳门免费正版资料大全258十二生肖双肖哪几只-响应时间接近人类水平,OpenAI发布新款AI模型GPT-4o,语音,美国,文本

(文/观察者(zhe)网 陈思佳)一夜之间,AI界震动。

当地时间5月13日,美(mei)国人工智能(neng)研究公司OpenAI在线举(ju)行“春季更(geng)新”活动,正式推出新的旗舰人工智能(neng)模(mo)型GPT-4o,以(yi)及免费向用户提供更(geng)多ChatGPT功能(neng)。GPT-4o支持文本、音频(pin)和图像的任意组合输入,并能(neng)够(gou)生成文本、音频(pin)和图像的任意组合输出。

OpenAI首席执行官奥尔(er)特曼表示,GPT-4o的语音功能(neng)让人想起了电影(ying)《她》,“感(gan)觉就像是电影(ying)中的人工智能(neng),我仍(reng)然对其感(gan)到惊讶。”

据(ju)美(mei)国《华(hua)尔(er)街日报》13日报道,OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在发布会上表示,GPT-4o的速度比现有的GPT-4 Turbo快了两(liang)倍,但成本仅为其一半。GPT-4o可以(yi)实时对文本、音频(pin)和图像进行推理,响应时间几乎达到人类水(shui)平。

报道称(cheng),OpenAI高管现场演示了GPT-4o的多项(xiang)功能(neng),包括分析一段计算机代码、在意大利语和英语之间进行翻译(yi)、通过摄像头引导研究人员解(jie)决基(ji)本数学问题等。

OpenAI发布GPT-4o模(mo)型 视频(pin)截图

OpenAI还表示,GPT-4o可以(yi)检测用户的情绪,并以(yi)类似人类或机器(qi)人的语调与用户交谈。在演示中,ChatGPT识别到OpenAI后训(xun)练团(tuan)队负(fu)责(ze)人巴(ba)雷(lei)特·佐夫(Barret Zoph)脸上的微(wei)笑,对他说:“你脸上挂着灿烂的笑容,看起来(lai)心(xin)情很(hen)好。”

但GPT-4o在演示过程中也出现一些(xie)失误。例如(ru),它在尚未(wei)读取到图像时就开始求解(jie)方程,还一度把佐夫的面部识别为“木质(zhi)表面”。英国广播公司(BBC)称(cheng),这表明生成式人工智能(neng)的“幻觉”问题仍(reng)未(wei)得到解(jie)决,距离(li)解(jie)决聊天机器(qi)人不可靠的问题还有很(hen)长的路(lu)要走。

根据(ju)OpenAI发布的新闻稿,GPT-4o的“o”代表“omni”,即(ji)“全能(neng)”之意。GPT-4o可以(yi)在最(zui)快232毫秒的时间内(nei)响应音频(pin)输入,平均(jun)响应时间为320毫秒,几乎接近(jin)人类在交谈中的响应时间。GPT-4o的英语和代码文本性能(neng)与GPT-4 Turbo相当,在非英语文本方面也有显著提高。

OpenAI表示,在GPT-4o之前,使(shi)用语音模(mo)式与ChatGPT对话的平均(jun)延迟时间为2.8秒(GPT-3.5)和5.4秒(GPT-4)。此前的语音模(mo)式是由三个独立模(mo)型组成,一个简单模(mo)型将音频(pin)转换(huan)为文本,GPT-3.5或GPT-4接收文本并输出文本,第三个模(mo)型将文本转换(huan)回音频(pin)。这一过程将导致(zhi)GPT-4丢失大量信息,它无法识别音调、多个说话者(zhe)或背景噪音,也无法输出表达情感(gan)的语音。

但在GPT-4o中,OpenAI训(xun)练了一个综(zong)合文本、图像和音频(pin)的端到端新模(mo)型,这意味着所有输入和输出都由同一个神(shen)经网络处理。不过,OpenAI也坦言(yan),GPT-4o是该公司首个结合所有这些(xie)模(mo)式的模(mo)型,在探索模(mo)型功能(neng)及其局(ju)限性方面仍(reng)处于起步阶段。

OpenAI高管现场演示GPT-4o的检测情绪功能(neng) 视频(pin)截图

穆拉蒂在发布会上表示,GPT-4o的文本和图像功能(neng)将在ChatGPT更(geng)新后提供给所有用户,付费订(ding)阅的ChatGPT Plus用户的消息数量上限是免费用户的5倍。新版语音模(mo)式也将在未(wei)来(lai)几周内(nei)向Plus用户推出。

穆拉蒂最(zui)后还感(gan)谢了美(mei)国芯片公司英伟达的支持,“我想感(gan)谢令人难以(yi)置信的OpenAI团(tuan)队,也感(gan)谢黄仁勋和英伟达团(tuan)队为我们提供了最(zui)先进的GPU,这使(shi)得今天的演示成为可能(neng)。”

发布会结束后,OpenAI首席执行官萨姆·奥尔(er)特曼在其个人博客上发文称(cheng):“新的语音模(mo)式是我用过的最(zui)好的计算机界面。感(gan)觉就像是电影(ying)中的人工智能(neng),我仍(reng)然对它感(gan)到惊讶。事实证明,达到人类水(shui)平的响应时间和表达能(neng)力是一个重大的变化。”

奥尔(er)特曼还表示,GPT-4o的语音功能(neng)与电影(ying)《她》(Her)相似。美(mei)国有线电视新闻网(CNN)也指出,GPT-4o的语音令人想起了《她》中的人工智能(neng)。《她》是2013年(nian)在美(mei)国上映的一部科幻电影(ying),讲述了作家西(xi)奥多爱上电脑操作系(xi)统里的女(nu)声的故事。

奥尔(er)特曼在社交媒体上发文,提及电影(ying)《她》

资料图:美(mei)国电影(ying)《她》海报

《华(hua)尔(er)街日报》注(zhu)意到,OpenAI在谷歌年(nian)度开发者(zhe)大会的前一天推出了GPT-4o,预(yu)计谷歌将在当地时间5月14日的开发者(zhe)大会公布自己的新产品。GPT-4o的推出似乎意味着,在投入大量资金和精力研发新产品之后,OpenAI和其他科技巨头正寻求扩大用户群体并获得更(geng)多的研究资金。

美(mei)国“商业内(nei)幕”网站(zhan)评论称(cheng),这使(shi)得美(mei)国科技巨头的人工智能(neng)竞赛变得更(geng)加激烈,美(mei)国亚(ya)马逊公司的Alexa、苹果公司的Siri和谷歌的Gemini都还只能(neng)在语音对话中作出机械式的回应,与GPT-4o的表现有明显差距。预(yu)计这些(xie)公司将在未(wei)来(lai)几个月发布新的AI产品。

但AI技术的快速发展(zhan)也引起一些(xie)担忧。法新社指出,围(wei)绕版权问题的争议持续困扰着AI企(qi)业。OpenAI公司已经与美(mei)联社、英国《金融时报》和德国阿克塞尔(er)·施普林格(ge)集团(tuan)签署合作协议,但它也面临来(lai)自美(mei)国《纽约时报》的诉讼(song)。

许多创(chuang)作者(zhe)也担心(xin),AI大模(mo)型的训(xun)练涉及侵权问题。去(qu)年(nian)9月,包括美(mei)国知名作家、《冰与火(huo)之歌》作者(zhe)乔治·马丁在内(nei)的17名作家通过美(mei)国作家协会发起集体诉讼(song),指控OpenAI“大规模(mo)、系(xi)统性盗窃”,使(shi)用受(shou)版权保护的作品训(xun)练AI。

路(lu)透社此前指出,这些(xie)诉讼(song)牵涉到一个极具争议的问题,即(ji)科技公司使(shi)用从互联网上抓取的图像、文字和其他数据(ju)来(lai)训(xun)练AI是否构成侵权。在一些(xie)创(chuang)作者(zhe)看来(lai),科技公司在未(wei)经许可的情况下使(shi)用他们的作品,侵犯了他们的版权。但多数科技公司认为,这是对受(shou)版权保护内(nei)容的合理使(shi)用。

发布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7