2024澳门免费正版资料大全258十二生肖双肖哪几只-响应时间接近人类水平，OpenAI发布新款AI模型GPT-4o,语音,美国,文本20240603-业界动态-szhfh.com

2024澳门免费正版资料大全258十二生肖双肖哪几只-响应时间接近人类水平，OpenAI发布新款AI模型GPT-4o,语音,美国,文本

2024-06-03 05:14:35

2024澳门免费正版资料大全258十二生肖双肖哪几只-响应时间接近人类水平，OpenAI发布新款AI模型GPT-4o,语音,美国,文本

（文/观察者(zhe)网陈思佳）一夜之间，AI界震动。

当地时间5月13日，美(mei)国人工智能(neng)研究公司OpenAI在线举(ju)行“春季更(geng)新”活动，正式推出新的旗舰人工智能(neng)模(mo)型GPT-4o，以(yi)及免费向用户提供更(geng)多ChatGPT功能(neng)。GPT-4o支持文本、音频(pin)和图像的任意组合输入，并能(neng)够(gou)生成文本、音频(pin)和图像的任意组合输出。

OpenAI首席执行官奥尔(er)特曼表示，GPT-4o的语音功能(neng)让人想起了电影(ying)《她》，“感(gan)觉就像是电影(ying)中的人工智能(neng)，我仍(reng)然对其感(gan)到惊讶。”

据(ju)美(mei)国《华(hua)尔(er)街日报》13日报道，OpenAI首席技术官米拉·穆拉蒂（Mira Murati）在发布会上表示，GPT-4o的速度比现有的GPT-4 Turbo快了两(liang)倍，但成本仅为其一半。GPT-4o可以(yi)实时对文本、音频(pin)和图像进行推理，响应时间几乎达到人类水(shui)平。

报道称(cheng)，OpenAI高管现场演示了GPT-4o的多项(xiang)功能(neng)，包括分析一段计算机代码、在意大利语和英语之间进行翻译(yi)、通过摄像头引导研究人员解(jie)决基(ji)本数学问题等。

OpenAI发布GPT-4o模(mo)型视频(pin)截图

OpenAI还表示，GPT-4o可以(yi)检测用户的情绪，并以(yi)类似人类或机器(qi)人的语调与用户交谈。在演示中，ChatGPT识别到OpenAI后训(xun)练团(tuan)队负(fu)责(ze)人巴(ba)雷(lei)特·佐夫（Barret Zoph）脸上的微(wei)笑，对他说：“你脸上挂着灿烂的笑容，看起来(lai)心(xin)情很(hen)好。”

但GPT-4o在演示过程中也出现一些(xie)失误。例如(ru)，它在尚未(wei)读取到图像时就开始求解(jie)方程，还一度把佐夫的面部识别为“木质(zhi)表面”。英国广播公司（BBC）称(cheng)，这表明生成式人工智能(neng)的“幻觉”问题仍(reng)未(wei)得到解(jie)决，距离(li)解(jie)决聊天机器(qi)人不可靠的问题还有很(hen)长的路(lu)要走。

根据(ju)OpenAI发布的新闻稿，GPT-4o的“o”代表“omni”，即(ji)“全能(neng)”之意。GPT-4o可以(yi)在最(zui)快232毫秒的时间内(nei)响应音频(pin)输入，平均(jun)响应时间为320毫秒，几乎接近(jin)人类在交谈中的响应时间。GPT-4o的英语和代码文本性能(neng)与GPT-4 Turbo相当，在非英语文本方面也有显著提高。

OpenAI表示，在GPT-4o之前，使(shi)用语音模(mo)式与ChatGPT对话的平均(jun)延迟时间为2.8秒（GPT-3.5）和5.4秒（GPT-4）。此前的语音模(mo)式是由三个独立模(mo)型组成，一个简单模(mo)型将音频(pin)转换(huan)为文本，GPT-3.5或GPT-4接收文本并输出文本，第三个模(mo)型将文本转换(huan)回音频(pin)。这一过程将导致(zhi)GPT-4丢失大量信息，它无法识别音调、多个说话者(zhe)或背景噪音，也无法输出表达情感(gan)的语音。

但在GPT-4o中，OpenAI训(xun)练了一个综(zong)合文本、图像和音频(pin)的端到端新模(mo)型，这意味着所有输入和输出都由同一个神(shen)经网络处理。不过，OpenAI也坦言(yan)，GPT-4o是该公司首个结合所有这些(xie)模(mo)式的模(mo)型，在探索模(mo)型功能(neng)及其局(ju)限性方面仍(reng)处于起步阶段。

OpenAI高管现场演示GPT-4o的检测情绪功能(neng) 视频(pin)截图

穆拉蒂在发布会上表示，GPT-4o的文本和图像功能(neng)将在ChatGPT更(geng)新后提供给所有用户，付费订(ding)阅的ChatGPT Plus用户的消息数量上限是免费用户的5倍。新版语音模(mo)式也将在未(wei)来(lai)几周内(nei)向Plus用户推出。

穆拉蒂最(zui)后还感(gan)谢了美(mei)国芯片公司英伟达的支持，“我想感(gan)谢令人难以(yi)置信的OpenAI团(tuan)队，也感(gan)谢黄仁勋和英伟达团(tuan)队为我们提供了最(zui)先进的GPU，这使(shi)得今天的演示成为可能(neng)。”

发布会结束后，OpenAI首席执行官萨姆·奥尔(er)特曼在其个人博客上发文称(cheng)：“新的语音模(mo)式是我用过的最(zui)好的计算机界面。感(gan)觉就像是电影(ying)中的人工智能(neng)，我仍(reng)然对它感(gan)到惊讶。事实证明，达到人类水(shui)平的响应时间和表达能(neng)力是一个重大的变化。”

奥尔(er)特曼还表示，GPT-4o的语音功能(neng)与电影(ying)《她》（Her）相似。美(mei)国有线电视新闻网（CNN）也指出，GPT-4o的语音令人想起了《她》中的人工智能(neng)。《她》是2013年(nian)在美(mei)国上映的一部科幻电影(ying)，讲述了作家西(xi)奥多爱上电脑操作系(xi)统里的女(nu)声的故事。

奥尔(er)特曼在社交媒体上发文，提及电影(ying)《她》

资料图：美(mei)国电影(ying)《她》海报

《华(hua)尔(er)街日报》注(zhu)意到，OpenAI在谷歌年(nian)度开发者(zhe)大会的前一天推出了GPT-4o，预(yu)计谷歌将在当地时间5月14日的开发者(zhe)大会公布自己的新产品。GPT-4o的推出似乎意味着，在投入大量资金和精力研发新产品之后，OpenAI和其他科技巨头正寻求扩大用户群体并获得更(geng)多的研究资金。

美(mei)国“商业内(nei)幕”网站(zhan)评论称(cheng)，这使(shi)得美(mei)国科技巨头的人工智能(neng)竞赛变得更(geng)加激烈，美(mei)国亚(ya)马逊公司的Alexa、苹果公司的Siri和谷歌的Gemini都还只能(neng)在语音对话中作出机械式的回应，与GPT-4o的表现有明显差距。预(yu)计这些(xie)公司将在未(wei)来(lai)几个月发布新的AI产品。

但AI技术的快速发展(zhan)也引起一些(xie)担忧。法新社指出，围(wei)绕版权问题的争议持续困扰着AI企(qi)业。OpenAI公司已经与美(mei)联社、英国《金融时报》和德国阿克塞尔(er)·施普林格(ge)集团(tuan)签署合作协议，但它也面临来(lai)自美(mei)国《纽约时报》的诉讼(song)。

许多创(chuang)作者(zhe)也担心(xin)，AI大模(mo)型的训(xun)练涉及侵权问题。去(qu)年(nian)9月，包括美(mei)国知名作家、《冰与火(huo)之歌》作者(zhe)乔治·马丁在内(nei)的17名作家通过美(mei)国作家协会发起集体诉讼(song)，指控OpenAI“大规模(mo)、系(xi)统性盗窃”，使(shi)用受(shou)版权保护的作品训(xun)练AI。

路(lu)透社此前指出，这些(xie)诉讼(song)牵涉到一个极具争议的问题，即(ji)科技公司使(shi)用从互联网上抓取的图像、文字和其他数据(ju)来(lai)训(xun)练AI是否构成侵权。在一些(xie)创(chuang)作者(zhe)看来(lai)，科技公司在未(wei)经许可的情况下使(shi)用他们的作品，侵犯了他们的版权。但多数科技公司认为，这是对受(shou)版权保护内(nei)容的合理使(shi)用。

发布于：上海市

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多