OpenAI将于5月13日周(zhou)一举办发布全新的产(chan)品(pin)。但(dan)却对到底(di)要发布什么闪烁其(qi)词。此前网(wang)友猜测的GPT-5或者AI搜索引擎都(dou)被(bei)否定。
CEO奥特曼发推表示:
不是GPT-5,也不是搜索引擎,但(dan)我们一直在努力开发一些大家会喜欢的新东西!对我来(lai)说(shuo),它就像魔法一样。
不是GPT-5,也不是搜索引擎,但(dan)我们一直在努力开发一些大家会喜欢的新东西!对我来(lai)说(shuo),它就像魔法一样。
这个神秘的新产(chan)品(pin)到底(di)是什么?媒(mei)体援引两位(wei)知情人(ren)士说(shuo)法称(cheng),新产(chan)品(pin)是一个具备(bei)视觉和听觉功能的AI模(mo)型,且具有比目前的聊天机器人(ren)更好的逻辑推理能力。
一个有视觉和听觉的全新多(duo)模(mo)态AI
报(bao)道称(cheng),OpenAI最快可(ke)能会在下周(zhou)一公开展示新产(chan)品(pin),以抢在下周(zhou)谷歌的一系列产(chan)品(pin)发布之前。
奥特曼希望最终开发出一种类似电影《她》中的AI助手那样能够快速响应的人(ren)工智能,并以这种技术支持苹果Siri等现有语音(yin)助手。
华尔街(jie)见(jian)闻此前提到,苹果已经与OpenAI达(da)成协议,将在iOS 18中使用后者的技术,强化Siri的功能。
OpenAI已经有了可(ke)以转(zhuan)录音(yin)频和将文(wen)本转(zhuan)换(huan)成语音(yin)的软(ruan)件,但(dan)这些功能是通过单独的AI聊天机器人(ren)实现的,而新产(chan)品(pin)则将这些功能整合在了一起,而且能够更好地理解(jie)图像和音(yin)频,响应速度也更快。
OpenAI认为,具有视觉和听觉功能的助手有可(ke)能像智能手机一样带来(lai)变革。它可(ke)以观察用户所处(chu)的环境信息,提供(gong)建议,潜在的用例如充当家庭(ting)教师、翻译标志(zhi)、修理汽车等等。
新模(mo)型暂时无法在个人(ren)设备(bei)上运行 最终会免费开放给所有用户
由(you)于新模(mo)型较为复杂(za),参数量级高,个人(ren)设备(bei)的配(pei)置暂时无法满足(zu)其(qi)性能需要。
媒(mei)体分(fen)析(xi)指出,新模(mo)型运行依赖云端,需要互联网(wang)连接才能工作。要使具有视觉和听觉功能的复杂(za)人(ren)工智能对话变得(de)足(zu)够小巧,以便在手机等个人(ren)设备(bei)上运行,可(ke)能需要几个月甚至几年(nian)的时间。
目前也没有消息透露OpenAI何时会向付费用户提供(gong)这些功能。不过根据一些企业的预览来(lai)看,OpenAI的新模(mo)型可(ke)以改进其(qi)服务中已有的功能,如自动客户服务代理。一位(wei)知情人(ren)士对媒(mei)体表示,新软(ruan)件的音(yin)频功能可(ke)以帮助客服人(ren)员更好地理解(jie)来(lai)电者的语音(yin)语调。
此外,媒(mei)体还称(cheng),OpenAI希望新模(mo)型最终能免费开放给所有用户使用,因此需要让其(qi)运行成本低于目前的最强大模(mo)型GPT-4 Turbo,