OpenAI将(jiang)于5月13日周一举办(ban)发布全新的产品。但却对到底(di)要发布什么闪烁其词。此前网友猜测(ce)的GPT-5或者AI搜索引擎(qing)都被否定。
CEO奥特曼发推表示:
不(bu)是GPT-5,也不(bu)是搜索引擎(qing),但我们一直在努力开发一些(xie)大家会喜(xi)欢的新东西!对我来说,它就像魔法一样。
不(bu)是GPT-5,也不(bu)是搜索引擎(qing),但我们一直在努力开发一些(xie)大家会喜(xi)欢的新东西!对我来说,它就像魔法一样。
这个(ge)神(shen)秘的新产品到底(di)是什么?媒体援引两位知情人士说法称,新产品是一个(ge)具备(bei)视觉和听觉功能的AI模型,且具有比目前的聊天机器人更(geng)好的逻辑推理能力。
一个(ge)有视觉和听觉的全新多模态AI
报(bao)道称,OpenAI最(zui)快可能会在下周一公(gong)开展示新产品,以抢在下周谷歌(ge)的一系列产品发布之前。
奥特曼希望最(zui)终开发出一种类似电影(ying)《她》中的AI助手那样能够快速响应的人工智能,并以这种技术支持(chi)苹果Siri等现有语音助手。
华尔街见闻此前提(ti)到,苹果已(yi)经与OpenAI达成协议,将(jiang)在iOS 18中使用后者的技术,强化Siri的功能。
OpenAI已(yi)经有了可以转录音频和将(jiang)文本转换(huan)成语音的软件(jian),但这些(xie)功能是通过单独的AI聊天机器人实现的,而新产品则将(jiang)这些(xie)功能整合在了一起,而且能够更(geng)好地理解图像和音频,响应速度(du)也更(geng)快。
OpenAI认为,具有视觉和听觉功能的助手有可能像智能手机一样带来变革。它可以观察用户所处的环境信息,提(ti)供建(jian)议,潜在的用例(li)如充(chong)当家庭教师、翻译标志、修理汽车等等。
新模型暂时无法在个(ge)人设备(bei)上(shang)运行 最(zui)终会免费开放给所有用户
由于新模型较为复杂,参数量级高,个(ge)人设备(bei)的配置(zhi)暂时无法满足其性能需要。
媒体分(fen)析指出,新模型运行依赖云(yun)端(duan),需要互联网连接才能工作。要使具有视觉和听觉功能的复杂人工智能对话变得(de)足够小巧,以便在手机等个(ge)人设备(bei)上(shang)运行,可能需要几个(ge)月甚至几年的时间(jian)。
目前也没有消息透露OpenAI何时会向付费用户提(ti)供这些(xie)功能。不(bu)过根据一些(xie)企业的预览来看,OpenAI的新模型可以改(gai)进其服务中已(yi)有的功能,如自动客户服务代理。一位知情人士对媒体表示,新软件(jian)的音频功能可以帮助客服人员更(geng)好地理解来电者的语音语调。
此外,媒体还称,OpenAI希望新模型最(zui)终能免费开放给所有用户使用,因此需要让其运行成本低于目前的最(zui)强大模型GPT-4 Turbo,