业界动态
246天天每期文字资料-免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT
2024-06-02 07:01:56
246天天每期文字资料-免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

又是一(yi)次成(cheng)功的PR动作。

作者(zhe) | 刘杨楠

编辑 | 王(wang)博 栗子(zi)

5月(yue)14日凌晨1点,继OpenAI在(zai)AI搜索上“虚晃一(yi)枪”之后,让萨姆·奥尔特曼(Sam Altman)感(gan)觉“像(xiang)魔术一(yi)样”的新模(mo)型终于浮(fu)出水(shui)面。

不(bu)是GPT-5,不(bu)是AI搜索,而是最新旗舰生成(cheng)式AI模(mo)型GPT-4o!

GPT-4o(“o”代表“omni”,意为(wei)“全能的”)是迈向更自然的人机交互的一(yi)步——它接受文本(ben)、音频和图像(xiang)的任意组合作为(wei)输入,并(bing)生成(cheng)文本(ben)、音频和图像(xiang)的任意组合输出。

整(zheng)场发布会时长仅30分钟,OpenAI CTO米拉·穆拉蒂(Mira Murati)带来主(zhu)题演讲。“这是我们第(di)一(yi)次在(zai)易用(yong)性方面真(zhen)正迈出一(yi)大步。”穆拉蒂在(zai)公司旧金山(shan)总部的现场演示中说道, “这种互动变得更加自然,也更加容易。”

值得注意的是,此次发布会OpenAI CEO萨姆·奥尔特曼并(bing)未现身。在(zai)OpenAI官网披露的GPT-4o贡献(xian)者(zhe)中,依然没有看到OpenAI首席科(ke)学家伊利亚·苏茨克维尔(Ilya Sutskever)的身影。

01.“GPT-4o是我们最好的模(mo)型”

整(zheng)场发布会的主(zhu)角(jiao),就是OpenAI最新旗舰生成(cheng)式AI模(mo)型GPT-4o。

OpenAI官网博客显(xian)示,GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一(yi)步。它接受文本(ben)、音频和图像(xiang)的任意组合作为(wei)输入,并(bing)生成(cheng)文本(ben)、音频和图像(xiang)的任意组合输出。

相比今年2月(yue)的Sora, OpenAI此次发布显(xian)得更有诚意——GPT-4o将免费提供给所(suo)有用(yong)户使(shi)用(yong),Plus用(yong)户则可以(yi)享受到5倍的调用(yong)额度。

穆拉蒂表示,GPT-4o将提供与GPT-4同等水(shui)平的智能。

同时,GPT-4o的运(yun)行速度大大提升(sheng),最大亮点在(zai)于其(qi)语音交互模(mo)式采用(yong)了全新技术,让聊天机器人对话的响应速度大幅提升(sheng)。OpenAI官网博客显(xian)示,GPT-4o在(zai)谈话中对音频输入的平均响应时间为(wei)320毫秒,最短的响应时间为(wei)232毫秒,与人类的响应时间相似。

GPT-4o还有超高的“语言天赋”,能支持50种语言,并(bing)显(xian)着提高了非英语语言的性能,包括改进分词器以(yi)更好地(di)压(ya)缩其(qi)中的许多语言:

根据传统(tong)基准测试,GPT-4o在(zai)文本(ben)、推理和编码智能方面实现了GPT-4 Turbo级别的性能,同时在(zai)多语言、音频和视觉功能上设置了新的高水(shui)位线。

开(kai)发人员现在(zai)可以(yi)在(zai)API中访问GPT-4o。与GPT-4 Turbo相比,GPT-4o速度提高2倍,价格(ge)降低一(yi)半,速率限制提高5倍。

在(zai)现场演示环节(jie),GPT-4o更是展现了各类花(hua)式操作——它能根据演示者(zhe)的实时要求变换(huan)语音语调,演绎话剧(ju);能实时读图;甚至还跟演示者(zhe)们开(kai)起玩笑,唱起歌。

此外,OpenAI还发布了桌面版的ChatGPT和新的用(yong)户界面。

用(yong)户可以(yi)向ChatGPT(由 GPT-4o 提供支持)提出问题,并(bing)在(zai)ChatGPT回答时打断它。OpenAI表示,该模(mo)型提供“实时”响应能力,甚至可以(yi)感(gan)知用(yong)户声音中的情(qing)感(gan),从而生成(cheng)“一(yi)系列不(bu)同情(qing)感(gan)风格(ge)”的声音(包括唱歌)。

GPT-4o还升(sheng)级了ChatGPT的视觉能力。给定一(yi)张照片或一(yi)个桌面屏幕,GPT-4o可以(yi)快速回答相关问题,主(zhu)题范围包括“此软(ruan)件代码中发生了什么?”到“这个人穿(chuan)什么牌子(zi)的衬衫?”

“我们认识到这些模(mo)型正变得越(yue)来越(yue)复杂,” 穆拉蒂说道,“但我们希望用(yong)户与人工智能模(mo)型的交互体验能够(gou)更加自然、轻松,让用(yong)户可以(yi)将注意力完(wan)全集中在(zai)与模(mo)型的协作上,而无需在(zai)意界面本(ben)身。”

穆拉蒂还透露,未来几周内,GPT-4o将分阶段集成(cheng)至OpenAI的各个产品之中,而且会在(zai)ChatGPT Plus中推出新版语音模(mo)式GPT-4o的alpha版。

OpenAI研究员威廉·费达斯(William Fedus)表示:“GPT-4o是我们最先进的新前沿模(mo)型。我们一(yi)直在(zai)LMSys arena上测试一(yi)个版本(ben)im-also-a-good-gpt2-chatbot。”

“这不(bu)仅是世界上最好的模(mo)型,而且可以(yi)在(zai)ChatGPT中免费使(shi)用(yong),这对于前沿模(mo)型来说是前所(suo)未有的。”费达斯补充道,“我们发现在(zai)更难的提示集上——特别是编码——存在(zai)更大的差距:GPT-4o比我们之前的最佳模(mo)型实现了+100 ELO。”

奥尔特曼也在(zai)X上表示:“GPT-4o是我们最好的模(mo)型。”

OpenAI此次发布几乎在(zai)想尽办法“讨好”用(yong)户,在(zai)“交互体验”上下足(zu)了功夫,直接免费开(kai)放使(shi)用(yong)更让用(yong)户感(gan)受到了OpenAI的诚意。

但「甲子(zi)光年」发现,在(zai)这种诚意背后,这家已被捧上神坛的AI创业公司,正深陷于某种焦虑之中。

02. OpenAI的产品焦虑

虽然奥尔特曼今天并(bing)未到场,但5月(yue)11日,他便亲自下场预告。可是,翻翻评论区,网友们的关注点似乎有点儿跑偏。

有人喊(han)话奥尔特曼让OpenAI首席科(ke)学家伊利亚回归:

有人关心GPT-5到底何时发布:

伊利亚的去向和GPT-5的发布是OpenAI留给外界的两大谜题,也是外界最关心的两大问题。

2024年,人们对OpenAI最大的期待便是GPT-5。然而,每当奥尔特曼在(zai)访谈中被问及GPT-5相关进度时,却总是支支吾吾、讳莫如深。奥尔特曼在(zai)普罗大众(zhong)心中的画(hua)像(xiang)也逐渐从一(yi)位开(kai)天辟地(di)的怪力少年,转变为(wei)一(yi)个在(zai)各国政(zheng)客间长袖(xiu)善(shan)舞,在(zai)各种场合大打太极的“成(cheng)熟企(qi)业家”。

更致命的是,ChatGPT和GPT-4之后,OpenAI似乎一(yi)直没能推出相同重量级的AI产品,这些都在(zai)不(bu)断消磨外界对OpenAI的期待与信心。

今年2月(yue),OpenAI发布Sora——1份技术报告、32篇引用(yong)论文、一(yi)些画(hua)面堪(kan)比电影镜头的demo和1个故作高深的“世界模(mo)拟(ni)器”概念就是OpenAI给出的全部,没有技术论文,也没有可公开(kai)体验的产品入口。

「甲子(zi)光年」曾向多位AI从业者(zhe)提问:“ChatGPT和Sora,谁带给你的震撼更大?”各位受访人几乎不(bu)约(yue)而同地(di)回答:“Sora有震撼,但没ChatGPT的震撼大。”

造成(cheng)这种感(gan)官差异的直接原因是,ChatGPT能直接体验,但Sora不(bu)能。虽然ChatGPT也会犯一(yi)些荒唐的错误,但真(zhen)实的交流感(gan)带给人们的震撼,远远大于只可远观、不(bu)能上手体验的Sora。甚至不(bu)少声音开(kai)始猜测,Sora精美(mei)的Demo或许是工程师在(zai)背后屡次微调的结果,Sora实时交互的结果“可能远不(bu)如此”。

对于外界的猜测、质疑,OpenAI并(bing)未回应,而是迅速扔出下一(yi)个“靶子(zi)”——AI搜索。

过去一(yi)周,外媒不(bu)断有消息传出OpenAI将推出AI搜索产品,更有媒体猜测,谷歌一(yi)年一(yi)度的I/O大会即将于5月(yue)14日举办,而OpenAI此举是针(zhen)对谷歌的精准狙击。

OpenAI Search 测试界面,图片来源:赛博禅心

不(bu)过,AI搜索的热度炒(chao)了半天,所(suo)谓的AI搜索产品最终只是虚晃一(yi)枪。

昆仑万维董事长兼CEO方汉近期在(zai)一(yi)次直播(bo)中直言:“我觉得搜索引擎对于OpenAI的用(yong)户增长也不(bu)会有根本(ben)性的变化。”有数据显(xian)示,从去年5月(yue)开(kai)始,ChatGPT的C端增长便逐渐触(chu)顶。

而产品焦虑一(yi)日不(bu)解,OpenAI距离“伟大的公司”就永远有一(yi)墙之隔。

03. GPT-4o能治好吗?

今天再次复盘ChatGPT的成(cheng)功会发现,这是一(yi)次不(bu)可复现的“无心插柳”。

2022年中,OpenAI开(kai)始训练GPT-4。半年后的11月(yue)30日,OpenAI发布ChatGPT,全球各界都为(wei)之颤动。

OpenAI内部曾对是否发布ChatGPT有过很(hen)长一(yi)段时间争论,因为(wei)谁都无法100%确(que)认这是正确(que)的事情(qing)。

彼(bi)时,OpenAI对自己的定位是一(yi)家为(wei)开(kai)发人员和企(qi)业构建工具的公司,而非直接面向普罗大众(zhong)。因此,OpenAI要面临的核心挑战,是ChatGPT的使(shi)用(yong)门槛是否足(zu)够(gou)低,以(yi)至于能让完(wan)全不(bu)懂技术的人用(yong)起来。

在(zai)此之前发布的视觉模(mo)型DaLL-E已经让OpenAI尝到了甜头。但ChatGPT能复制DALL-E的成(cheng)功吗?

奥尔特曼是名副其(qi)实的“冒险派(pai)”,他鼓励公司发布ChatGPT,“尝试一(yi)下”。在(zai)他看来,用(yong)户和模(mo)型进行文本(ben)形式的交互会产生一(yi)些很(hen)重要的个性化结果。

很(hen)快,用(yong)户的热情(qing)证明,这次试验无比成(cheng)功。从2022年11月(yue)上线的第(di)一(yi)个完(wan)整(zheng)月(yue)(2022年11月(yue))开(kai)始,到12月(yue)这一(yi)数字达到了2.66亿人次,月(yue)环比增长了近75%。到2023年1月(yue),总访问量翻了一(yi)番多,达到6.16亿人次,2月(yue)就首次突(tu)破10亿人次大关。

这突(tu)如其(qi)来的成(cheng)功,在(zai)OpenAI的意料之外。

“我们并(bing)没有认为(wei)GPT-3系列模(mo)型已经跨越(yue)了将其(qi)应用(yong)于消费者(zhe)或企(qi)业的门槛,本(ben)以(yi)为(wei)GPT-4会成(cheng)为(wei)第(di)一(yi)个跨越(yue)这道门槛的模(mo)型,所(suo)以(yi)我们的很(hen)多计划和预测都是围绕(rao)2023年3月(yue)发布GPT-4来安排的。”OpenAI COO 布拉德·莱特凯普(Brad Lightcap)此前在(zai)英伟达2024 GTC大会上分享道。

按照莱特凯普的说法,OpenAI用(yong)了6个月(yue)来适应ChatGPT的爆炸性增长,并(bing)确(que)保公司有足(zu)够(gou)的GPU来满足(zu)用(yong)户的需求。

直到2023年后半年,OpenAI开(kai)始感(gan)受到了来自行业一(yi)线的真(zhen)实需求。OpenAI曾公布,截(jie)止2023年8月(yue),80%的财富500强公司已采用(yong)ChatGPT。80%的统(tong)计数据是指(zhi)拥有注册(ce)ChatGPT帐(zhang)户的财富500强公司的百分比,由与企(qi)业电子(zi)邮件域(yu)关联的帐(zhang)户确(que)定。

于是,OpenAI迅速行动。2023年8月(yue)28日,OpenAI推出ChatGPT Enterprise,正式进军企(qi)业市(shi)场。它提供企(qi)业级安全和隐私(si)、无限的高速GPT-4访问、用(yong)于处理更长输入的更长上下文窗口、高级数据分析功能、自定义(yi)选项等等。

这是一(yi)个很(hen)微妙的时间点——ChatGPT流量见顶,开(kai)始走下坡路。

根据第(di)三方网站SimilarWeb的监测数据,2023年6月(yue)ChatGPT的网站与移动客户端的全球流量(PV)环比下降9.7%,美(mei)国地(di)区的流量环比下降10.3%。同时,ChatGPT的独立访客数量(UV)下降了5.7%,访客在(zai)网站上花(hua)费的时间也下降了8.5%。

这是自2022年11月(yue)30日发布以(yi)来,ChatGPT首次出现流量负增长。其(qi)实,ChatGPT增长放缓的势头在(zai)2023年5月(yue)已经出现端倪,5月(yue)的增长率仅为(wei)2.8%

当时,一(yi)家AI Lab负责人告诉(su)「甲子(zi)光年」,ChatGPT流量下滑10%,但真(zhen)正的挑战不(bu)在(zai)这里 。“大部分人都是带着体验的目的,看看ChatGPT到底有多强大才(cai)去注册(ce)的,包括我也是。但这不(bu)意味着我会天天用(yong)它。除了做(zuo)一(yi)些简单的科(ke)普,或者(zhe)给孩子(zi)写作文之外,大部分人日常其(qi)实也不(bu)太会用(yong)到。”这位AI Lab负责人说。

莱特凯普自己也在(zai)一(yi)次访谈中犀利点评ChatGPT:“人们玩儿过一(yi)会儿后就认为(wei)它并(bing)不(bu)是真(zhen)正的工具,而更像(xiang)一(yi)个玩具。”

更严峻的是,ChatGPT的烧钱速度同样出人意料。

当OpenAI的早期投(tou)资人埃隆·马斯克(Elon Musk)问到ChatGPT的成(cheng)本(ben)时,奥尔特曼给到的数据是“每次对话的平均费用(yong)为(wei)几美(mei)分”。2023年4月(yue),国外一(yi)位分析师估算的数据则是每天的运(yun)营成(cheng)本(ben)高达70万美(mei)元。

2023年2月(yue)1日,OpenAI开(kai)始商业化探索,推出付费版本(ben)的ChatGPT Plus,定价每月(yue)20美(mei)元,提供的增值服务包括“高峰时段免排队、快速响应以(yi)及优先获得新功能”等。

如此看来,ChatGPT虽然备受喜爱,但在(zai)商业层面,却算不(bu)上一(yi)个真(zhen)正成(cheng)功的产品。这些被ChatGPT烧掉的钱,就要用(yong)B端来填。

数据显(xian)示,截(jie)至2023年11月(yue),已经有92%的500强企(qi)业以(yi)某种形式部署ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华(hua)永道和Zapier均为(wei)OpenAI的早期客户。

C端流量与B端客户量的此消彼(bi)长之间,OpenAI也逐渐由一(yi)家伟大而光荣的非营利性AGI实验室,加速转变为(wei)一(yi)家“平庸”的商业公司——他们或许能赚到很(hen)多钱,却没有造出能够(gou)说服用(yong)户的产品。

直到今天,让奥尔特曼感(gan)到“像(xiang)魔术一(yi)样”的GPT-4o面世。

只是GPT-4o真(zhen)能治好OpenAI的产品焦虑吗?答案或许并(bing)不(bu)清晰。

从模(mo)型能力上来看,实时语音交互是GPT-4o在(zai)多模(mo)态方面最亮眼(yan)的进展。然而事实上,语音交互类产品并(bing)不(bu)新鲜。在(zai)可查阅的历史中,AI语音交互类产品在(zai)商业化方面并(bing)没有太多成(cheng)功的案例(li),苹果的Siri到今天都是一(yi)个十分鸡肋的功能。

而发布会上的GPT-4o,看起来依然是一(yi)个“有趣的玩具”。

从“无心插柳”的ChatGPT,到“只可远观”的Sora、“虚晃一(yi)枪”的SearchGPT,再到今天的GPT-4o,都只是OpenAI向世界展示其(qi)AI能力的“半成(cheng)品”,而并(bing)非一(yi)个真(zhen)正能够(gou)说服用(yong)户的商业产品,这在(zai)某种程度上限制了OpenAI用(yong)户的增长。

当然,不(bu)可否认的是,从这次发布会的效果来看,GPT-4o或许会成(cheng)为(wei)又一(yi)个成(cheng)功的PR案例(li),被写入OpenAI的历史。

(封面图来源:OpenAI)

发布于:上海市(shi)
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7