业界动态
澳门金牛版4226.0Cm-免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT
2024-06-03 02:39:60
澳门金牛版4226.0Cm-免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

又(you)是一次成功的PR动(dong)作。

作者 | 刘(liu)杨楠

编辑(ji) | 王博 栗子

5月14日凌晨1点,继(ji)OpenAI在AI搜(sou)索上“虚晃一枪”之后(hou),让萨姆·奥尔特曼(Sam Altman)感觉“像魔术一样”的新模型终于浮出水面。

不是GPT-5,不是AI搜(sou)索,而是最(zui)新旗舰生成式(shi)AI模型GPT-4o!

GPT-4o(“o”代表“omni”,意为“全能的”)是迈向(xiang)更自(zi)然的人机交互(hu)的一步——它接(jie)受文(wen)本、音频和图像的任意组合作为输入,并(bing)生成文(wen)本、音频和图像的任意组合输出。

整场发布会时长仅30分钟(zhong),OpenAI CTO米拉·穆拉蒂(Mira Murati)带来主题演讲(jiang)。“这是我们第一次在易用性方面真(zhen)正迈出一大(da)步。”穆拉蒂在公(gong)司(si)旧金山总部的现场演示(shi)中说道, “这种互(hu)动(dong)变(bian)得更加(jia)自(zi)然,也更加(jia)容易。”

值得注意的是,此次发布会OpenAI CEO萨姆·奥尔特曼并(bing)未现身。在OpenAI官网披(pi)露的GPT-4o贡献者中,依然没有看到OpenAI首席科学家(jia)伊利亚(ya)·苏茨克(ke)维尔(Ilya Sutskever)的身影。

01.“GPT-4o是我们最(zui)好的模型”

整场发布会的主角,就是OpenAI最(zui)新旗舰生成式(shi)AI模型GPT-4o。

OpenAI官网博客显示(shi),GPT-4o(“o”代表“omni”)是迈向(xiang)更自(zi)然的人机交互(hu)的一步。它接(jie)受文(wen)本、音频和图像的任意组合作为输入,并(bing)生成文(wen)本、音频和图像的任意组合输出。

相比今年2月的Sora, OpenAI此次发布显得更有诚意——GPT-4o将免费提供给(gei)所有用户使(shi)用,Plus用户则可以享受到5倍的调用额度。

穆拉蒂表示(shi),GPT-4o将提供与GPT-4同(tong)等水平的智能。

同(tong)时,GPT-4o的运行速度大(da)大(da)提升,最(zui)大(da)亮点在于其(qi)语音交互(hu)模式(shi)采用了全新技术,让聊天机器人对话(hua)的响(xiang)应速度大(da)幅提升。OpenAI官网博客显示(shi),GPT-4o在谈话(hua)中对音频输入的平均响(xiang)应时间为320毫秒,最(zui)短的响(xiang)应时间为232毫秒,与人类的响(xiang)应时间相似。

GPT-4o还有超高的“语言(yan)天赋”,能支持(chi)50种语言(yan),并(bing)显着提高了非英语语言(yan)的性能,包(bao)括改进分词器以更好地压缩其(qi)中的许(xu)多语言(yan):

根(gen)据(ju)传统基准测试,GPT-4o在文(wen)本、推理和编码智能方面实现了GPT-4 Turbo级别的性能,同(tong)时在多语言(yan)、音频和视(shi)觉功能上设置了新的高水位线。

开发人员现在可以在API中访问GPT-4o。与GPT-4 Turbo相比,GPT-4o速度提高2倍,价格降(jiang)低一半,速率(lu)限制提高5倍。

在现场演示(shi)环节,GPT-4o更是展现了各类花式(shi)操作——它能根(gen)据(ju)演示(shi)者的实时要求变(bian)换语音语调,演绎(yi)话(hua)剧(ju);能实时读图;甚至还跟演示(shi)者们开起玩(wan)笑,唱起歌。

此外,OpenAI还发布了桌面版的ChatGPT和新的用户界面。

用户可以向(xiang)ChatGPT(由 GPT-4o 提供支持(chi))提出问题,并(bing)在ChatGPT回答时打断它。OpenAI表示(shi),该模型提供“实时”响(xiang)应能力(li),甚至可以感知用户声音中的情感,从而生成“一系列不同(tong)情感风格”的声音(包(bao)括唱歌)。

GPT-4o还升级了ChatGPT的视(shi)觉能力(li)。给(gei)定一张照(zhao)片(pian)或一个桌面屏幕(mu),GPT-4o可以快速回答相关问题,主题范围包(bao)括“此软件代码中发生了什么(me)?”到“这个人穿什么(me)牌子的衬衫?”

“我们认(ren)识到这些(xie)模型正变(bian)得越来越复杂,” 穆拉蒂说道,“但我们希望用户与人工智能模型的交互(hu)体验能够更加(jia)自(zi)然、轻松,让用户可以将注意力(li)完全集中在与模型的协作上,而无需在意界面本身。”

穆拉蒂还透露,未来几周内,GPT-4o将分阶段集成至OpenAI的各个产品之中,而且会在ChatGPT Plus中推出新版语音模式(shi)GPT-4o的alpha版。

OpenAI研究员威廉(lian)·费达斯(William Fedus)表示(shi):“GPT-4o是我们最(zui)先进的新前沿模型。我们一直(zhi)在LMSys arena上测试一个版本im-also-a-good-gpt2-chatbot。”

“这不仅是世界上最(zui)好的模型,而且可以在ChatGPT中免费使(shi)用,这对于前沿模型来说是前所未有的。”费达斯补充(chong)道,“我们发现在更难(nan)的提示(shi)集上——特别是编码——存在更大(da)的差距(ju):GPT-4o比我们之前的最(zui)佳模型实现了+100 ELO。”

奥尔特曼也在X上表示(shi):“GPT-4o是我们最(zui)好的模型。”

OpenAI此次发布几乎在想尽办(ban)法“讨好”用户,在“交互(hu)体验”上下足了功夫,直(zhi)接(jie)免费开放使(shi)用更让用户感受到了OpenAI的诚意。

但「甲子光年」发现,在这种诚意背后(hou),这家(jia)已被捧(peng)上神坛的AI创业公(gong)司(si),正深陷于某种焦(jiao)虑之中。

02. OpenAI的产品焦(jiao)虑

虽然奥尔特曼今天并(bing)未到场,但5月11日,他便亲自(zi)下场预告。可是,翻翻评(ping)论区,网友们的关注点似乎有点儿跑偏。

有人喊话(hua)奥尔特曼让OpenAI首席科学家(jia)伊利亚(ya)回归:

有人关心GPT-5到底何时发布:

伊利亚(ya)的去向(xiang)和GPT-5的发布是OpenAI留给(gei)外界的两大(da)谜题,也是外界最(zui)关心的两大(da)问题。

2024年,人们对OpenAI最(zui)大(da)的期待便是GPT-5。然而,每当奥尔特曼在访谈中被问及(ji)GPT-5相关进度时,却总是支支吾(wu)吾(wu)、讳莫如深。奥尔特曼在普罗(luo)大(da)众心中的画像也逐渐(jian)从一位开天辟(pi)地的怪力(li)少年,转变(bian)为一个在各国(guo)政客间长袖(xiu)善舞,在各种场合大(da)打太极的“成熟(shu)企业家(jia)”。

更致命(ming)的是,ChatGPT和GPT-4之后(hou),OpenAI似乎一直(zhi)没能推出相同(tong)重量级的AI产品,这些(xie)都在不断消磨外界对OpenAI的期待与信心。

今年2月,OpenAI发布Sora——1份技术报告、32篇引用论文(wen)、一些(xie)画面堪比电影镜头的demo和1个故作高深的“世界模拟器”概念就是OpenAI给(gei)出的全部,没有技术论文(wen),也没有可公(gong)开体验的产品入口。

「甲子光年」曾向(xiang)多位AI从业者提问:“ChatGPT和Sora,谁(shui)带给(gei)你的震撼更大(da)?”各位受访人几乎不约而同(tong)地回答:“Sora有震撼,但没ChatGPT的震撼大(da)。”

造成这种感官差异(yi)的直(zhi)接(jie)原因是,ChatGPT能直(zhi)接(jie)体验,但Sora不能。虽然ChatGPT也会犯一些(xie)荒(huang)唐的错误,但真(zhen)实的交流感带给(gei)人们的震撼,远远大(da)于只可远观、不能上手体验的Sora。甚至不少声音开始猜测,Sora精美的Demo或许(xu)是工程(cheng)师在背后(hou)屡次微调的结果,Sora实时交互(hu)的结果“可能远不如此”。

对于外界的猜测、质疑,OpenAI并(bing)未回应,而是迅速扔出下一个“靶子”——AI搜(sou)索。

过去一周,外媒不断有消息传出OpenAI将推出AI搜(sou)索产品,更有媒体猜测,谷歌一年一度的I/O大(da)会即将于5月14日举办(ban),而OpenAI此举是针对谷歌的精准狙击(ji)。

OpenAI Search 测试界面,图片(pian)来源:赛(sai)博禅心

不过,AI搜(sou)索的热度炒了半天,所谓的AI搜(sou)索产品最(zui)终只是虚晃一枪。

昆仑万维董事(shi)长兼CEO方汉近期在一次直(zhi)播(bo)中直(zhi)言(yan):“我觉得搜(sou)索引擎对于OpenAI的用户增长也不会有根(gen)本性的变(bian)化。”有数据(ju)显示(shi),从去年5月开始,ChatGPT的C端增长便逐渐(jian)触顶。

而产品焦(jiao)虑一日不解,OpenAI距(ju)离“伟大(da)的公(gong)司(si)”就永远有一墙之隔。

03. GPT-4o能治好吗?

今天再次复盘ChatGPT的成功会发现,这是一次不可复现的“无心插柳(liu)”。

2022年中,OpenAI开始训练GPT-4。半年后(hou)的11月30日,OpenAI发布ChatGPT,全球各界都为之颤动(dong)。

OpenAI内部曾对是否发布ChatGPT有过很长一段时间争论,因为谁(shui)都无法100%确认(ren)这是正确的事(shi)情。

彼(bi)时,OpenAI对自(zi)己的定位是一家(jia)为开发人员和企业构建工具的公(gong)司(si),而非直(zhi)接(jie)面向(xiang)普罗(luo)大(da)众。因此,OpenAI要面临的核心挑(tiao)战,是ChatGPT的使(shi)用门槛是否足够低,以至于能让完全不懂技术的人用起来。

在此之前发布的视(shi)觉模型DaLL-E已经让OpenAI尝到了甜头。但ChatGPT能复制DALL-E的成功吗?

奥尔特曼是名副其(qi)实的“冒险派(pai)”,他鼓励公(gong)司(si)发布ChatGPT,“尝试一下”。在他看来,用户和模型进行文(wen)本形式(shi)的交互(hu)会产生一些(xie)很重要的个性化结果。

很快,用户的热情证明(ming),这次试验无比成功。从2022年11月上线的第一个完整月(2022年11月)开始,到12月这一数字达到了2.66亿人次,月环比增长了近75%。到2023年1月,总访问量翻了一番多,达到6.16亿人次,2月就首次突(tu)破10亿人次大(da)关。

这突(tu)如其(qi)来的成功,在OpenAI的意料(liao)之外。

“我们并(bing)没有认(ren)为GPT-3系列模型已经跨越了将其(qi)应用于消费者或企业的门槛,本以为GPT-4会成为第一个跨越这道门槛的模型,所以我们的很多计划和预测都是围绕2023年3月发布GPT-4来安(an)排的。”OpenAI COO 布拉德·莱特凯普(Brad Lightcap)此前在英伟达2024 GTC大(da)会上分享道。

按照(zhao)莱特凯普的说法,OpenAI用了6个月来适应ChatGPT的爆炸性增长,并(bing)确保公(gong)司(si)有足够的GPU来满足用户的需求。

直(zhi)到2023年后(hou)半年,OpenAI开始感受到了来自(zi)行业一线的真(zhen)实需求。OpenAI曾公(gong)布,截止2023年8月,80%的财富500强公(gong)司(si)已采用ChatGPT。80%的统计数据(ju)是指拥有注册ChatGPT帐户的财富500强公(gong)司(si)的百分比,由与企业电子邮件域关联的帐户确定。

于是,OpenAI迅速行动(dong)。2023年8月28日,OpenAI推出ChatGPT Enterprise,正式(shi)进军企业市场。它提供企业级安(an)全和隐私、无限的高速GPT-4访问、用于处理更长输入的更长上下文(wen)窗口、高级数据(ju)分析功能、自(zi)定义选(xuan)项等等。

这是一个很微妙的时间点——ChatGPT流量见顶,开始走下坡路。

根(gen)据(ju)第三方网站SimilarWeb的监测数据(ju),2023年6月ChatGPT的网站与移(yi)动(dong)客户端的全球流量(PV)环比下降(jiang)9.7%,美国(guo)地区的流量环比下降(jiang)10.3%。同(tong)时,ChatGPT的独立访客数量(UV)下降(jiang)了5.7%,访客在网站上花费的时间也下降(jiang)了8.5%。

这是自(zi)2022年11月30日发布以来,ChatGPT首次出现流量负增长。其(qi)实,ChatGPT增长放缓的势头在2023年5月已经出现端倪,5月的增长率(lu)仅为2.8%

当时,一家(jia)AI Lab负责人告诉「甲子光年」,ChatGPT流量下滑10%,但真(zhen)正的挑(tiao)战不在这里 。“大(da)部分人都是带着体验的目的,看看ChatGPT到底有多强大(da)才去注册的,包(bao)括我也是。但这不意味着我会天天用它。除了做一些(xie)简单的科普,或者给(gei)孩子写作文(wen)之外,大(da)部分人日常其(qi)实也不太会用到。”这位AI Lab负责人说。

莱特凯普自(zi)己也在一次访谈中犀利点评(ping)ChatGPT:“人们玩(wan)儿过一会儿后(hou)就认(ren)为它并(bing)不是真(zhen)正的工具,而更像一个玩(wan)具。”

更严峻的是,ChatGPT的烧钱速度同(tong)样出人意料(liao)。

当OpenAI的早期投(tou)资人埃隆·马斯克(ke)(Elon Musk)问到ChatGPT的成本时,奥尔特曼给(gei)到的数据(ju)是“每次对话(hua)的平均费用为几美分”。2023年4月,国(guo)外一位分析师估算的数据(ju)则是每天的运营成本高达70万美元。

2023年2月1日,OpenAI开始商业化探索,推出付费版本的ChatGPT Plus,定价每月20美元,提供的增值服(fu)务(wu)包(bao)括“高峰(feng)时段免排队(dui)、快速响(xiang)应以及(ji)优先获(huo)得新功能”等。

如此看来,ChatGPT虽然备受喜爱(ai),但在商业层面,却算不上一个真(zhen)正成功的产品。这些(xie)被ChatGPT烧掉的钱,就要用B端来填(tian)。

数据(ju)显示(shi),截至2023年11月,已经有92%的500强企业以某种形式(shi)部署ChatGPT。Block、Canva、Carlyle、雅诗兰黛(dai)、普华永道和Zapier均为OpenAI的早期客户。

C端流量与B端客户量的此消彼(bi)长之间,OpenAI也逐渐(jian)由一家(jia)伟大(da)而光荣(rong)的非营利性AGI实验室,加(jia)速转变(bian)为一家(jia)“平庸”的商业公(gong)司(si)——他们或许(xu)能赚(zuan)到很多钱,却没有造出能够说服(fu)用户的产品。

直(zhi)到今天,让奥尔特曼感到“像魔术一样”的GPT-4o面世。

只是GPT-4o真(zhen)能治好OpenAI的产品焦(jiao)虑吗?答案或许(xu)并(bing)不清(qing)晰。

从模型能力(li)上来看,实时语音交互(hu)是GPT-4o在多模态方面最(zui)亮眼的进展。然而事(shi)实上,语音交互(hu)类产品并(bing)不新鲜。在可查(cha)阅(yue)的历史中,AI语音交互(hu)类产品在商业化方面并(bing)没有太多成功的案例,苹果的Siri到今天都是一个十分鸡肋的功能。

而发布会上的GPT-4o,看起来依然是一个“有趣的玩(wan)具”。

从“无心插柳(liu)”的ChatGPT,到“只可远观”的Sora、“虚晃一枪”的SearchGPT,再到今天的GPT-4o,都只是OpenAI向(xiang)世界展示(shi)其(qi)AI能力(li)的“半成品”,而并(bing)非一个真(zhen)正能够说服(fu)用户的商业产品,这在某种程(cheng)度上限制了OpenAI用户的增长。

当然,不可否认(ren)的是,从这次发布会的效果来看,GPT-4o或许(xu)会成为又(you)一个成功的PR案例,被写入OpenAI的历史。

(封面图来源:OpenAI)

发布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7