246天天每期文字资料-免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT20240602-业界动态-szhfh.com

246天天每期文字资料-免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

2024-06-02 07:01:56

246天天每期文字资料-免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

又是一(yi)次成(cheng)功的PR动作。

作者(zhe) | 刘杨楠

编辑 | 王(wang)博栗子(zi)

5月(yue)14日凌晨1点，继OpenAI在(zai)AI搜索上“虚晃一(yi)枪”之后，让萨姆·奥尔特曼（Sam Altman）感(gan)觉“像(xiang)魔术一(yi)样”的新模(mo)型终于浮(fu)出水(shui)面。

不(bu)是GPT-5，不(bu)是AI搜索，而是最新旗舰生成(cheng)式AI模(mo)型GPT-4o！

GPT-4o（“o”代表“omni”，意为(wei)“全能的”）是迈向更自然的人机交互的一(yi)步——它接受文本(ben)、音频和图像(xiang)的任意组合作为(wei)输入，并(bing)生成(cheng)文本(ben)、音频和图像(xiang)的任意组合输出。

整(zheng)场发布会时长仅30分钟，OpenAI CTO米拉·穆拉蒂（Mira Murati）带来主(zhu)题演讲。“这是我们第(di)一(yi)次在(zai)易用(yong)性方面真(zhen)正迈出一(yi)大步。”穆拉蒂在(zai)公司旧金山(shan)总部的现场演示中说道， “这种互动变得更加自然，也更加容易。”

值得注意的是，此次发布会OpenAI CEO萨姆·奥尔特曼并(bing)未现身。在(zai)OpenAI官网披露的GPT-4o贡献(xian)者(zhe)中，依然没有看到OpenAI首席科(ke)学家伊利亚·苏茨克维尔（Ilya Sutskever）的身影。

01.“GPT-4o是我们最好的模(mo)型”

整(zheng)场发布会的主(zhu)角(jiao)，就是OpenAI最新旗舰生成(cheng)式AI模(mo)型GPT-4o。

OpenAI官网博客显(xian)示，GPT-4o（“o”代表“omni”）是迈向更自然的人机交互的一(yi)步。它接受文本(ben)、音频和图像(xiang)的任意组合作为(wei)输入，并(bing)生成(cheng)文本(ben)、音频和图像(xiang)的任意组合输出。

相比今年2月(yue)的Sora， OpenAI此次发布显(xian)得更有诚意——GPT-4o将免费提供给所(suo)有用(yong)户使(shi)用(yong)，Plus用(yong)户则可以(yi)享受到5倍的调用(yong)额度。

穆拉蒂表示，GPT-4o将提供与GPT-4同等水(shui)平的智能。

同时，GPT-4o的运(yun)行速度大大提升(sheng)，最大亮点在(zai)于其(qi)语音交互模(mo)式采用(yong)了全新技术，让聊天机器人对话的响应速度大幅提升(sheng)。OpenAI官网博客显(xian)示，GPT-4o在(zai)谈话中对音频输入的平均响应时间为(wei)320毫秒，最短的响应时间为(wei)232毫秒，与人类的响应时间相似。

GPT-4o还有超高的“语言天赋”，能支持50种语言，并(bing)显(xian)着提高了非英语语言的性能，包括改进分词器以(yi)更好地(di)压(ya)缩其(qi)中的许多语言：

根据传统(tong)基准测试，GPT-4o在(zai)文本(ben)、推理和编码智能方面实现了GPT-4 Turbo级别的性能，同时在(zai)多语言、音频和视觉功能上设置了新的高水(shui)位线。

开(kai)发人员现在(zai)可以(yi)在(zai)API中访问GPT-4o。与GPT-4 Turbo相比，GPT-4o速度提高2倍，价格(ge)降低一(yi)半，速率限制提高5倍。

在(zai)现场演示环节(jie)，GPT-4o更是展现了各类花(hua)式操作——它能根据演示者(zhe)的实时要求变换(huan)语音语调，演绎话剧(ju)；能实时读图；甚至还跟演示者(zhe)们开(kai)起玩笑，唱起歌。

此外，OpenAI还发布了桌面版的ChatGPT和新的用(yong)户界面。

用(yong)户可以(yi)向ChatGPT（由 GPT-4o 提供支持）提出问题，并(bing)在(zai)ChatGPT回答时打断它。OpenAI表示，该模(mo)型提供“实时”响应能力，甚至可以(yi)感(gan)知用(yong)户声音中的情(qing)感(gan)，从而生成(cheng)“一(yi)系列不(bu)同情(qing)感(gan)风格(ge)”的声音（包括唱歌）。

GPT-4o还升(sheng)级了ChatGPT的视觉能力。给定一(yi)张照片或一(yi)个桌面屏幕，GPT-4o可以(yi)快速回答相关问题，主(zhu)题范围包括“此软(ruan)件代码中发生了什么？”到“这个人穿(chuan)什么牌子(zi)的衬衫？”

“我们认识到这些模(mo)型正变得越(yue)来越(yue)复杂，” 穆拉蒂说道，“但我们希望用(yong)户与人工智能模(mo)型的交互体验能够(gou)更加自然、轻松，让用(yong)户可以(yi)将注意力完(wan)全集中在(zai)与模(mo)型的协作上，而无需在(zai)意界面本(ben)身。”

穆拉蒂还透露，未来几周内，GPT-4o将分阶段集成(cheng)至OpenAI的各个产品之中，而且会在(zai)ChatGPT Plus中推出新版语音模(mo)式GPT-4o的alpha版。

OpenAI研究员威廉·费达斯（William Fedus）表示：“GPT-4o是我们最先进的新前沿模(mo)型。我们一(yi)直在(zai)LMSys arena上测试一(yi)个版本(ben)im-also-a-good-gpt2-chatbot。”

“这不(bu)仅是世界上最好的模(mo)型，而且可以(yi)在(zai)ChatGPT中免费使(shi)用(yong)，这对于前沿模(mo)型来说是前所(suo)未有的。”费达斯补充道，“我们发现在(zai)更难的提示集上——特别是编码——存在(zai)更大的差距：GPT-4o比我们之前的最佳模(mo)型实现了+100 ELO。”

奥尔特曼也在(zai)X上表示：“GPT-4o是我们最好的模(mo)型。”

OpenAI此次发布几乎在(zai)想尽办法“讨好”用(yong)户，在(zai)“交互体验”上下足(zu)了功夫，直接免费开(kai)放使(shi)用(yong)更让用(yong)户感(gan)受到了OpenAI的诚意。

但「甲子(zi)光年」发现，在(zai)这种诚意背后，这家已被捧上神坛的AI创业公司，正深陷于某种焦虑之中。

02. OpenAI的产品焦虑

虽然奥尔特曼今天并(bing)未到场，但5月(yue)11日，他便亲自下场预告。可是，翻翻评论区，网友们的关注点似乎有点儿跑偏。

有人喊(han)话奥尔特曼让OpenAI首席科(ke)学家伊利亚回归：

有人关心GPT-5到底何时发布：

伊利亚的去向和GPT-5的发布是OpenAI留给外界的两大谜题，也是外界最关心的两大问题。

2024年，人们对OpenAI最大的期待便是GPT-5。然而，每当奥尔特曼在(zai)访谈中被问及GPT-5相关进度时，却总是支支吾吾、讳莫如深。奥尔特曼在(zai)普罗大众(zhong)心中的画(hua)像(xiang)也逐渐从一(yi)位开(kai)天辟地(di)的怪力少年，转变为(wei)一(yi)个在(zai)各国政(zheng)客间长袖(xiu)善(shan)舞，在(zai)各种场合大打太极的“成(cheng)熟企(qi)业家”。

更致命的是，ChatGPT和GPT-4之后，OpenAI似乎一(yi)直没能推出相同重量级的AI产品，这些都在(zai)不(bu)断消磨外界对OpenAI的期待与信心。

今年2月(yue)，OpenAI发布Sora——1份技术报告、32篇引用(yong)论文、一(yi)些画(hua)面堪(kan)比电影镜头的demo和1个故作高深的“世界模(mo)拟(ni)器”概念就是OpenAI给出的全部，没有技术论文，也没有可公开(kai)体验的产品入口。

「甲子(zi)光年」曾向多位AI从业者(zhe)提问：“ChatGPT和Sora，谁带给你的震撼更大？”各位受访人几乎不(bu)约(yue)而同地(di)回答：“Sora有震撼，但没ChatGPT的震撼大。”

造成(cheng)这种感(gan)官差异的直接原因是，ChatGPT能直接体验，但Sora不(bu)能。虽然ChatGPT也会犯一(yi)些荒唐的错误，但真(zhen)实的交流感(gan)带给人们的震撼，远远大于只可远观、不(bu)能上手体验的Sora。甚至不(bu)少声音开(kai)始猜测，Sora精美(mei)的Demo或许是工程师在(zai)背后屡次微调的结果，Sora实时交互的结果“可能远不(bu)如此”。

对于外界的猜测、质疑，OpenAI并(bing)未回应，而是迅速扔出下一(yi)个“靶子(zi)”——AI搜索。

过去一(yi)周，外媒不(bu)断有消息传出OpenAI将推出AI搜索产品，更有媒体猜测，谷歌一(yi)年一(yi)度的I/O大会即将于5月(yue)14日举办，而OpenAI此举是针(zhen)对谷歌的精准狙击。

OpenAI Search 测试界面，图片来源：赛博禅心

不(bu)过，AI搜索的热度炒(chao)了半天，所(suo)谓的AI搜索产品最终只是虚晃一(yi)枪。

昆仑万维董事长兼CEO方汉近期在(zai)一(yi)次直播(bo)中直言：“我觉得搜索引擎对于OpenAI的用(yong)户增长也不(bu)会有根本(ben)性的变化。”有数据显(xian)示，从去年5月(yue)开(kai)始，ChatGPT的C端增长便逐渐触(chu)顶。

而产品焦虑一(yi)日不(bu)解，OpenAI距离“伟大的公司”就永远有一(yi)墙之隔。

03. GPT-4o能治好吗？

今天再次复盘ChatGPT的成(cheng)功会发现，这是一(yi)次不(bu)可复现的“无心插柳”。

2022年中，OpenAI开(kai)始训练GPT-4。半年后的11月(yue)30日，OpenAI发布ChatGPT，全球各界都为(wei)之颤动。

OpenAI内部曾对是否发布ChatGPT有过很(hen)长一(yi)段时间争论，因为(wei)谁都无法100%确(que)认这是正确(que)的事情(qing)。

彼(bi)时，OpenAI对自己的定位是一(yi)家为(wei)开(kai)发人员和企(qi)业构建工具的公司，而非直接面向普罗大众(zhong)。因此，OpenAI要面临的核心挑战，是ChatGPT的使(shi)用(yong)门槛是否足(zu)够(gou)低，以(yi)至于能让完(wan)全不(bu)懂技术的人用(yong)起来。

在(zai)此之前发布的视觉模(mo)型DaLL-E已经让OpenAI尝到了甜头。但ChatGPT能复制DALL-E的成(cheng)功吗？

奥尔特曼是名副其(qi)实的“冒险派(pai)”，他鼓励公司发布ChatGPT，“尝试一(yi)下”。在(zai)他看来，用(yong)户和模(mo)型进行文本(ben)形式的交互会产生一(yi)些很(hen)重要的个性化结果。

很(hen)快，用(yong)户的热情(qing)证明，这次试验无比成(cheng)功。从2022年11月(yue)上线的第(di)一(yi)个完(wan)整(zheng)月(yue)（2022年11月(yue)）开(kai)始，到12月(yue)这一(yi)数字达到了2.66亿人次，月(yue)环比增长了近75%。到2023年1月(yue)，总访问量翻了一(yi)番多，达到6.16亿人次，2月(yue)就首次突(tu)破10亿人次大关。

这突(tu)如其(qi)来的成(cheng)功，在(zai)OpenAI的意料之外。

“我们并(bing)没有认为(wei)GPT-3系列模(mo)型已经跨越(yue)了将其(qi)应用(yong)于消费者(zhe)或企(qi)业的门槛，本(ben)以(yi)为(wei)GPT-4会成(cheng)为(wei)第(di)一(yi)个跨越(yue)这道门槛的模(mo)型，所(suo)以(yi)我们的很(hen)多计划和预测都是围绕(rao)2023年3月(yue)发布GPT-4来安排的。”OpenAI COO 布拉德·莱特凯普（Brad Lightcap）此前在(zai)英伟达2024 GTC大会上分享道。

按照莱特凯普的说法，OpenAI用(yong)了6个月(yue)来适应ChatGPT的爆炸性增长，并(bing)确(que)保公司有足(zu)够(gou)的GPU来满足(zu)用(yong)户的需求。

直到2023年后半年，OpenAI开(kai)始感(gan)受到了来自行业一(yi)线的真(zhen)实需求。OpenAI曾公布，截(jie)止2023年8月(yue)，80%的财富500强公司已采用(yong)ChatGPT。80%的统(tong)计数据是指(zhi)拥有注册(ce)ChatGPT帐(zhang)户的财富500强公司的百分比，由与企(qi)业电子(zi)邮件域(yu)关联的帐(zhang)户确(que)定。

于是，OpenAI迅速行动。2023年8月(yue)28日，OpenAI推出ChatGPT Enterprise，正式进军企(qi)业市(shi)场。它提供企(qi)业级安全和隐私(si)、无限的高速GPT-4访问、用(yong)于处理更长输入的更长上下文窗口、高级数据分析功能、自定义(yi)选项等等。

这是一(yi)个很(hen)微妙的时间点——ChatGPT流量见顶，开(kai)始走下坡路。

根据第(di)三方网站SimilarWeb的监测数据，2023年6月(yue)ChatGPT的网站与移动客户端的全球流量（PV）环比下降9.7%，美(mei)国地(di)区的流量环比下降10.3%。同时，ChatGPT的独立访客数量（UV）下降了5.7%，访客在(zai)网站上花(hua)费的时间也下降了8.5%。

这是自2022年11月(yue)30日发布以(yi)来，ChatGPT首次出现流量负增长。其(qi)实，ChatGPT增长放缓的势头在(zai)2023年5月(yue)已经出现端倪，5月(yue)的增长率仅为(wei)2.8%。

当时，一(yi)家AI Lab负责人告诉(su)「甲子(zi)光年」，ChatGPT流量下滑10%，但真(zhen)正的挑战不(bu)在(zai)这里。“大部分人都是带着体验的目的，看看ChatGPT到底有多强大才(cai)去注册(ce)的，包括我也是。但这不(bu)意味着我会天天用(yong)它。除了做(zuo)一(yi)些简单的科(ke)普，或者(zhe)给孩子(zi)写作文之外，大部分人日常其(qi)实也不(bu)太会用(yong)到。”这位AI Lab负责人说。

莱特凯普自己也在(zai)一(yi)次访谈中犀利点评ChatGPT：“人们玩儿过一(yi)会儿后就认为(wei)它并(bing)不(bu)是真(zhen)正的工具，而更像(xiang)一(yi)个玩具。”

更严峻的是，ChatGPT的烧钱速度同样出人意料。

当OpenAI的早期投(tou)资人埃隆·马斯克（Elon Musk）问到ChatGPT的成(cheng)本(ben)时，奥尔特曼给到的数据是“每次对话的平均费用(yong)为(wei)几美(mei)分”。2023年4月(yue)，国外一(yi)位分析师估算的数据则是每天的运(yun)营成(cheng)本(ben)高达70万美(mei)元。

2023年2月(yue)1日，OpenAI开(kai)始商业化探索，推出付费版本(ben)的ChatGPT Plus，定价每月(yue)20美(mei)元，提供的增值服务包括“高峰时段免排队、快速响应以(yi)及优先获得新功能”等。

如此看来，ChatGPT虽然备受喜爱，但在(zai)商业层面，却算不(bu)上一(yi)个真(zhen)正成(cheng)功的产品。这些被ChatGPT烧掉的钱，就要用(yong)B端来填。

数据显(xian)示，截(jie)至2023年11月(yue)，已经有92%的500强企(qi)业以(yi)某种形式部署ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华(hua)永道和Zapier均为(wei)OpenAI的早期客户。

C端流量与B端客户量的此消彼(bi)长之间，OpenAI也逐渐由一(yi)家伟大而光荣的非营利性AGI实验室，加速转变为(wei)一(yi)家“平庸”的商业公司——他们或许能赚到很(hen)多钱，却没有造出能够(gou)说服用(yong)户的产品。

直到今天，让奥尔特曼感(gan)到“像(xiang)魔术一(yi)样”的GPT-4o面世。

只是GPT-4o真(zhen)能治好OpenAI的产品焦虑吗？答案或许并(bing)不(bu)清晰。

从模(mo)型能力上来看，实时语音交互是GPT-4o在(zai)多模(mo)态方面最亮眼(yan)的进展。然而事实上，语音交互类产品并(bing)不(bu)新鲜。在(zai)可查阅的历史中，AI语音交互类产品在(zai)商业化方面并(bing)没有太多成(cheng)功的案例(li)，苹果的Siri到今天都是一(yi)个十分鸡肋的功能。

而发布会上的GPT-4o，看起来依然是一(yi)个“有趣的玩具”。

从“无心插柳”的ChatGPT，到“只可远观”的Sora、“虚晃一(yi)枪”的SearchGPT，再到今天的GPT-4o，都只是OpenAI向世界展示其(qi)AI能力的“半成(cheng)品”，而并(bing)非一(yi)个真(zhen)正能够(gou)说服用(yong)户的商业产品，这在(zai)某种程度上限制了OpenAI用(yong)户的增长。

当然，不(bu)可否认的是，从这次发布会的效果来看，GPT-4o或许会成(cheng)为(wei)又一(yi)个成(cheng)功的PR案例(li)，被写入OpenAI的历史。

（封面图来源：OpenAI）

发布于：上海市(shi)

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多