澳门三中三码精准100%微信号-免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT20240602-业界动态-szhfh.com

澳门三中三码精准100%微信号-免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

2024-06-02 04:28:58

澳门三中三码精准100%微信号-免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

又是一(yi)次(ci)成功的PR动(dong)作。

作者 | 刘杨(yang)楠(nan)

编辑 | 王博栗子

5月14日凌晨1点，继OpenAI在AI搜索上“虚晃一(yi)枪”之(zhi)后，让萨姆(mu)·奥尔特(te)曼（Sam Altman）感觉“像魔术(shu)一(yi)样”的新模型终于(yu)浮出(chu)水(shui)面(mian)。

不是GPT-5，不是AI搜索，而是最新旗舰生成式AI模型GPT-4o！

GPT-4o（“o”代表“omni”，意为“全能的”）是迈向更自然的人(ren)机交互的一(yi)步——它接受(shou)文本、音频和(he)图像的任意组合作为输入，并生成文本、音频和(he)图像的任意组合输出(chu)。

整场发布会时长(chang)仅30分(fen)钟，OpenAI CTO米(mi)拉·穆拉蒂（Mira Murati）带来(lai)主题演讲。“这是我们第一(yi)次(ci)在易用性(xing)方面(mian)真正迈出(chu)一(yi)大步。”穆拉蒂在公(gong)司旧金山总部的现(xian)场演示中说道(dao)， “这种互动(dong)变得更加自然，也(ye)更加容易。”

值得注意的是，此次(ci)发布会OpenAI CEO萨姆(mu)·奥尔特(te)曼并未现(xian)身(shen)。在OpenAI官网披露的GPT-4o贡献者中，依然没有看到OpenAI首席科学家伊利亚·苏茨克维尔（Ilya Sutskever）的身(shen)影。

01.“GPT-4o是我们最好的模型”

整场发布会的主角，就是OpenAI最新旗舰生成式AI模型GPT-4o。

OpenAI官网博客(ke)显示，GPT-4o（“o”代表“omni”）是迈向更自然的人(ren)机交互的一(yi)步。它接受(shou)文本、音频和(he)图像的任意组合作为输入，并生成文本、音频和(he)图像的任意组合输出(chu)。

相比今年2月的Sora， OpenAI此次(ci)发布显得更有诚意——GPT-4o将免费提供给所有用户使用，Plus用户则可以享受(shou)到5倍的调用额度。

穆拉蒂表示，GPT-4o将提供与GPT-4同等水(shui)平的智能。

同时，GPT-4o的运行速度大大提升，最大亮点在于(yu)其(qi)语音交互模式采用了全新技术(shu)，让聊天机器(qi)人(ren)对话的响应速度大幅提升。OpenAI官网博客(ke)显示，GPT-4o在谈话中对音频输入的平均响应时间为320毫秒，最短的响应时间为232毫秒，与人(ren)类的响应时间相似。

GPT-4o还有超高的“语言天赋(fu)”，能支持50种语言，并显着提高了非英语语言的性(xing)能，包括改进分(fen)词器(qi)以更好地压(ya)缩其(qi)中的许多语言：

根据传统基准测试，GPT-4o在文本、推理和(he)编码智能方面(mian)实现(xian)了GPT-4 Turbo级别的性(xing)能，同时在多语言、音频和(he)视觉功能上设置了新的高水(shui)位线。

开发人(ren)员(yuan)现(xian)在可以在API中访问GPT-4o。与GPT-4 Turbo相比，GPT-4o速度提高2倍，价格降低一(yi)半，速率限制提高5倍。

在现(xian)场演示环节，GPT-4o更是展现(xian)了各类花式操作——它能根据演示者的实时要求变换语音语调，演绎话剧；能实时读图；甚(shen)至还跟演示者们开起玩(wan)笑，唱起歌(ge)。

此外(wai)，OpenAI还发布了桌(zhuo)面(mian)版的ChatGPT和(he)新的用户界面(mian)。

用户可以向ChatGPT（由 GPT-4o 提供支持）提出(chu)问题，并在ChatGPT回答时打断它。OpenAI表示，该模型提供“实时”响应能力(li)，甚(shen)至可以感知用户声音中的情感，从而生成“一(yi)系列不同情感风格”的声音（包括唱歌(ge)）。

GPT-4o还升级了ChatGPT的视觉能力(li)。给定一(yi)张照片或一(yi)个桌(zhuo)面(mian)屏幕，GPT-4o可以快速回答相关问题，主题范围包括“此软件代码中发生了什么？”到“这个人(ren)穿什么牌(pai)子的衬衫？”

“我们认识到这些模型正变得越来(lai)越复杂，” 穆拉蒂说道(dao)，“但我们希望用户与人(ren)工智能模型的交互体验能够更加自然、轻松，让用户可以将注意力(li)完全集中在与模型的协作上，而无需在意界面(mian)本身(shen)。”

穆拉蒂还透露，未来(lai)几周内，GPT-4o将分(fen)阶段(duan)集成至OpenAI的各个产品之(zhi)中，而且会在ChatGPT Plus中推出(chu)新版语音模式GPT-4o的alpha版。

OpenAI研(yan)究员(yuan)威廉·费达斯（William Fedus）表示：“GPT-4o是我们最先进的新前沿模型。我们一(yi)直在LMSys arena上测试一(yi)个版本im-also-a-good-gpt2-chatbot。”

“这不仅是世界上最好的模型，而且可以在ChatGPT中免费使用，这对于(yu)前沿模型来(lai)说是前所未有的。”费达斯补充道(dao)，“我们发现(xian)在更难的提示集上——特(te)别是编码——存在更大的差距：GPT-4o比我们之(zhi)前的最佳模型实现(xian)了+100 ELO。”

奥尔特(te)曼也(ye)在X上表示：“GPT-4o是我们最好的模型。”

OpenAI此次(ci)发布几乎在想尽办法“讨好”用户，在“交互体验”上下足了功夫，直接免费开放使用更让用户感受(shou)到了OpenAI的诚意。

但「甲子光(guang)年」发现(xian)，在这种诚意背后，这家已被捧上神坛的AI创(chuang)业公(gong)司，正深陷(xian)于(yu)某种焦虑之(zhi)中。

02. OpenAI的产品焦虑

虽然奥尔特(te)曼今天并未到场，但5月11日，他便(bian)亲自下场预(yu)告。可是，翻翻评(ping)论区，网友们的关注点似乎有点儿跑偏(pian)。

有人(ren)喊话奥尔特(te)曼让OpenAI首席科学家伊利亚回归：

有人(ren)关心GPT-5到底何时发布：

伊利亚的去向和(he)GPT-5的发布是OpenAI留给外(wai)界的两大谜(mi)题，也(ye)是外(wai)界最关心的两大问题。

2024年，人(ren)们对OpenAI最大的期待(dai)便(bian)是GPT-5。然而，每当奥尔特(te)曼在访谈中被问及GPT-5相关进度时，却总是支支吾(wu)吾(wu)、讳(hui)莫如深。奥尔特(te)曼在普罗大众心中的画像也(ye)逐渐从一(yi)位开天辟(pi)地的怪(guai)力(li)少年，转变为一(yi)个在各国政客(ke)间长(chang)袖善舞，在各种场合大打太极的“成熟企业家”。

更致命的是，ChatGPT和(he)GPT-4之(zhi)后，OpenAI似乎一(yi)直没能推出(chu)相同重量级的AI产品，这些都在不断消磨外(wai)界对OpenAI的期待(dai)与信心。

今年2月，OpenAI发布Sora——1份技术(shu)报告、32篇引用论文、一(yi)些画面(mian)堪比电影镜头的demo和(he)1个故(gu)作高深的“世界模拟器(qi)”概念就是OpenAI给出(chu)的全部，没有技术(shu)论文，也(ye)没有可公(gong)开体验的产品入口(kou)。

「甲子光(guang)年」曾向多位AI从业者提问：“ChatGPT和(he)Sora，谁带给你的震撼更大？”各位受(shou)访人(ren)几乎不约而同地回答：“Sora有震撼，但没ChatGPT的震撼大。”

造成这种感官差异的直接原因是，ChatGPT能直接体验，但Sora不能。虽然ChatGPT也(ye)会犯一(yi)些荒唐的错误，但真实的交流感带给人(ren)们的震撼，远(yuan)远(yuan)大于(yu)只可远(yuan)观、不能上手体验的Sora。甚(shen)至不少声音开始猜测，Sora精美的Demo或许是工程师在背后屡次(ci)微调的结果，Sora实时交互的结果“可能远(yuan)不如此”。

对于(yu)外(wai)界的猜测、质疑(yi)，OpenAI并未回应，而是迅速扔(reng)出(chu)下一(yi)个“靶子”——AI搜索。

过去一(yi)周，外(wai)媒不断有消息传出(chu)OpenAI将推出(chu)AI搜索产品，更有媒体猜测，谷(gu)歌(ge)一(yi)年一(yi)度的I/O大会即将于(yu)5月14日举办，而OpenAI此举是针对谷(gu)歌(ge)的精准狙(ju)击。

OpenAI Search 测试界面(mian)，图片来(lai)源：赛博禅心

不过，AI搜索的热度炒了半天，所谓的AI搜索产品最终只是虚晃一(yi)枪。

昆仑万维董事长(chang)兼CEO方汉近期在一(yi)次(ci)直播中直言：“我觉得搜索引擎对于(yu)OpenAI的用户增(zeng)长(chang)也(ye)不会有根本性(xing)的变化(hua)。”有数据显示，从去年5月开始，ChatGPT的C端增(zeng)长(chang)便(bian)逐渐触顶(ding)。

而产品焦虑一(yi)日不解，OpenAI距离(li)“伟大的公(gong)司”就永远(yuan)有一(yi)墙之(zhi)隔。

03. GPT-4o能治(zhi)好吗？

今天再次(ci)复盘ChatGPT的成功会发现(xian)，这是一(yi)次(ci)不可复现(xian)的“无心插柳”。

2022年中，OpenAI开始训练(lian)GPT-4。半年后的11月30日，OpenAI发布ChatGPT，全球各界都为之(zhi)颤动(dong)。

OpenAI内部曾对是否发布ChatGPT有过很长(chang)一(yi)段(duan)时间争论，因为谁都无法100%确认这是正确的事情。

彼时，OpenAI对自己的定位是一(yi)家为开发人(ren)员(yuan)和(he)企业构(gou)建工具的公(gong)司，而非直接面(mian)向普罗大众。因此，OpenAI要面(mian)临的核心挑战(zhan)，是ChatGPT的使用门槛是否足够低，以至于(yu)能让完全不懂技术(shu)的人(ren)用起来(lai)。

在此之(zhi)前发布的视觉模型DaLL-E已经让OpenAI尝到了甜头。但ChatGPT能复制DALL-E的成功吗？

奥尔特(te)曼是名副其(qi)实的“冒险(xian)派”，他鼓励公(gong)司发布ChatGPT，“尝试一(yi)下”。在他看来(lai)，用户和(he)模型进行文本形式的交互会产生一(yi)些很重要的个性(xing)化(hua)结果。

很快，用户的热情证明，这次(ci)试验无比成功。从2022年11月上线的第一(yi)个完整月（2022年11月）开始，到12月这一(yi)数字达到了2.66亿人(ren)次(ci)，月环比增(zeng)长(chang)了近75%。到2023年1月，总访问量翻了一(yi)番多，达到6.16亿人(ren)次(ci)，2月就首次(ci)突破10亿人(ren)次(ci)大关。

这突如其(qi)来(lai)的成功，在OpenAI的意料之(zhi)外(wai)。

“我们并没有认为GPT-3系列模型已经跨越了将其(qi)应用于(yu)消费者或企业的门槛，本以为GPT-4会成为第一(yi)个跨越这道(dao)门槛的模型，所以我们的很多计划和(he)预(yu)测都是围绕2023年3月发布GPT-4来(lai)安排的。”OpenAI COO 布拉德·莱特(te)凯普（Brad Lightcap）此前在英伟达2024 GTC大会上分(fen)享道(dao)。

按照莱特(te)凯普的说法，OpenAI用了6个月来(lai)适应ChatGPT的爆(bao)炸性(xing)增(zeng)长(chang)，并确保公(gong)司有足够的GPU来(lai)满足用户的需求。

直到2023年后半年，OpenAI开始感受(shou)到了来(lai)自行业一(yi)线的真实需求。OpenAI曾公(gong)布，截止2023年8月，80%的财富500强公(gong)司已采用ChatGPT。80%的统计数据是指(zhi)拥有注册ChatGPT帐户的财富500强公(gong)司的百分(fen)比，由与企业电子邮件域关联的帐户确定。

于(yu)是，OpenAI迅速行动(dong)。2023年8月28日，OpenAI推出(chu)ChatGPT Enterprise，正式进军企业市(shi)场。它提供企业级安全和(he)隐私、无限的高速GPT-4访问、用于(yu)处理更长(chang)输入的更长(chang)上下文窗口(kou)、高级数据分(fen)析功能、自定义选项(xiang)等等。

这是一(yi)个很微妙(miao)的时间点——ChatGPT流量见(jian)顶(ding)，开始走下坡路。

根据第三方网站SimilarWeb的监测数据，2023年6月ChatGPT的网站与移动(dong)客(ke)户端的全球流量（PV）环比下降9.7%，美国地区的流量环比下降10.3%。同时，ChatGPT的独立访客(ke)数量（UV）下降了5.7%，访客(ke)在网站上花费的时间也(ye)下降了8.5%。

这是自2022年11月30日发布以来(lai)，ChatGPT首次(ci)出(chu)现(xian)流量负增(zeng)长(chang)。其(qi)实，ChatGPT增(zeng)长(chang)放缓(huan)的势头在2023年5月已经出(chu)现(xian)端倪，5月的增(zeng)长(chang)率仅为2.8%。

当时，一(yi)家AI Lab负责人(ren)告诉「甲子光(guang)年」，ChatGPT流量下滑10%，但真正的挑战(zhan)不在这里。“大部分(fen)人(ren)都是带着体验的目的，看看ChatGPT到底有多强大才去注册的，包括我也(ye)是。但这不意味着我会天天用它。除了做(zuo)一(yi)些简单的科普，或者给孩子写作文之(zhi)外(wai)，大部分(fen)人(ren)日常其(qi)实也(ye)不太会用到。”这位AI Lab负责人(ren)说。

莱特(te)凯普自己也(ye)在一(yi)次(ci)访谈中犀利点评(ping)ChatGPT：“人(ren)们玩(wan)儿过一(yi)会儿后就认为它并不是真正的工具，而更像一(yi)个玩(wan)具。”

更严峻的是，ChatGPT的烧钱速度同样出(chu)人(ren)意料。

当OpenAI的早期投(tou)资人(ren)埃(ai)隆·马(ma)斯克（Elon Musk）问到ChatGPT的成本时，奥尔特(te)曼给到的数据是“每次(ci)对话的平均费用为几美分(fen)”。2023年4月，国外(wai)一(yi)位分(fen)析师估算的数据则是每天的运营成本高达70万美元(yuan)。

2023年2月1日，OpenAI开始商(shang)业化(hua)探索，推出(chu)付费版本的ChatGPT Plus，定价每月20美元(yuan)，提供的增(zeng)值服务(wu)包括“高峰时段(duan)免排队、快速响应以及优先获(huo)得新功能”等。

如此看来(lai)，ChatGPT虽然备受(shou)喜爱，但在商(shang)业层(ceng)面(mian)，却算不上一(yi)个真正成功的产品。这些被ChatGPT烧掉的钱，就要用B端来(lai)填。

数据显示，截至2023年11月，已经有92%的500强企业以某种形式部署(shu)ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华永道(dao)和(he)Zapier均为OpenAI的早期客(ke)户。

C端流量与B端客(ke)户量的此消彼长(chang)之(zhi)间，OpenAI也(ye)逐渐由一(yi)家伟大而光(guang)荣的非营利性(xing)AGI实验室，加速转变为一(yi)家“平庸”的商(shang)业公(gong)司——他们或许能赚到很多钱，却没有造出(chu)能够说服用户的产品。

直到今天，让奥尔特(te)曼感到“像魔术(shu)一(yi)样”的GPT-4o面(mian)世。

只是GPT-4o真能治(zhi)好OpenAI的产品焦虑吗？答案或许并不清晰。

从模型能力(li)上来(lai)看，实时语音交互是GPT-4o在多模态方面(mian)最亮眼的进展。然而事实上，语音交互类产品并不新鲜。在可查阅的历(li)史中，AI语音交互类产品在商(shang)业化(hua)方面(mian)并没有太多成功的案例，苹果的Siri到今天都是一(yi)个十分(fen)鸡肋的功能。

而发布会上的GPT-4o，看起来(lai)依然是一(yi)个“有趣的玩(wan)具”。

从“无心插柳”的ChatGPT，到“只可远(yuan)观”的Sora、“虚晃一(yi)枪”的SearchGPT，再到今天的GPT-4o，都只是OpenAI向世界展示其(qi)AI能力(li)的“半成品”，而并非一(yi)个真正能够说服用户的商(shang)业产品，这在某种程度上限制了OpenAI用户的增(zeng)长(chang)。

当然，不可否认的是，从这次(ci)发布会的效果来(lai)看，GPT-4o或许会成为又一(yi)个成功的PR案例，被写入OpenAI的历(li)史。

（封面(mian)图来(lai)源：OpenAI）

发布于(yu)：上海市(shi)

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多