业界动态
澳门三中三码精准100%微信号-免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT
2024-06-02 04:28:58
澳门三中三码精准100%微信号-免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

又是一(yi)次(ci)成功的PR动(dong)作。

作者 | 刘杨(yang)楠(nan)

编辑 | 王博 栗子

5月14日凌晨1点,继OpenAI在AI搜索上“虚晃一(yi)枪”之(zhi)后,让萨姆(mu)·奥尔特(te)曼(Sam Altman)感觉“像魔术(shu)一(yi)样”的新模型终于(yu)浮出(chu)水(shui)面(mian)。

不是GPT-5,不是AI搜索,而是最新旗舰生成式AI模型GPT-4o!

GPT-4o(“o”代表“omni”,意为“全能的”)是迈向更自然的人(ren)机交互的一(yi)步——它接受(shou)文本、音频和(he)图像的任意组合作为输入,并生成文本、音频和(he)图像的任意组合输出(chu)。

整场发布会时长(chang)仅30分(fen)钟,OpenAI CTO米(mi)拉·穆拉蒂(Mira Murati)带来(lai)主题演讲。“这是我们第一(yi)次(ci)在易用性(xing)方面(mian)真正迈出(chu)一(yi)大步。”穆拉蒂在公(gong)司旧金山总部的现(xian)场演示中说道(dao), “这种互动(dong)变得更加自然,也(ye)更加容易。”

值得注意的是,此次(ci)发布会OpenAI CEO萨姆(mu)·奥尔特(te)曼并未现(xian)身(shen)。在OpenAI官网披露的GPT-4o贡献者中,依然没有看到OpenAI首席科学家伊利亚·苏茨克维尔(Ilya Sutskever)的身(shen)影。

01.“GPT-4o是我们最好的模型”

整场发布会的主角,就是OpenAI最新旗舰生成式AI模型GPT-4o。

OpenAI官网博客(ke)显示,GPT-4o(“o”代表“omni”)是迈向更自然的人(ren)机交互的一(yi)步。它接受(shou)文本、音频和(he)图像的任意组合作为输入,并生成文本、音频和(he)图像的任意组合输出(chu)。

相比今年2月的Sora, OpenAI此次(ci)发布显得更有诚意——GPT-4o将免费提供给所有用户使用,Plus用户则可以享受(shou)到5倍的调用额度。

穆拉蒂表示,GPT-4o将提供与GPT-4同等水(shui)平的智能。

同时,GPT-4o的运行速度大大提升,最大亮点在于(yu)其(qi)语音交互模式采用了全新技术(shu),让聊天机器(qi)人(ren)对话的响应速度大幅提升。OpenAI官网博客(ke)显示,GPT-4o在谈话中对音频输入的平均响应时间为320毫秒,最短的响应时间为232毫秒,与人(ren)类的响应时间相似。

GPT-4o还有超高的“语言天赋(fu)”,能支持50种语言,并显着提高了非英语语言的性(xing)能,包括改进分(fen)词器(qi)以更好地压(ya)缩其(qi)中的许多语言:

根据传统基准测试,GPT-4o在文本、推理和(he)编码智能方面(mian)实现(xian)了GPT-4 Turbo级别的性(xing)能,同时在多语言、音频和(he)视觉功能上设置了新的高水(shui)位线。

开发人(ren)员(yuan)现(xian)在可以在API中访问GPT-4o。与GPT-4 Turbo相比,GPT-4o速度提高2倍,价格降低一(yi)半,速率限制提高5倍。

在现(xian)场演示环节,GPT-4o更是展现(xian)了各类花式操作——它能根据演示者的实时要求变换语音语调,演绎话剧;能实时读图;甚(shen)至还跟演示者们开起玩(wan)笑,唱起歌(ge)。

此外(wai),OpenAI还发布了桌(zhuo)面(mian)版的ChatGPT和(he)新的用户界面(mian)。

用户可以向ChatGPT(由 GPT-4o 提供支持)提出(chu)问题,并在ChatGPT回答时打断它。OpenAI表示,该模型提供“实时”响应能力(li),甚(shen)至可以感知用户声音中的情感,从而生成“一(yi)系列不同情感风格”的声音(包括唱歌(ge))。

GPT-4o还升级了ChatGPT的视觉能力(li)。给定一(yi)张照片或一(yi)个桌(zhuo)面(mian)屏幕,GPT-4o可以快速回答相关问题,主题范围包括“此软件代码中发生了什么?”到“这个人(ren)穿什么牌(pai)子的衬衫?”

“我们认识到这些模型正变得越来(lai)越复杂,” 穆拉蒂说道(dao),“但我们希望用户与人(ren)工智能模型的交互体验能够更加自然、轻松,让用户可以将注意力(li)完全集中在与模型的协作上,而无需在意界面(mian)本身(shen)。”

穆拉蒂还透露,未来(lai)几周内,GPT-4o将分(fen)阶段(duan)集成至OpenAI的各个产品之(zhi)中,而且会在ChatGPT Plus中推出(chu)新版语音模式GPT-4o的alpha版。

OpenAI研(yan)究员(yuan)威廉·费达斯(William Fedus)表示:“GPT-4o是我们最先进的新前沿模型。我们一(yi)直在LMSys arena上测试一(yi)个版本im-also-a-good-gpt2-chatbot。”

“这不仅是世界上最好的模型,而且可以在ChatGPT中免费使用,这对于(yu)前沿模型来(lai)说是前所未有的。”费达斯补充道(dao),“我们发现(xian)在更难的提示集上——特(te)别是编码——存在更大的差距:GPT-4o比我们之(zhi)前的最佳模型实现(xian)了+100 ELO。”

奥尔特(te)曼也(ye)在X上表示:“GPT-4o是我们最好的模型。”

OpenAI此次(ci)发布几乎在想尽办法“讨好”用户,在“交互体验”上下足了功夫,直接免费开放使用更让用户感受(shou)到了OpenAI的诚意。

但「甲子光(guang)年」发现(xian),在这种诚意背后,这家已被捧上神坛的AI创(chuang)业公(gong)司,正深陷(xian)于(yu)某种焦虑之(zhi)中。

02. OpenAI的产品焦虑

虽然奥尔特(te)曼今天并未到场,但5月11日,他便(bian)亲自下场预(yu)告。可是,翻翻评(ping)论区,网友们的关注点似乎有点儿跑偏(pian)。

有人(ren)喊话奥尔特(te)曼让OpenAI首席科学家伊利亚回归:

有人(ren)关心GPT-5到底何时发布:

伊利亚的去向和(he)GPT-5的发布是OpenAI留给外(wai)界的两大谜(mi)题,也(ye)是外(wai)界最关心的两大问题。

2024年,人(ren)们对OpenAI最大的期待(dai)便(bian)是GPT-5。然而,每当奥尔特(te)曼在访谈中被问及GPT-5相关进度时,却总是支支吾(wu)吾(wu)、讳(hui)莫如深。奥尔特(te)曼在普罗大众心中的画像也(ye)逐渐从一(yi)位开天辟(pi)地的怪(guai)力(li)少年,转变为一(yi)个在各国政客(ke)间长(chang)袖善舞,在各种场合大打太极的“成熟企业家”。

更致命的是,ChatGPT和(he)GPT-4之(zhi)后,OpenAI似乎一(yi)直没能推出(chu)相同重量级的AI产品,这些都在不断消磨外(wai)界对OpenAI的期待(dai)与信心。

今年2月,OpenAI发布Sora——1份技术(shu)报告、32篇引用论文、一(yi)些画面(mian)堪比电影镜头的demo和(he)1个故(gu)作高深的“世界模拟器(qi)”概念就是OpenAI给出(chu)的全部,没有技术(shu)论文,也(ye)没有可公(gong)开体验的产品入口(kou)。

「甲子光(guang)年」曾向多位AI从业者提问:“ChatGPT和(he)Sora,谁带给你的震撼更大?”各位受(shou)访人(ren)几乎不约而同地回答:“Sora有震撼,但没ChatGPT的震撼大。”

造成这种感官差异的直接原因是,ChatGPT能直接体验,但Sora不能。虽然ChatGPT也(ye)会犯一(yi)些荒唐的错误,但真实的交流感带给人(ren)们的震撼,远(yuan)远(yuan)大于(yu)只可远(yuan)观、不能上手体验的Sora。甚(shen)至不少声音开始猜测,Sora精美的Demo或许是工程师在背后屡次(ci)微调的结果,Sora实时交互的结果“可能远(yuan)不如此”。

对于(yu)外(wai)界的猜测、质疑(yi),OpenAI并未回应,而是迅速扔(reng)出(chu)下一(yi)个“靶子”——AI搜索。

过去一(yi)周,外(wai)媒不断有消息传出(chu)OpenAI将推出(chu)AI搜索产品,更有媒体猜测,谷(gu)歌(ge)一(yi)年一(yi)度的I/O大会即将于(yu)5月14日举办,而OpenAI此举是针对谷(gu)歌(ge)的精准狙(ju)击。

OpenAI Search 测试界面(mian),图片来(lai)源:赛博禅心

不过,AI搜索的热度炒了半天,所谓的AI搜索产品最终只是虚晃一(yi)枪。

昆仑万维董事长(chang)兼CEO方汉近期在一(yi)次(ci)直播中直言:“我觉得搜索引擎对于(yu)OpenAI的用户增(zeng)长(chang)也(ye)不会有根本性(xing)的变化(hua)。”有数据显示,从去年5月开始,ChatGPT的C端增(zeng)长(chang)便(bian)逐渐触顶(ding)。

而产品焦虑一(yi)日不解,OpenAI距离(li)“伟大的公(gong)司”就永远(yuan)有一(yi)墙之(zhi)隔。

03. GPT-4o能治(zhi)好吗?

今天再次(ci)复盘ChatGPT的成功会发现(xian),这是一(yi)次(ci)不可复现(xian)的“无心插柳”。

2022年中,OpenAI开始训练(lian)GPT-4。半年后的11月30日,OpenAI发布ChatGPT,全球各界都为之(zhi)颤动(dong)。

OpenAI内部曾对是否发布ChatGPT有过很长(chang)一(yi)段(duan)时间争论,因为谁都无法100%确认这是正确的事情。

彼时,OpenAI对自己的定位是一(yi)家为开发人(ren)员(yuan)和(he)企业构(gou)建工具的公(gong)司,而非直接面(mian)向普罗大众。因此,OpenAI要面(mian)临的核心挑战(zhan),是ChatGPT的使用门槛是否足够低,以至于(yu)能让完全不懂技术(shu)的人(ren)用起来(lai)。

在此之(zhi)前发布的视觉模型DaLL-E已经让OpenAI尝到了甜头。但ChatGPT能复制DALL-E的成功吗?

奥尔特(te)曼是名副其(qi)实的“冒险(xian)派”,他鼓励公(gong)司发布ChatGPT,“尝试一(yi)下”。在他看来(lai),用户和(he)模型进行文本形式的交互会产生一(yi)些很重要的个性(xing)化(hua)结果。

很快,用户的热情证明,这次(ci)试验无比成功。从2022年11月上线的第一(yi)个完整月(2022年11月)开始,到12月这一(yi)数字达到了2.66亿人(ren)次(ci),月环比增(zeng)长(chang)了近75%。到2023年1月,总访问量翻了一(yi)番多,达到6.16亿人(ren)次(ci),2月就首次(ci)突破10亿人(ren)次(ci)大关。

这突如其(qi)来(lai)的成功,在OpenAI的意料之(zhi)外(wai)。

“我们并没有认为GPT-3系列模型已经跨越了将其(qi)应用于(yu)消费者或企业的门槛,本以为GPT-4会成为第一(yi)个跨越这道(dao)门槛的模型,所以我们的很多计划和(he)预(yu)测都是围绕2023年3月发布GPT-4来(lai)安排的。”OpenAI COO 布拉德·莱特(te)凯普(Brad Lightcap)此前在英伟达2024 GTC大会上分(fen)享道(dao)。

按照莱特(te)凯普的说法,OpenAI用了6个月来(lai)适应ChatGPT的爆(bao)炸性(xing)增(zeng)长(chang),并确保公(gong)司有足够的GPU来(lai)满足用户的需求。

直到2023年后半年,OpenAI开始感受(shou)到了来(lai)自行业一(yi)线的真实需求。OpenAI曾公(gong)布,截止2023年8月,80%的财富500强公(gong)司已采用ChatGPT。80%的统计数据是指(zhi)拥有注册ChatGPT帐户的财富500强公(gong)司的百分(fen)比,由与企业电子邮件域关联的帐户确定。

于(yu)是,OpenAI迅速行动(dong)。2023年8月28日,OpenAI推出(chu)ChatGPT Enterprise,正式进军企业市(shi)场。它提供企业级安全和(he)隐私、无限的高速GPT-4访问、用于(yu)处理更长(chang)输入的更长(chang)上下文窗口(kou)、高级数据分(fen)析功能、自定义选项(xiang)等等。

这是一(yi)个很微妙(miao)的时间点——ChatGPT流量见(jian)顶(ding),开始走下坡路。

根据第三方网站SimilarWeb的监测数据,2023年6月ChatGPT的网站与移动(dong)客(ke)户端的全球流量(PV)环比下降9.7%,美国地区的流量环比下降10.3%。同时,ChatGPT的独立访客(ke)数量(UV)下降了5.7%,访客(ke)在网站上花费的时间也(ye)下降了8.5%。

这是自2022年11月30日发布以来(lai),ChatGPT首次(ci)出(chu)现(xian)流量负增(zeng)长(chang)。其(qi)实,ChatGPT增(zeng)长(chang)放缓(huan)的势头在2023年5月已经出(chu)现(xian)端倪,5月的增(zeng)长(chang)率仅为2.8%

当时,一(yi)家AI Lab负责人(ren)告诉「甲子光(guang)年」,ChatGPT流量下滑10%,但真正的挑战(zhan)不在这里 。“大部分(fen)人(ren)都是带着体验的目的,看看ChatGPT到底有多强大才去注册的,包括我也(ye)是。但这不意味着我会天天用它。除了做(zuo)一(yi)些简单的科普,或者给孩子写作文之(zhi)外(wai),大部分(fen)人(ren)日常其(qi)实也(ye)不太会用到。”这位AI Lab负责人(ren)说。

莱特(te)凯普自己也(ye)在一(yi)次(ci)访谈中犀利点评(ping)ChatGPT:“人(ren)们玩(wan)儿过一(yi)会儿后就认为它并不是真正的工具,而更像一(yi)个玩(wan)具。”

更严峻的是,ChatGPT的烧钱速度同样出(chu)人(ren)意料。

当OpenAI的早期投(tou)资人(ren)埃(ai)隆·马(ma)斯克(Elon Musk)问到ChatGPT的成本时,奥尔特(te)曼给到的数据是“每次(ci)对话的平均费用为几美分(fen)”。2023年4月,国外(wai)一(yi)位分(fen)析师估算的数据则是每天的运营成本高达70万美元(yuan)。

2023年2月1日,OpenAI开始商(shang)业化(hua)探索,推出(chu)付费版本的ChatGPT Plus,定价每月20美元(yuan),提供的增(zeng)值服务(wu)包括“高峰时段(duan)免排队、快速响应以及优先获(huo)得新功能”等。

如此看来(lai),ChatGPT虽然备受(shou)喜爱,但在商(shang)业层(ceng)面(mian),却算不上一(yi)个真正成功的产品。这些被ChatGPT烧掉的钱,就要用B端来(lai)填。

数据显示,截至2023年11月,已经有92%的500强企业以某种形式部署(shu)ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华永道(dao)和(he)Zapier均为OpenAI的早期客(ke)户。

C端流量与B端客(ke)户量的此消彼长(chang)之(zhi)间,OpenAI也(ye)逐渐由一(yi)家伟大而光(guang)荣的非营利性(xing)AGI实验室,加速转变为一(yi)家“平庸”的商(shang)业公(gong)司——他们或许能赚到很多钱,却没有造出(chu)能够说服用户的产品。

直到今天,让奥尔特(te)曼感到“像魔术(shu)一(yi)样”的GPT-4o面(mian)世。

只是GPT-4o真能治(zhi)好OpenAI的产品焦虑吗?答案或许并不清晰。

从模型能力(li)上来(lai)看,实时语音交互是GPT-4o在多模态方面(mian)最亮眼的进展。然而事实上,语音交互类产品并不新鲜。在可查阅的历(li)史中,AI语音交互类产品在商(shang)业化(hua)方面(mian)并没有太多成功的案例,苹果的Siri到今天都是一(yi)个十分(fen)鸡肋的功能。

而发布会上的GPT-4o,看起来(lai)依然是一(yi)个“有趣的玩(wan)具”。

从“无心插柳”的ChatGPT,到“只可远(yuan)观”的Sora、“虚晃一(yi)枪”的SearchGPT,再到今天的GPT-4o,都只是OpenAI向世界展示其(qi)AI能力(li)的“半成品”,而并非一(yi)个真正能够说服用户的商(shang)业产品,这在某种程度上限制了OpenAI用户的增(zeng)长(chang)。

当然,不可否认的是,从这次(ci)发布会的效果来(lai)看,GPT-4o或许会成为又一(yi)个成功的PR案例,被写入OpenAI的历(li)史。

(封面(mian)图来(lai)源:OpenAI)

发布于(yu):上海市(shi)
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7