业界动态
免费,才是最强杀招,ChatGPT,音频,输出
2024-06-18 20:55:01
免费,才是最强杀招,ChatGPT,音频,输出

科技巨头(tou)之间(jian)的竞争,越来越不讲武德了(le)。

原本,OpenAI的“春季新品发布会”定(ding)于5月9号,结果硬生生拖到了(le)现在。

为什么(me)呢?因为谷歌明天开开发者大会……

就是要(yao)骑(qi)脸输出,不给(gei)友(you)商任何活路!

于是今天凌晨1点,山姆·奥特曼口中“就像魔法一样的东西”,终于揭开了(le)面纱。

不是大家(jia)想(xiang)象中的GPT-5,而是GPT-4的迭代版(ban)本,GPT-4o。

o是omni的缩写,源于拉丁语的omnis,意(yi)思是无所不在、无所不知、无所不能。

听起来神神叨叨的,颇有(you)点佛祖、上帝的味道。

GPT-4o,也就是全能大模型。

全能?这就很(hen)有(you)意(yi)思了(le)。

01强在哪里?

所谓全能,当然不是真的指全知全能。

至(zhi)少现在不可(ke)能。

如果人造“上帝”真的被造出来,我们所有(you)人都可(ke)以立刻躺平、混吃等死(si)了(le),统治世界or解放世界都在这家(jia)伙(huo)的一念(nian)之间(jian)。

目前的GPT-4o,能做到的是文字、图像、音频(pin)、视频(pin)任意(yi)组(zu)合的全模态。

OpenAI的原话是:GPT-4o是第(di)一个融合所有(you)模态的模型,我们只是触(chu)及到其能力的表面。

尽管只是表面,但也极其强大了(le)。

先看横向(xiang)测(ce)评(ping)。

简单总结就是:更快、更强、更便宜。

首先是效(xiao)率。GPT-4o 的处理速(su)度是 GPT-4 Turbo 的两倍,速(su)率限制提高了(le)五(wu)倍,最高达到1000万token/分钟,价格还降低(di)了(le)一半。

其次是性能。在所有(you)语言基准测(ce)试中,GPT-4o都比GPT-4更强大,还能在50多种语言之间(jian)无缝翻译。

然后是最重要(yao)的一点:多模态输入输出。

GPT-4o 能够处理文本、音频(pin)和图像的任意(yi)组(zu)合输入,并实时生成相应的输出与用户互动(dong)。

注(zhu)意(yi),是实时!实时!

下面再看看其具体表现。

发布会上,测(ce)试者对着手机(ji)说:我第(di)一次来直播(bo),有(you)点紧张。

ChatGPT立刻回答你可(ke)以深呼吸(xi)。

男子照办。

ChatGPT立刻又开玩笑道:你不是吸(xi)尘器吧,不要(yao)喘(chuan)。

当听到对方终于平稳(wen)呼吸(xi)时,它居然还会开口鼓励。

看到这,苹(ping)果手机(ji)用户很(hen)快就能察(cha)觉出有(you)啥不同了(le)。

我们此前用的Siri之类的语音助手,反馈慢倒还罢了(le),你还必须要(yao)等它说完,才(cai)能进行下一轮对话。

非(fei)常呆板,且浪费时间(jian)。

其实这也正常,它毕竟只是个很(hen)原始的程序。

之前我们与AI对话,都要(yao)经(jing)历(li)3个步骤:

1.人说话,AI将音频(pin)转成文本代码;

2.AI回答它自己翻译的这段文本;

3.将回复的内容转化成音频(pin)输出。

这就相当于一来一回的回合制,不论怎么(me)样都会有(you)延迟,现在业界最快的反应速(su)度是2秒。

别的先不说,至(zhi)少用户很(hen)难有(you)真实交流的沉浸感。

但用GPT-4o,平均反应时间(jian)只有(you)0.32秒,基本就是你刚(gang)问完、它立刻就能回答你,和真人聊天没啥区(qu)别。

更关键的是什么(me)?

因为人与人之间(jian)对话,是充满(man)了(le)各种即时反应的,比如嗯嗯啊啊各种预期助词,以及手势、停顿、咽口水等等。

但你过去与AI 聊天,却根本不会存(cun)在这些因素(su),即便AI回答得(de)再完美,你依(yi)然无法拥有(you)沉浸感。

而现在,你不仅能随时打断GPT-4o,它甚(shen)至(zhi)能根据你的语速(su)、语调、呼吸(xi)乃至(zhi)面部表情来判断你的情绪(xu),并依(yi)次表达出对应的情绪(xu)。

这就很(hen)Nice了(le)。

不仅仅只是语音对答,GPT-4o的文本、音频(pin)、视频(pin)所有(you)输入和输出,都由同一个神经(jing)网络处理。

也就是说,它在各种维度上,都能有(you)同样强大的表现。

简单来说,就是GPT在能看、能听、能说话方面,更加“通人性”了(le)。

它不一定(ding)真的懂情感这回事,但能够模仿(fang)。

现阶段而言,只要(yao)能模仿(fang)就够了(le),完全够投入商用了(le)。

以上种种,你觉得(de)意(yi)味着什么(me)?

意(yi)味着ChatGPT在交互性上,又做出了(le)巨大突破。

比如,你可(ke)以在睡前,要(yao)求GPT用女神的声音、舔狗的语气,讲故事、唱歌哄你入眠。

又比如,你可(ke)以把自己的日常资(zi)料(liao)发给(gei)GPT,让它根据每天的天气、突发事件(jian)等等状(zhuang)况,生成工作(zuo)、生活计划。

乃至(zhi)辅(fu)导小(xiao)孩写作(zuo)业等等等等……

千(qian)万不要(yao)小(xiao)看交互性,它的价值远超想(xiang)象。

02为什么(me)免费?

除了(le)功能强大,GPT-4o更让人关注(zhu)的是什么(me)?

免费!

不仅仅是 GPT-4o 免费,更刺激(ji)的是 GPT Store、Vision (包含代码解释(shi)器、联(lian)网功能等),都会陆续开放出来。

为了(le)让用户们用得(de)方便,新版(ban)ChatGPT还开放了(le)桌面端。

关于这一点,山姆·奥特曼专门发了(le)博客说明:

OpenAI的核心使命之一,就是免费为人类提供顶尖的AI工具,为世界创造各种利益,让所有(you)人从中受益。在未来,所有(you)人都能免费获得(de) GPT 的算(suan)力,可(ke)以使用、转售或捐赠。

你们之前批评(ping)我不开源,现在我直接免费,甚(shen)至(zhi)都不用注(zhu)册,还有(you)话说吗?

按照我们的商业逻辑来看,这不是纯纯的做慈善?

当然不是,至(zhi)少不完全是。

首先,新模型变(bian)小(xiao)了(le),运行成本大幅降低(di)。

前文提到过:GPT 4o处理速(su)度翻倍,价格只有(you)GPT 4 Turbo的一半。

原先输入、输出一百万token的价格是10、30美元,现在则只要(yao)5、15美元。

其次,是先舍(she)后得(de)的商业逻辑。

免费是有(you)限制的。

官方文档里都说了(le),免费用户目前每3个小(xiao)时只能使用10条(tiao)GPT-4o,用完了(le)就回落到GPT-3.5版(ban)本。

10条(tiao),够什么(me)用的?

想(xiang)继续玩?想(xiang)玩得(de)爽(shuang)?给(gei)我充钱!

只要(yao)20美刀/月,你就能成为尊贵的plus会员,每小(xiao)时能享用80条(tiao)GPT-4o!

这简直!太不划算(suan)了(le)!

就目前的情况而言、对绝大部分人而言,你只要(yao)不是无聊到什么(me)都去试着玩,每3小(xiao)时10条(tiao)内容完全是足够了(le)。

照OpenAI这么(me)搞,如今ChatGPT的忠实付费用户(原来免费的只能使用GPT-3.4),恐怕(pa)都不会充钱了(le)。

为什么(me)OpenAI 要(yao)承担(dan)丢失付费会员的风险,去给(gei)全民(min)提供免费服务?

其实,我们的目光可(ke)以放长远一点。

想(xiang)想(xiang)看,人人都能免费用上高质量的AI,这意(yi)味着什么(me)?

你如果悲观地去看,这很(hen)可(ke)能对现在社会的分工结构造成重大冲击,造成广泛的失业潮。

看到这里,别的不敢说,我们至(zhi)少能确定(ding)一件(jian)事:除非(fei)自己感兴趣,以后的小(xiao)孩都不用再学(xue)英语了(le)。

GPT-4o完全可(ke)以做到各种口译、同声传译,甚(shen)至(zhi)还带感情、带理解。

除此之外,大量的普通家(jia)庭(ting)教师、程序员、设计师等等,基本都会被取代。

这是不可(ke)避(bi)免的事。

但就像前几次技术革(ge)命一样,在一些行业消亡的同时,一定(ding)会有(you)新的财富风口出现,整个社会的财富总量必然是增加的。

乐观点看,就是另一回事。

03财富大爆炸

《易经(jing)》“乾”卦“用九”:见群龙无首,吉。

王(wang)阳明也曾说:人人心中有(you)仲尼(ni)。心之良知之谓圣。

真正伟大的时代,应该是人人平等、人人如龙、人人成圣的。

从古至(zhi)今,这都只能是幻想(xiang),但如果能善用AI、善用工具,我们未必不能接近(jin)这种境界。

其实从GPT-3.5→GPT-4→GPT-4o,我们能很(hen)明显概念(nian)感受到,OpenAI想(xiang)干什么(me):

他们要(yao)让GPT这个人造大脑,越来越符合“人”的标(biao)准。

人是什么(me)?

人不仅仅是劳动(dong)力,不论是什么(me)时候、用什么(me)工具,人才(cai)是创造财富的主体。

随着多模态越来越完善,现有(you)的部分行业将会被怎样改变(bian)?

我们的主要(yao)关注(zhu)点应该在娱(yu)乐方面。

因为物质世界的体力劳动(dong)必然与人类越来越远,人类创造财富的方向(xiang)肯定(ding)将加速(su)集中在精神方面。

从之前投资(zi)De的举动(dong)可(ke)以看出,OpenAI早就有(you)意(yi)把AI技术引入到影视创作(zuo)领域。

即便他们不这么(me)干,其他的影视公(gong)司也一定(ding)会干。

因为未来的趋势就是——“交互式传媒”。

你可(ke)以把这种模式,理解为短视频(pin),每个人都是创作(zuo)者,没有(you)谁更专业一说。

各种短视频(pin)平台上,如今已经(jing)充斥着大量AI制造的内容。以前我们还能看得(de)出来,现在越来越逼真。

而以后,只要(yao)你善用能模仿(fang)人情感的多模态大模型,创造出的内容也将彻底脱离(li)“机(ji)械(xie)感”。

每个人都是最佳导演,一天拍(pai)十几部大片都没问题。

想(xiang)要(yao)出圈,就看谁的点子更有(you)新意(yi),更迎合受众口味。

与之相对的,各种影视公(gong)司,包括现在的一大堆流量明星,都将没有(you)任何发展空(kong)间(jian)。

未来,能存(cun)活下来的,只有(you)平台,和无数个个人。

除了(le)影视之外,包括音乐、动(dong)漫、游戏等任何具备消费价值的娱(yu)乐领域,都将变(bian)得(de)一样:

去中心化。

每个人都是完美的音乐家(jia)、漫画家(jia)、游戏设计师,只要(yao)你有(you)足够的耐(nai)心。

你能想(xiang)象,这些将催化多大的市场吗?

以游戏为例,到2025年,全球将有(you)35.3亿游戏玩家(jia)。数十亿人,有(you)多少千(qian)奇百怪的点子?

以前,99%人限于技术,只是单纯的玩家(jia),属于被收割者,只有(you)游戏公(gong)司赚钱。

从市场的角度考虑(lu),这个发展效(xiao)率是非(fei)常低(di)下的。

以后,就相当于是这35亿人相互买单,金钱流通速(su)度何止提升10倍!?

再比如社交媒体。

从前是没有(you)技术,当网友(you)分享他的游戏、电影、音乐交互体验后,其他用户除了(le)评(ping)论就没啥后续了(le)。

但以后,我们都能在此基础上,让AI定(ding)制自己的二次体验,不论是语音、视频(pin)还是漫画形式,与其他人分享。

然后其他人看到了(le),再定(ding)制,再分享……

就这样病毒式传播(bo)。

这些描述,很(hen)像去年底炒作(zuo)的Web3.0概念(nian)。

它的目的,是创造一个去中心化、交互式的互联(lian)网世界,打破已经(jing)见顶的互联(lian)网现有(you)桎梏。

它的驱动(dong)力,就是多模态大模型、乃至(zhi)以后真正完善五(wu)感的更高级AI。

拥有(you)五(wu)感的GPT,不仅仅是一种技术进步,更是现代商业社会的一次彻底的娱(yu)乐、消费、社交革(ge)命。

总而言之,让每个人都能免费使用顶级AI,就相当于把生产力赋能给(gei)每个人,每个人的价值将进一步凸显,整个互联(lian)网世界也将创造出更大的价值。

等到你发现其中的财富效(xiao)应,乃至(zhi)未来大多数人或许都要(yao)在这样的大环境中生活……

等到AI真正成为每个人创造财富的重要(yao)工具,3小(xiao)时使用10条(tiao)GPT-4o,你还觉得(de)够吗?

每个月20美刀的会员费,你还觉得(de)贵吗?

就算(suan)再贵十倍,你也心甘情愿(yuan)抢着买!

我们真正应该担(dan)心的,不应该是这点鸡毛蒜皮的事,而是:AI 科技的推进速(su)度太快,你有(you)没有(you)意(yi)识(shi)到要(yao)去适(shi)应新时代。

千(qian)万不要(yao)做落后的那一批人。

发布于:广东省
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7