澳门一码精准必中大公开241期-免费，才是最强杀招,ChatGPT,音频,输出20240603-业界动态-szhfh.com

澳门一码精准必中大公开241期-免费，才是最强杀招,ChatGPT,音频,输出

2024-06-03 01:18:10

澳门一码精准必中大公开241期-免费，才是最强杀招,ChatGPT,音频,输出

科技巨头之间的竞争，越来越不讲武(wu)德(de)了。

原(yuan)本，OpenAI的“春(chun)季新品发布(bu)会”定于5月(yue)9号，结果硬生生拖到了现在。

为什么呢？因为谷歌明天(tian)开开发者大(da)会……

就(jiu)是要骑脸输出(chu)，不给友(you)商任何活(huo)路！

于是今天(tian)凌晨1点，山姆·奥特曼口(kou)中“就(jiu)像魔法一样的东西”，终于揭开了面纱。

不是大(da)家(jia)想象中的GPT-5，而是GPT-4的迭代版本，GPT-4o。

o是omni的缩写，源于拉丁语的omnis，意思是无所不在、无所不知、无所不能。

听起来神神叨叨的，颇有点佛祖、上帝的味(wei)道。

GPT-4o，也就(jiu)是全能大(da)模型。

全能？这就(jiu)很有意思了。

01强在哪里(li)？

所谓全能，当然不是真(zhen)的指全知全能。

至少现在不可能。

如果人造“上帝”真(zhen)的被(bei)造出(chu)来，我们所有人都可以立(li)刻躺平、混吃等死了，统治(zhi)世界(jie)or解放世界(jie)都在这家(jia)伙的一念之间。

目前的GPT-4o，能做(zuo)到的是文字、图(tu)像、音频(pin)、视(shi)频(pin)任意组合的全模态。

OpenAI的原(yuan)话是：GPT-4o是第一个融合所有模态的模型，我们只是触及到其能力的表面。

尽管只是表面，但也极其强大(da)了。

先(xian)看横向测评。

简单(dan)总结就(jiu)是：更快、更强、更便宜(yi)。

首(shou)先(xian)是效率(lu)。GPT-4o 的处理速度是 GPT-4 Turbo 的两倍，速率(lu)限制(zhi)提高(gao)了五倍，最(zui)高(gao)达到1000万token/分钟(zhong)，价格还降低了一半。

其次是性(xing)能。在所有语言基准测试中，GPT-4o都比GPT-4更强大(da)，还能在50多种语言之间无缝翻译。

然后是最(zui)重要的一点：多模态输入输出(chu)。

GPT-4o 能够(gou)处理文本、音频(pin)和图(tu)像的任意组合输入，并实时生成相应的输出(chu)与用户互动。

注(zhu)意，是实时！实时！

下面再看看其具体(ti)表现。

发布(bu)会上，测试者对着手机说：我第一次来直播，有点紧张。

ChatGPT立(li)刻回答：你可以深(shen)呼(hu)吸。

男子照办(ban)。

ChatGPT立(li)刻又开玩笑道：你不是吸尘器吧，不要喘。

当听到对方(fang)终于平稳呼(hu)吸时，它居然还会开口(kou)鼓励。

看到这，苹果手机用户很快就(jiu)能察(cha)觉出(chu)有啥不同了。

我们此前用的Siri之类的语音助手，反馈慢倒还罢了，你还必须(xu)要等它说完(wan)，才能进(jin)行下一轮对话。

非常呆板，且浪(lang)费时间。

其实这也正常，它毕竟只是个很原(yuan)始的程序。

之前我们与AI对话，都要经历3个步骤：

1.人说话，AI将音频(pin)转成文本代码；

2.AI回答它自己翻译的这段文本；

3.将回复的内容转化成音频(pin)输出(chu)。

这就(jiu)相当于一来一回的回合制(zhi)，不论怎么样都会有延迟，现在业界(jie)最(zui)快的反应速度是2秒(miao)。

别的先(xian)不说，至少用户很难有真(zhen)实交流的沉浸感。

但用GPT-4o，平均(jun)反应时间只有0.32秒(miao)，基本就(jiu)是你刚问完(wan)、它立(li)刻就(jiu)能回答你，和真(zhen)人聊天(tian)没(mei)啥区(qu)别。

更关键的是什么？

因为人与人之间对话，是充满了各种即时反应的，比如嗯嗯啊(a)啊(a)各种预期助词，以及手势、停(ting)顿、咽口(kou)水等等。

但你过去与AI 聊天(tian)，却根本不会存在这些因素，即便AI回答得再完(wan)美，你依(yi)然无法拥有沉浸感。

而现在，你不仅能随时打断GPT-4o，它甚(shen)至能根据你的语速、语调、呼(hu)吸乃至面部表情来判断你的情绪，并依(yi)次表达出(chu)对应的情绪。

这就(jiu)很Nice了。

不仅仅只是语音对答，GPT-4o的文本、音频(pin)、视(shi)频(pin)所有输入和输出(chu)，都由同一个神经网络(luo)处理。

也就(jiu)是说，它在各种维度上，都能有同样强大(da)的表现。

简单(dan)来说，就(jiu)是GPT在能看、能听、能说话方(fang)面，更加“通人性(xing)”了。

它不一定真(zhen)的懂情感这回事，但能够(gou)模仿。

现阶段而言，只要能模仿就(jiu)够(gou)了，完(wan)全够(gou)投入商用了。

以上种种，你觉得意味(wei)着什么？

意味(wei)着ChatGPT在交互性(xing)上，又做(zuo)出(chu)了巨大(da)突破。

比如，你可以在睡前，要求GPT用女神的声音、舔狗(gou)的语气，讲故事、唱歌哄你入眠。

又比如，你可以把自己的日常资料发给GPT，让它根据每天(tian)的天(tian)气、突发事件等等状(zhuang)况，生成工作(zuo)、生活(huo)计划。

乃至辅导小孩写作(zuo)业等等等等……

千万不要小看交互性(xing)，它的价值远超想象。

02为什么免费?

除(chu)了功能强大(da)，GPT-4o更让人关注(zhu)的是什么？

免费！

不仅仅是 GPT-4o 免费，更刺激(ji)的是 GPT Store、Vision （包(bao)含代码解释器、联网功能等），都会陆续开放出(chu)来。

为了让用户们用得方(fang)便，新版ChatGPT还开放了桌面端。

关于这一点，山姆·奥特曼专门发了博客说明：

OpenAI的核心使命之一，就(jiu)是免费为人类提供(gong)顶尖的AI工具，为世界(jie)创造各种利益，让所有人从中受益。在未来，所有人都能免费获得 GPT 的算(suan)力，可以使用、转售或捐赠。

你们之前批评我不开源，现在我直接免费，甚(shen)至都不用注(zhu)册，还有话说吗？

按照我们的商业逻辑来看，这不是纯(chun)纯(chun)的做(zuo)慈善？

当然不是，至少不完(wan)全是。

首(shou)先(xian)，新模型变小了，运行成本大(da)幅降低。

前文提到过：GPT 4o处理速度翻倍，价格只有GPT 4 Turbo的一半。

原(yuan)先(xian)输入、输出(chu)一百万token的价格是10、30美元(yuan)，现在则只要5、15美元(yuan)。

其次，是先(xian)舍后得的商业逻辑。

免费是有限制(zhi)的。

官方(fang)文档里(li)都说了，免费用户目前每3个小时只能使用10条GPT-4o，用完(wan)了就(jiu)回落(luo)到GPT-3.5版本。

10条，够(gou)什么用的？

想继续玩？想玩得爽？给我充钱！

只要20美刀/月(yue)，你就(jiu)能成为尊贵(gui)的plus会员，每小时能享用80条GPT-4o！

这简直！太不划算(suan)了！

就(jiu)目前的情况而言、对绝大(da)部分人而言，你只要不是无聊到什么都去试着玩，每3小时10条内容完(wan)全是足够(gou)了。

照OpenAI这么搞，如今ChatGPT的忠实付费用户（原(yuan)来免费的只能使用GPT-3.4），恐怕都不会充钱了。

为什么OpenAI 要承担丢失付费会员的风险，去给全民(min)提供(gong)免费服(fu)务？

其实，我们的目光(guang)可以放长远一点。

想想看，人人都能免费用上高(gao)质量的AI，这意味(wei)着什么？

你如果悲观地去看，这很可能对现在社会的分工结构造成重大(da)冲击，造成广泛的失业潮(chao)。

看到这里(li)，别的不敢(gan)说，我们至少能确定一件事：除(chu)非自己感兴趣，以后的小孩都不用再学英语了。

GPT-4o完(wan)全可以做(zuo)到各种口(kou)译、同声传(chuan)译，甚(shen)至还带感情、带理解。

除(chu)此之外(wai)，大(da)量的普通家(jia)庭教师、程序员、设计师等等，基本都会被(bei)取代。

这是不可避免的事。

但就(jiu)像前几次技术革命一样，在一些行业消亡的同时，一定会有新的财富风口(kou)出(chu)现，整个社会的财富总量必然是增加的。

乐观点看，就(jiu)是另(ling)一回事。

03财富大(da)爆炸

《易经》“乾”卦“用九(jiu)”：见(jian)群(qun)龙无首(shou)，吉。

王阳明也曾说：人人心中有仲尼。心之良知之谓圣。

真(zhen)正伟大(da)的时代，应该(gai)是人人平等、人人如龙、人人成圣的。

从古至今，这都只能是幻想，但如果能善用AI、善用工具，我们未必不能接近这种境(jing)界(jie)。

其实从GPT-3.5→GPT-4→GPT-4o，我们能很明显概念感受到，OpenAI想干什么：

他们要让GPT这个人造大(da)脑，越来越符合“人”的标准。

人是什么？

人不仅仅是劳动力，不论是什么时候、用什么工具，人才是创造财富的主体(ti)。

随着多模态越来越完(wan)善，现有的部分行业将会被(bei)怎样改变？

我们的主要关注(zhu)点应该(gai)在娱乐方(fang)面。

因为物质世界(jie)的体(ti)力劳动必然与人类越来越远，人类创造财富的方(fang)向肯定将加速集中在精神方(fang)面。

从之前投资De的举(ju)动可以看出(chu)，OpenAI早就(jiu)有意把AI技术引入到影视(shi)创作(zuo)领(ling)域。

即便他们不这么干，其他的影视(shi)公(gong)司也一定会干。

因为未来的趋势就(jiu)是——“交互式传(chuan)媒”。

你可以把这种模式，理解为短视(shi)频(pin)，每个人都是创作(zuo)者，没(mei)有谁更专业一说。

各种短视(shi)频(pin)平台上，如今已经充斥着大(da)量AI制(zhi)造的内容。以前我们还能看得出(chu)来，现在越来越逼真(zhen)。

而以后，只要你善用能模仿人情感的多模态大(da)模型，创造出(chu)的内容也将彻底脱离“机械感”。

每个人都是最(zui)佳导演(yan)，一天(tian)拍十几部大(da)片都没(mei)问题。

想要出(chu)圈(quan)，就(jiu)看谁的点子更有新意，更迎合受众口(kou)味(wei)。

与之相对的，各种影视(shi)公(gong)司，包(bao)括现在的一大(da)堆流量明星，都将没(mei)有任何发展空间。

未来，能存活(huo)下来的，只有平台，和无数个个人。

除(chu)了影视(shi)之外(wai)，包(bao)括音乐、动漫、游戏等任何具备消费价值的娱乐领(ling)域，都将变得一样：

去中心化。

每个人都是完(wan)美的音乐家(jia)、漫画家(jia)、游戏设计师，只要你有足够(gou)的耐(nai)心。

你能想象，这些将催化多大(da)的市场吗？

以游戏为例，到2025年，全球(qiu)将有35.3亿(yi)游戏玩家(jia)。数十亿(yi)人，有多少千奇(qi)百怪的点子？

以前，99%人限于技术，只是单(dan)纯(chun)的玩家(jia)，属于被(bei)收割者，只有游戏公(gong)司赚钱。

从市场的角度考虑，这个发展效率(lu)是非常低下的。

以后，就(jiu)相当于是这35亿(yi)人相互买单(dan)，金钱流通速度何止提升(sheng)10倍！？

再比如社交媒体(ti)。

从前是没(mei)有技术，当网友(you)分享他的游戏、电(dian)影、音乐交互体(ti)验(yan)后，其他用户除(chu)了评论就(jiu)没(mei)啥后续了。

但以后，我们都能在此基础上，让AI定制(zhi)自己的二次体(ti)验(yan)，不论是语音、视(shi)频(pin)还是漫画形式，与其他人分享。

然后其他人看到了，再定制(zhi)，再分享……

就(jiu)这样病(bing)毒式传(chuan)播。

这些描述，很像去年底炒作(zuo)的Web3.0概念。

它的目的，是创造一个去中心化、交互式的互联网世界(jie)，打破已经见(jian)顶的互联网现有桎梏。

它的驱动力，就(jiu)是多模态大(da)模型、乃至以后真(zhen)正完(wan)善五感的更高(gao)级AI。

拥有五感的GPT，不仅仅是一种技术进(jin)步，更是现代商业社会的一次彻底的娱乐、消费、社交革命。

总而言之，让每个人都能免费使用顶级AI，就(jiu)相当于把生产(chan)力赋能给每个人，每个人的价值将进(jin)一步凸显，整个互联网世界(jie)也将创造出(chu)更大(da)的价值。

等到你发现其中的财富效应，乃至未来大(da)多数人或许都要在这样的大(da)环(huan)境(jing)中生活(huo)……

等到AI真(zhen)正成为每个人创造财富的重要工具，3小时使用10条GPT-4o，你还觉得够(gou)吗？

每个月(yue)20美刀的会员费，你还觉得贵(gui)吗？

就(jiu)算(suan)再贵(gui)十倍，你也心甘情愿抢着买！

我们真(zhen)正应该(gai)担心的，不应该(gai)是这点鸡毛蒜皮的事，而是：AI 科技的推进(jin)速度太快，你有没(mei)有意识到要去适(shi)应新时代。

千万不要做(zuo)落(luo)后的那一批人。

发布(bu)于：广东省

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多