业界动态
商汤科技发布“日日新5o” 实时多模态流式交互对标GPT-4o,模型,推理,表情
2024-07-09 08:17:45
商汤科技发布“日日新5o” 实时多模态流式交互对标GPT-4o,模型,推理,表情

7月5日,在2024世(shi)界人工智能大会“大爱无疆·向新力”人工智能论坛上,商汤(tang)科(ke)技发布国内(nei)首个所见即(ji)所得模型(xing)“日日新5o”,交互体验(yan)对(dui)标GPT-4o,实现(xian)全新AI交互模式。

通(tong)过整合跨模态信息,基于声音、文本、图像和视频等多种形式,国内(nei)首个所见即(ji)所得模型(xing)“日日新5o”带来一种全新的AI交互模式,即(ji)实时的流式多模态交互。在现(xian)场,工作人员刚开始仅是和“日日新5o”打个招呼,它(ta)就自动(dong)识(shi)别出工作人员脖子(zi)佩戴的胸卡带子(zi)上的字眼,判断出现(xian)场就是世(shi)界人工智能大会会场,并表示在这个地方可以(yi)“好好学(xue)习(xi)”。

接下来工作人员拿了一只可爱小狗玩偶,“日日新5o”准确描述了小狗的外貌、表情以(yi)及重要(yao)穿戴——一个带着印有商汤(tang)科(ke)技logo白帽子(zi),很给主场人排面。

再上些难度,随便(bian)翻开一本书(shu)的任何一页,“日日新5o”都能自动(dong)介绍(shao),不是简单的OCR识(shi)别文字,而是识(shi)别图文给出好理解的总结,这一切在瞬间即(ji)可完成,真正做到实时交互。

工作人员还现(xian)场发挥了“画功”,随手画了一只简笔画小兔子(zi),“日日新5o”直呼画得可爱,而后工作人员又画了一个微笑表情,它(ta)从这个平静的表情中捕捉(zhuo)到了笑意,工作人员又改了一笔把嘴(zui)巴画大增添了舌头,“日日新5o”看(kan)到后立马说道这表情开心多了。

能听会看(kan)更会找话(hua)题,就如同真人聊天(tian)一般的交流对(dui)话(hua),这种交互模式特别适用于实时对(dui)话(hua)和语音识(shi)别等应用,其多任务适应性强,能够在同一模型(xing)中自然处理多种任务,且根(gen)据不同上下文自适应调整行为和输出,能够实现(xian)对(dui)标GPT-4o的交互体验(yan)正是源于“日日新5.5”基础模型(xing)能力的全面提升(sheng)。

今年4月发布的“日日新5.0”是国内(nei)首个对(dui)标GPT-4 Turbo的国产大模型(xing),短短两个多月时间,全新“日日新5.5”体系迎(ying)来多项升(sheng)级,综合性能较“日日新5.0”平均提升(sheng)30%,在数学(xue)推理、英文能力和指令跟(gen)随等能力明显增强,交互效果和多项核心指标实现(xian)对(dui)标GPT-4o。

据介绍(shao),“日日新5.5”采用混(hun)合端云协(xie)同专家架构,最大限度发挥云边端协(xie)同,降低推理成本,模型(xing)训练基于超过10TB tokens高质量训练数据,包括大量合成的思维链数据,提升(sheng)推理思维能力。

商汤(tang)于近期推出了“大模型(xing)0元Go”计划。凡是“日日新”新注册用户,都可获得涉及调用、迁徙、训练等多项免费服(fu)务大礼包,同时商汤(tang)还将免费赠送(song)5000万Tokens包,并且派出专属搬家顾问,帮助OpenAI用户实现(xian)零服(fu)务成本迁移(yi)。

文/北京青年报记者 温婧(jing)

编辑(ji)/田(tian)野

发布于:北京市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7