AI竞赛场上,海外巨头“厮杀”甚是激烈,国内大模型的(de)进化也上演加速(su)度。
5月9日,在(zai)北京举办的(de)阿里云(yun)AI智领者峰会上,通义千问2.5正式发布。
此次(ci),大模型不仅能力实现大升级,性能还全面赶(gan)超GPT-4 Turbo,成为“地表最强”的(de)中文(wen)大模型。
赶(gan)超GPT-4
阿里云(yun)表示,相(xiang)较于通义千问2.1版本,通义千问2.5的(de)理解能力、逻辑推理、指令遵循(xun)、代(dai)码能力分别(bie)提升9%、16%、19%、10%。
对比GPT-4,在(zai)中文(wen)语境(jing)下,通义千问2.5在(zai)文(wen)本理解、文(wen)本生成、知识问答&生活建议、闲聊对话(hua),以及(ji)安全风(feng)险等多项能力上均全面赶(gan)超。
在(zai)这轮竞争激励的(de)AI大模型浪潮里,这是国产大模型首次(ci)取得这样的(de)成绩。
在(zai)长文(wen)本处理方面,通义千问2.5支持单(dan)次(ci)最长1000万字文(wen)档的(de)处理,并且同时能够处理多达100个(ge)文(wen)档。
通义千问还支持对PDF、Word、图表等多种不同格式的(de)文(wen)档进行处理,满足了(le)用户多样化的(de)需求。
除了(le)通义千问2.5之外,阿里云(yun)还发布了(le)一组新“战绩”。
阿里云(yun)首席技术(shu)官(CTO)周靖人在(zai)会上表示,通义大模型已经(jing)通过阿里云(yun)服(fu)务企业超过9万家,通过钉钉服(fu)务企业超过220万。
通义千问API日调(diao)用量已破亿,通义开源(yuan)模型的(de)累计下载量突破700万次(ci)。
另外,通义落地应用的(de)进程也在(zai)加速(su),目前已经(jing)涉(she)足PC、手机、汽车、航空、天文(wen)、矿业、教育、医疗、餐饮、游戏、文(wen)旅等多个(ge)领域(yu)。
其中,小米旗下的(de)“小爱同学”也与阿里云(yun)通义大模型达成合作,并将在(zai)小米汽车、手机等多类设备(bei)落地。
另外,通义千问最新开源(yuan)的(de)1100亿参数模型——Qwen1.5-110B也收获了(le)最佳成绩。
在(zai)MMLU、TheoremQA、GPQA等基(ji)准测(ce)评中,该模型超越了(le)Meta的(de)Llama-3-70B,成为开源(yuan)领域(yu)最强大模型。
通义灵码宣布推出企业版。通义灵码是国内用户规模第一的(de)智能编码助手,基(ji)于SOTA水准的(de)通义千问代(dai)码模型CodeQwen1.5研发,插件下载量已超350万。
峰会上,阿里云(yun)强调(diao)要成为“AI时代(dai)最开放的(de)云(yun)”,通过开放的(de)算力平台、开源(yuan)的(de)自研模型、优质的(de)模型服(fu)务,帮助客户抓住大模型时代(dai)的(de)机遇(yu)。
国产大模型迈入核(he)心竞技场?
去年4月,通义千问正式问世。
恰逢一周年之际,通义千问大模型的(de)进阶,也意味着国产大模型更上一层(ceng)楼。
自2022年ChatGPT发布以来,AI大模型在(zai)全球范围内掀起(qi)了(le)有史以来最大规模的(de)人工智能浪潮。
可以说,过去的(de)一年,这个(ge)圈子是“要多卷有多卷”。
当下,OpenAI、谷歌、微软等猛(meng)“砸钱”不断革新着自家产品。除了(le)海外巨头“你追我(wo)赶(gan)”之外,国内大模型也是“浑身使劲”紧追其后。
据SuperCLUE团队研究数据,国内大模型的(de)进展大致分为三个(ge)阶段,即准备(bei)期(qi)、成长期(qi)、爆发期(qi)。
目前,除了(le)阿里通义千问、百度文(wen)心一言(yan)、华为盘古(gu)等科技大厂“马不停蹄”加紧研发国产大模型外,还有复旦MOSS、中科院紫东(dong)太初、初创黑马-月之暗面的(de)Kimi等陆续脱(tuo)颖而出。
从行业发展来看,银河证券(quan)表示,未来通用AI大模型领域(yu)可能会更加集中在(zai)头部厂商(shang),更多厂商(shang)需要向行业专业化转型,垂直类AI大模型、端侧AI大模型将是未来主战场,市场空间(jian)广阔。
建议关注上游算力基(ji)础设施相(xiang)关机会,国产算力产业链及(ji)生态伙伴相(xiang)关机会,以及(ji)下游应用端领域(yu)。