业界动态
赛道Hyper | AMD苏姿丰:敢笑业界无男儿!,锐龙,系列,架构
2024-06-18 01:31:50
赛道Hyper | AMD苏姿丰:敢笑业界无男儿!,锐龙,系列,架构

作者:周源/华尔街见闻

如果说中国的(de)三国时代,本质上是一堆亲(qin)戚的(de)内战,那么当今的(de)AI芯片公司,AMD最高领(ling)导人苏姿丰与英伟达(da)的(de)皮衣教主黄仁勋,也很有些亲(qin)戚干仗的(de)意味:武器是苏姿丰带(dai)来的(de)Ryzen(锐龙)9000系列CPU、AI PC芯片“锐龙AI 300系列”、数据(ju)中心芯片和GPU。

在英伟达(da)CEO黄仁勋于6月2日的(de)COMPUTEX 2024技术大会发表AI主题相关(guan)的(de)演讲、并公布GPU和互连路线图不到15个小时,AMD CEO苏姿丰(Lisa Su)于6月3日在同一场合更新了AMD公司的(de)AI加速(su)卡Instinct GPU系列路线图。

苏姿丰用一大批即期和中远期产(chan)品(pin)展现了AMD在AI领(ling)域(yu)的(de)雄心和对未来技术发展的(de)承诺:今年四季度(du),AMD会推(tui)出全(quan)新AI加速(su)芯片Instinct MI325X,2025年是MI350,2026年推(tui)出MI400。

简要而言,作为现有MI300系列的(de)升级(ji)版,Instinct MI325X AI加速(su)卡采用CDNA 3架(jia)构。这款加速(su)卡将配备高达(da)288GB的(de)HBM3E内存和6TB/s的(de)内存带(dai)宽,提供1.3PFLOPs的(de)FP16和2.6PFLOPs的(de)FP8计算(suan)性能(neng),能(neng)够处理高达(da)1万亿参数的(de)服务器。

苏姿丰表示,MI325X的(de)AI性能(neng)提升幅度(du)为AMD史上最大,相较竞品(pin)英伟达(da)H200将有1.3倍以上的(de)提升,故而更具性价比优势。

根据(ju)AMD Instinct GPU系列路线图,计划在2025年推(tui)出的(de)MI350系列,将基于下(xia)一代CDNA 4架(jia)构,并与OAM(Optimized Accelerated Matrix)兼容。MI350系列将基于3nm工艺技术,提供与MI325X 一样的(de)高达(da)288GB的(de)HBM3E内存,支持FP4/FP6数据(ju)类(lei)型。

MI400系列,预计在2026年推(tui)出,基于全(quan)新CDNA Next架(jia)构。性能(neng)方面,CDNA 3架(jia)构预计将比CDNA 2提高8倍,而CDNA 4架(jia)构预计将比CDNA 3提供大约(yue)35倍的(de)AI推(tui)理性能(neng)提升。AMD没有披露(lu)CDNA Next架(jia)构的(de)性能(neng)对比参数。

最强AI PC芯片:强在哪里

与上述“中远期”产(chan)品(pin)相比,AMD也推(tui)出“即时”AI加速(su)卡——代号为“Strix Point”的(de)第三代AI PC芯片“锐龙AI 300系列”和AMD “Ryzen 9000系列”桌面处理器。

其中“锐龙AI 300系列”性能(neng)之强悍,让苏姿丰拥有傲视群雄的(de)底气:NPU算(suan)力高达(da)50TOPS,超过高通骁龙X Elite的(de)45TOPS和英特尔Lunar Lake的(de)40-45TOPS。正所谓:四十万人齐卸(xie)甲,更无一个是男(nan)儿(er)。不过这三个公司的(de)CPU算(suan)力都达(da)到或(huo)超越了微软AI PC对NPU的(de)算(suan)力要求(qiu)(40TOPS+)。

AMD锐龙AI 300系列,最初的(de)版本是在2023年推(tui)出的(de)锐龙7040系列(代号Pheonix)。这是全(quan)球首款集成独立NPU AI引擎的(de)x86处理器,基于当时全(quan)新设计的(de)XDNA架(jia)构,算(suan)力约(yue)10TOPS,综(zong)合CPU和GPU后,整体算(suan)力约(yue)为33TOPS,一举(ju)奠定AI PC新品(pin)类(lei)的(de)算(suan)力起点。

同年底,也就是2023年底,AMD推(tui)出锐龙7040系列的(de)迭代版——代号为“Hawk Point”的(de)锐龙8040系列,NPU算(suan)力提升60%至16TOPS,整体算(suan)力也提升到了39TOPS。

这次推(tui)出的(de)锐龙AI300系列,为AMD第三代AI芯片:采用全(quan)新的(de)Zen5 PU架(jia)构,GPU内核升级(ji)为RDNA3.5架(jia)构,NPU更新为XDNA2架(jia)构,号称(cheng)是“面向(xiang)下(xia)代AI PC/Copilot+ PC的(de)世界一流处理器”。

目前,AI PC作为一种新品(pin)类(lei),无论是上游(you)的(de)芯片,还是下(xia)游(you)的(de)终端,切口都从高端产(chan)品(pin)开始(shi)。

根据(ju)苏姿丰披露(lu)的(de)信息,锐龙AI300系列首发两(liang)款型号——锐龙AI 9 HX 370和锐龙AI 9 HX 365,全(quan)都定位(wei)于高端市(shi)场。其中,前者是高端中的(de)高端,属于顶级(ji)旗舰。

锐龙AI 9 HX 370的(de)CPU主频高达(da)5.1GHz,为12核心24线程,相比锐龙8040系列,其CPU核心数量增(zeng)加至少30%,这是多年来首次;二(er)级(ji)缓存总容量增(zeng)至12MB(1MB/核),三级(ji)缓存增(zeng)至前所未有的(de)24MB,此前最高为16MB。

GPU部分,锐龙AI 9 HX 370升级(ji)了相应的(de)技术架(jia)构,CU单元数量从12个增(zeng)至16个,命(ming)名为“Radeon 890M”;NPU算(suan)力提升至50TOPS,与锐龙8040系列的(de)NPU算(suan)力16TOPS相比,增(zeng)加3倍多。

锐龙AI 9 365除了主频是5.0GHz,10核20线程,二(er)级(ji)缓存10MB,其他参数与锐龙AI 9 HX 370一致。

XDNA2:首发BF16浮点精度(du)格式

锐龙AI300系列的(de)NPU架(jia)构采用的(de)是“面向(xiang)下(xia)代AI PC/Copilot+ PC”的(de)XDNA2架(jia)构。

据(ju)苏姿丰现场披露(lu)的(de)技术结构图,与初代XDNA架(jia)构相比,XDNA2架(jia)构的(de)结构基本不变,但(dan)规模扩大:前者的(de)AI计算(suan)引擎模块叫做“AIE Tile”,数量是20个;到了新一代架(jia)构,名称(cheng)变成“AI Tile”,数量增(zeng)加至32个。本地内存模块,从初代的(de)5个增(zeng)加到8个。

此外,用于互连的(de)交叉总线也从普通的(de)Data Fabric,升级(ji)为Zen/RDNA家(jia)族的(de)Infinity Fabric,带(dai)来了更大的(de)传(chuan)输(shu)带(dai)宽和更高的(de)数据(ju)传(chuan)输(shu)效率。

据(ju)AMD官方给出的(de)数据(ju):XDNA2 NPU算(suan)力提升多达(da)5倍(Llama 2 70亿参数大模型的(de)响应速(su)度(du),从启(qi)动到获得(de)第一个token),多任(ren)务并行能(neng)力翻(fan)番,能(neng)效也提升了最多两(liang)倍。

XDNA2架(jia)构还有个技术亮点:引入全(quan)新Block FP16(也称(cheng)BFloat16或(huo)BF16)浮点精度(du)格式,这在NPU上是首次。此前,BF16格式一般在CPU和GPU上应用。

从性能(neng)上看,FP8浮点格式性能(neng)强,但(dan)精度(du)不足;FP16浮点格式则(ze)相反,精度(du)高但(dan)性能(neng)略逊。现在,BF16格式兼具两(liang)者之优,符合目前大多数AI应用的(de)16位(wei)精度(du)要求(qiu),无需再(zai)做额外转换(huan)。

目前,锐龙AI300系列的(de)综(zong)合算(suan)力高达(da)50TOPS,超过高通骁龙X Elite NPU和Intel即将发布的(de)下(xia)一代酷睿Ultra Lunar Lake NPU综(zong)合45TOPS算(suan)力等级(ji)。就参数而言,AMD的(de)锐龙AI300系列NPU算(suan)力为当前业界最强。

据(ju)AMD发布的(de)锐龙AI300系列技术参数,在视频编(bian)辑、多任(ren)务处理和3D图形计算(suan)性能(neng)方面,锐龙AI 9 HX 370比高通骁龙X Elite,分别提升40%、47%和73%;若(ruo)与当前Intel当家(jia)的(de)酷睿Ultra 9 185H相比,平均性能(neng)提升36%;对比苹果M3,图形处理性能(neng)提升更高达(da)98%。

目测搭载该款XPU的(de)AI PC(笔记(ji)本电脑(nao))将快速(su)大量上市(shi),比如华硕、戴(dai)尔、惠(hui)普、联想、微星和宏基等,已有100多款新品(pin)将从7月陆续上市(shi)。

苏姿丰还带(dai)来了Zen5 Ryzen 9000系列桌面处理器(Granite Ridge),基于Zen5构架(jia),首批产(chan)品(pin)将于2024年7月底推(tui)出。

简单看看,Ryzen 9000系列是继Ryzen 7000“Raphael”和Ryzen 8000“Hawk Point”系列之后,AM5插槽的(de)第三个系列,配备两(liang)颗最多有8个核心,最高16个内核和具备32线程的(de)Zen5小芯片。

据(ju)AMD官方测试数据(ju),Zen 5内核面向(xiang)PC平台的(de)IPC性能(neng)相比Zen 4平均提升约(yue)16%。与Intel Core i9-14900K相比,Ryzen 9 9950X在游(you)戏性能(neng)测试中的(de)速(su)度(du)快4%-23%;Ryzen 9950X的(de)生产(chan)力性能(neng),比Intel Core i9-14900K快7%-56%。

发布于:上海市(shi)
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7