芯片异构:竞争格局扑朔迷离
3月22日,英伟达发布了一款数据中心专属CPU——“Grace CPU超级芯片”。该芯片由两颗CPU芯片组成,其间通过NVLink-C2C技术进行互连。而NVLink-C2C则与近日英特尔与台积电、三星等多家科技厂商发起的UCIe标准有着异曲同工之妙,也是一种新型的高速、低延迟、芯片到芯片的互连技术,可支持定制裸片与GPU、CPU、DPU、NIC、SOC实现互连。
当前,新型数据中对算力需求日渐持续攀升,仅靠单一类型的架构和处理器无法处理更复杂的海量数据,“异构”正在成为解决算力瓶颈关键技术方向。chiplet(“芯粒”)技术被视为“异构”技术的集纳。3月初,英特尔发起的UCIe 标准将为chiplet(“芯粒”)技术提供统一接口和技术标准,台积电、三星、日月光、AMD、等厂商加入,但英伟达却按兵不动。
专家指出,这表明英伟达并没有想要游离在UCIe联盟之外,但也同时展现出了英伟达对NVLink-C2C的绝对信心,未来也许会组建自己的联盟。在全球异构计算领域,虽然AMD也占有一席,但从其加入了UCIe 标准联盟来看,AMD在“异构”上已经偏向英特尔这边,未来异构芯片之战主要在英特尔和英伟达之间进行,业界称之为“双英之战”。
英特尔的“芯粒联盟”
UCIe的魅力在于可以将各个企业的Chiplet规定在统一的标准之下,这样不同厂商、工艺、架构、功能的芯片就可以进行混搭,从而轻而易举地达到互通,并且还能实现高带宽、低延迟、低能耗、低成本。芯谋研究高级分析师张彬磊向《中国电子报》记者表示,“小芯片”chiplet技术的发展有望推动异构计算的发展,chiplet技术提供统一接口和技术标准,解决异质封装的连接和传输效率问题(速率、能效上会有小幅损失)。UCIe标准将促进chiplet相关技术的发展,有望在性能和功耗方面达到平衡和商业化价值。
英特尔曾提出六大技术支柱,对XPU的实现起到了关键作用,包括制程、架构、内存、互连、安全和软件。异构计算虽然看似一个硬件层级的内容,但要释放其能力,需要芯片、系统、软件三层一体化考虑,才能够发挥作用。一是芯片层,指在芯片封装内的异构,和“小芯片”概念紧密相联;二是系统层,指多功能多架构的计算架构进行整合;三是软件层,统一的跨架构编程模型oneAPI,可以通过一套软件接口、一套功能库为开发者提供在不同架构上编程的便利性。在统一的UCIe标准下,异构的难度就会直线下降,并且效果更好。
目前,UCIe联盟已经囊括了半导体、封装、IP供应商、晶圆代工厂和云端服务提供厂商等上下游全产业链。AMD执行副总裁兼首席技术官Mark Papermaster表示:“UCIe标准将成为利用异构计算引擎和加速器来推动系统创新的关键因素。”
台积电科技院士、设计暨技术平台副总经理鲁立忠说:“该全行业联盟立志扩大封装级集成生态系统,台积电很高兴能加入其中。台积电提供各种硅技术和封装技术,为异构UCIe器件打造多种实现方案。”
日月光半导体工程与技术营销总监Lihong Cao博士指出:“业界普遍认为,异构集成有助于将基于小芯片的设计推向市场。”
英伟达或“另起炉灶”
然而,人们在关注UCIe联盟之余也发现,在UCIe联盟当中并没有英伟达与苹果这两大异构集成公司的身影。其中的原因,可以从英伟达CEO黄仁勋在近日召开的GTC 2022春季开发者大会上探知部分。
英伟达发布了NVIDIANVLink-C2C互连技术,其链路的能效最多可比NVIDIA芯片上的PCIe Gen 5高出25倍,面积效率高出90倍,可实现每秒900GB乃至更高的一致互联带宽。也就是说,在异构集成的小芯片互连方面,英伟达也在做与英特尔类似的事情。
“除NVLink-C2C外,英伟达将支持UCIe标准。与NVIDIA芯片的定制芯片集成既可以使用UCIe标准,也可以使用 NVLink-C2C。” 黄仁勋说。
对此有专家指出,这表明英伟达并没有想要游离在UCIe联盟之外,但也同时展现出了英伟达对NVLink-C2C的绝对信心,未来也许会组建自己的联盟。
赛迪顾问集成电路中心高级咨询顾问池宪念向《中国电子报》记者表示,英伟达自身拥有的NVIDIA NVLink-C2C 依托于 NVIDIA 世界一流的 SERDES 和 LINK 设计技术,可从 PCB 级集成和多芯片模组扩展到硅插入器和晶圆级连接。这可提供极高的带宽,同时优化能效和裸片面积效率。相较于UCIe标准,NVLink-C2C经过优化,延迟更低、带宽更高、能效更高。
苹果或许与英伟达有着同样的考虑。本月初,“跨界选手”苹果携地球最强桌面芯片M1 Ultra抢别人“饭碗”,产品性能超越一众CPU与GPU的专业选手。
芯谋研究分析师张先扬向记者表示,2022年3月9日苹果公布的自研芯片M1 Ultra是基于Chiplet工艺,该技术提供了2.5TB/s的超高带宽,远远领先于目前公布的UCIe1.0标准。也就是说,苹果的Chiplet产品路线通过与台积电的合作就可以完成,且领跑于当前UCIe标准,因此对苹果来说,加入该联盟不是必选项。
“异构”格局扑朔迷离
此前,全球异构计算领域一直维持在互相制衡的三国杀格局。但UCIe联盟的出现打破了原有的平衡,英特尔和AMD的亲密互动,英伟达的似离非离,让整个形势变得扑朔迷离。尽管合纵连横是上上之策,但打铁还需自身硬,想要在异构计算的壁垒中率先突围,实力才是硬道理,所以三巨头都在各自擅长的领域内大动干戈。
“三巨头”分别都有自己主导的异构计算体系。池宪念介绍道,英特尔主导的异构计算体系主要为其自身系列产品和服务使用,在PC与高性能移动计算领域具有优势;以IBM、谷歌、英伟达为主的OpenPower联盟则以IBM Power芯片架构技术为基础,主要面向高性能计算领域应用;以AMD、高通、ARM、三星、北京华夏芯等为主体的HSA(heterogeneous system architecture,异构计算系统)联盟,是完全开放的异构计算联盟,ARM、高通、三星等巨头参与其中,在高性能移动计算领域具有优势。
CPU龙头英特尔作为业界唯一拥有CPU、独立GPU、IPU、ASIC、FPGA、各种加速器的企业。在最近的投资者会议中提出了一个新架构-Falcon Shores,计划于2024年完成,这是一款将X86和Xe GPU 整合到一个Xeon插槽中的新架构。
英特尔中国研究院院长宋继强向《中国电子报》记者表示,将X86的主芯片加上GPU的性能整合在一起,这是一个创新。在性能上,Falcon Shores将提供超过5倍的每瓦性能、超过5倍的计算密度以及超过5倍的内存容量和带宽。
在记者问到英特尔与其他几家相比有哪些优势时,宋继强指出,一是技术基础稳固且强大;二是英特尔能有架构和多种不同加速器去处理合适的应用负载;三是英特尔提出了“软件优先”。这对开发者来说尤为重要。
GPU龙头英伟达在去年的GTC2021上公布了其专为人工智能和超算使用需求打造的Grace CPU系列产品,并且打造了全新的芯片路线“GPU+DPU+CPU”。而在今年的GTC2022上,英伟达宣布推出首款面向AI基础设施和高性能计算的基于Arm Neoverse的数据中心专属CPU-“Grace CPU 超级芯片”。
GraceCPU 超级芯片是专为AI、HPC、云计算和超大规模应用而设计,由两个CPU芯片组成,两者通过NVLink-C2C进行互连。并且能够在单个插座(socket)中容纳 144 个 Arm核心,在 SPECrate 2017_int_base 基准测试中的模拟性能达到业界领先的 740 分。根据 NVIDIA 实验室使用同类编译器估算,这一结果较当前的DGX A100要高1.5倍以上。
黄仁勋对其偏爱有加,赞扬道:“Garce的一切都令人惊叹,我们预计Grace超级芯片届时将是最强大的CPU,是尚未发布的第5代顶级CPU的2到3倍。”
对于英伟达来说,Grace CPU的出现使英伟达的CPU产品不再受英特尔和AMD的限制,英伟达虽然是全球GPU霸主,但GPU只负责运算加速,需要依靠CPU下达指令才能执行,所以GPU和CPU的沟通就显得格外重要。
尽管此前闹得沸沸扬扬的ARM收购案虽然以失败告终,但这也是英伟达向外界传递的信号,对于增强自身在异构方面的决心展露无遗。
新晋FPGA龙头AMD在合并赛灵思完成后,摆脱各个行业只能第二的处境,AMD就此成为继英特尔后又一家兼具CPU、GPU、FPGA三大产品线的半导体厂商,未来AMD的CPU将与赛灵思的FPGA结合为CPU+FPGA的异构模式。赛灵思深耕的FPGA产品,2020年在FPGA市场,赛灵思全球和中国境内市场份额均达到50%~55%。对于赛灵思的收购,AMD总裁兼首席执行官苏姿丰表示,AMD通过有效整合赛灵思在FPGA方面的优势,能够提供具有更广泛高性能的计算产品组合,提供从CPU到GPU、ASIC、FPGA系统级解决方案。同时,借助赛灵思在5G、通信、自动驾驶和行业领域的资源,AMD能够将高性能计算能力带入更多领域,扩展到更广泛的客户群体中。而且AMD未来可实现FPGA在现成CPU 上运行编程语言,并研发出用于实现某些功能或软件堆栈的定制ASIC产品。
AMD全球高级副总裁、大中华区总裁潘晓明曾在2021世界半导体大会上表示:“今天和未来的工作负载需要强大的计算能力,异构计算是关键的未来趋势。AMD未来在计算、图形和解决方案的三个方面聚焦高性能计算,在持续发展的行业中保持高性能计算领导力。”
延伸阅读:
作者丨许子皓
编辑丨赵晨
美编丨马利亚
-
苹果自研 5G 芯片或已失败;腾讯 QQ 回应大规模账号被盗;Vim 9.0 发布 | 思否周刊
SegmentFault 思否40s 新闻速递微信推出新功能:图片大爆炸苹果自研 5G 芯片或已失败腾讯 QQ 回应大规模账号被盗:受影响范围已得到控制,正收集黑产团伙犯罪证据立陶宛网络遭大规模 DD
-
三星3nm芯片抢先量产,台积电输了么?
三星的3nm芯片终于在今天掀开面纱。三星宣布,基于3nm全环绕栅极(Gate-All-AroundT,简称 “GAA”)制程工艺节点的芯片已经在其位于韩国的华城工厂启动大规模生产。此举使三星成为全球首
-
微信推出图片大爆炸功能;苹果自研 5G 芯片或已失败;微软解决导致 Edge 停止响应的 bug|极客头条
「极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理 | 梦依丹出品 | CSDN(ID:CSDNnews)一分
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 总投资90亿元,莱宝高科拟投资电子纸显示器件项目
- Windows Copilot抢先上手!GPT-4全线接入Win11,重新定义操作系统
- 突破局限,第四代至强以七大算力神器诠释工作负载至上
- 工信部印发《工业和信息化领域数据安全管理办法(试行)》
- 芯智慧、共飞腾 | 统信智能终端操作系统适配飞腾E2000平台
- 中国信科集团获评国资委“科技创新突出贡献企业”
- 马斯克的“好朋友”,冲击2022港股最大IPO
- 基于“统信UOS+鲲鹏”全栈适配,中地数码获Huawei Validated认证
- Mini LED产能不足?苹果新款iPad Pro或推迟交付
- 拜登就职首日签署“重返《巴黎协定》”等17条行政命令
- 高通发布新屏下指纹传感器:iPhone 13或首发
- 社区团购被叫停,互联网巨头能抢占的风口还剩什么?