广告

AI推动系统架构变革,Arm持续赋能定制芯片时代

今年年初,ChatGPT的大火催热了生成式AI赛道。到下半年,AI产业链上下游迎来商业化关键期。众所周知,AI会带来巨大的算力需求,“如何满足强大的算力需求”成为基础设施更新迭代的重要因素。在产业迎来爆发的关键阶段,芯片IP供应商也嗅到了AI商机,并开始推出更灵活且适用于AI应用的新方案,其中Arm的动态值得关注。

近年来,Arm已转型为一家计算平台公司。此前,Arm一直向市场提供IP产品,其合作伙伴基于Arm IP来开发解决方案和产品。现在,Arm在致力于IP 授权业务的同时,也专注于通过完整且全面的解决方案,帮助合作伙伴更快地将产品推向市场,助力其把更多精力集中在开发创新解决方案上。也就是说,Arm既可为合作伙伴提供Arm IP,也可以为他们提供完整的解决方案,帮助他们将产品快速推向市场。dxMesmc

Arm赋能定制芯片:发布子系统CSSArm全面设计

为了缓解未来基础设施的压力,行业需要依赖强大的软件生态系统,在高效、可扩展的多核计算基础上打造专用处理的能力。为此,当下的基础设施建设已逐渐趋向定制化。Arm高级副总裁兼基础设施事业部总经理Mohamed Awad介绍说:“我们赋予合作伙伴将有限的资源专注在关键差异化的能力,同时Arm也继续发挥所长——提供可扩展且高效的计算基础。”dxMesmc

因此,Arm在今年8月28日推出了Arm® Neoverse™计算子系统(CSS),紧接着在10月17日,又推出了Arm全面设计(Arm Total Design)生态项目。dxMesmc

·Arm Neoverse计算子系统

dxMesmc

Arm Neoverse 计算子系统 (CSS)dxMesmc

相较于独立的IP,CSS将促使Arm生态系统通过更低的成本、更少的风险及更短的时间,打造出专用芯片。其中,Arm Neoverse CSS N2是Arm Neoverse CSS第一代产品,该产品集成了Neoverse N2平台,并通过验证配置且优化了功耗、性能与面积(PPA)。CSS N2可发挥Neoverse N2平台的每瓦性能与效率,基于先进的5纳米工艺进行优化,并通过可定制化的计算子系统形式交付给合作伙伴,达到加速上市时间的成效。dxMesmc

通过CSS N2,合作伙伴的工程资源将可聚焦于SoC与系统级的创新。在一家合作伙伴的案例中,CSS已经助力他们的项目从概念到落实(在超过100个核心的系统上启动Linux)仅耗时 13个月。另一家合作伙伴通过CSS节省了超过80人/年的工程师时间。CSS N2还赋能包括AI在内的特定领域专用加速器的集成,并为云原生工作负载带来市场领先的每瓦性能表现。dxMesmc

从AI到5G,再到云数据中心及边缘,打造新一代计算基础设施的技术先行者都在转向寻求定制芯片,以实现规模化所需的专用处理能力。Arm推出Neoverse CSS之后,它能够提供完整的子系统,Arm的合作伙伴既可以直接采用,也可以按需选用。CSS可帮助Arm的合作伙伴进一步降低投资,加速整个生态系统对Arm解决方案的可访问性,以及加速合作伙伴产品的上市时间。dxMesmc

·Arm全面设计生态项目

dxMesmc

Arm 全面设计生态项目助力合作伙伴加速基于 Neoverse CSS 的芯片开发dxMesmc

在Neoverse CSS的基础之上,Arm还推出了Arm全面设计,进一步结合生态系统的力量,简化定制芯片的开发流程,并且让交付变得更加容易、便捷。Arm全面设计汇集了ASIC设计公司、IP供应商、EDA工具提供商、代工厂和固件开发者等企业,以加快并简化基于Neoverse CSS的系统开发,其合作伙伴将可优先取用Neoverse CSS,从而实现创新和加速上市时间,降低打造定制芯片的成本和难度。dxMesmc

通过Arm全面设计,Arm在芯片开发的各个阶段都引入了生态系统的关键专业知识,从而让基于Arm Neoverse的专用解决方案能够广泛地覆盖AI、云、网络、边缘等各种基础设施领域。目前,Arm全面设计生态系统提供的服务包括:dxMesmc

  • 来自Cadence、Rambus和Synopsys等合作伙伴的预集成、经过验证的IP和EDA工具,可助力加速芯片设计,以及内存、安全和外设等功能的集成;
  • 来自ADTechnology、Alphawave Semi、Broadcom、Capgemini、智原科技、Socionext和Sondrel等合作伙伴的设计服务,他们可提供关于Neoverse CSS,以及其他Arm IP和方法的专业知识,为生态系统提供支持;
  • 来自英特尔代工服务和台积电等代工厂合作伙伴的技术,专为领先工艺节点和先进封装技术进行优化;
  • 来自AMI等基础设施固件提供商,针对Neoverse CSS提供商业软件和固件支持。

Mohamed Awad指出,从广义上理解,Arm全面设计解决方案相当于是一个端对端的生态系统。在这样的生态系统中,合作伙伴可使用Neoverse CSS,并在此基础上做很多设计,包括芯片设计和测试。值得注意的是,Arm全面设计生态系统没有排他性。“我们通过Arm Neoverse CSS来赋能包括设计服务公司等在内的生态伙伴,助力他们加速解决方案的设计与开发。除此之外,第三方的IP供应商可以基于Neoverse CSS打造内存控制器、接口等产品;商业固件解决方案可早于芯片流片便开始开发。”dxMesmc

Neoverse CSS仍还在不断迭代发展,以支持新兴的芯粒(Chiplet)技术。在这整个过程中,生态伙伴可借助Arm全面设计生态系统加速产品研发,并且优化和简化开发流程。比如,Arm与Socionext正利用Neoverse CSS进行了多核CPU芯粒的概念验证。Mohamed Awad对此评价说,通过Arm全面设计将更广泛的半导体行业凝聚在一起,围绕Arm基础计算子系统进行创新。dxMesmc

AI推动基础设施的系统架构新变革

在基础设施部分,Arm针对于人工智能正在发生的一些变化做出的新调整,足以体现其独特的价值。Arm方面表示,公司深信只有创新才能不断推动技术的进步。dxMesmc

dxMesmc

基础设施领域的传统系统架构dxMesmc

Mohamed Awad介绍了传统的服务器系统架构(详见上图),该架构最左边是内存,内存连接一个通用的现成CPU,该CPU又负责管理多个加速器。“这样的传统架构是过去市场上唯一可用的架构,但这个架构的问题在于——这个通用的现成CPU和加速器之间的接口直接限制了产品最终的性能水平,因为所有的加速器都必须要通过一个CPU访问额外的内存,这样就无法达到内存的一致性,意味着加速器的性能无法被充分利用,所以它也无法很好地支持生成式AI时代的需求。”dxMesmc

dxMesmc

面向新的应用需求,基础设施领域出现了现代化的系统架构dxMesmc

而现在有一种现代的系统架构,CPU是根据实际需求进行定制化设计,其每一个定制化的CPU都可单独和一个加速器相连,这种架构有较强的内存一致性。设计方在这样的架构下,根据用户的实际场景和用例进行CPU设计,方能将加速器的使用效率提到最高。只有具体了解最终用例是什么,并且根据使用场景针对性地设计CPU,这样才能获得更好的效率,达到产品最佳的表现性能,进而更好地支持生成式AI在内的未来基础设施的市场需求。dxMesmc

针对面对高性能AI计算领域,CPU融合GPU是否会成为主流的结合,Mohamed Awad解释说:“现在判断一个CPU搭配一个GPU作为 AI 加速的未来主趋势或唯一架构还仍为时尚早。但我认为,鉴于我们正处于计算加速的时代,在未来的架构当中,通用CPU旁边一定会有一个加速器——不管是通过紧密耦合、中度耦合或者是中散耦合的方式,都一定会存在一个加速器。但具体这个加速器是什么样,采用什么样的架构,业界还在不断探索过程中。”dxMesmc

之前,市场上唯一的架构是一个CPU对应多个加速器或GPU,但是这个CPU本身不是定制化的CPU,这种CPU是通过PCIe接口和加速器连在一起,其数据传输的吞吐率和链路带宽直接受限于有多少数据可以进入到加速器。一旦链路不佳,只有少量的数据进入加速器,那么加速器的性能无法发挥到极致。这也是为何新架构强调的是一个定制CPU+加速器一对一组合,这样的整体链路及数据吞吐率会达到最高,可以提高加速器本身的利用水平。dxMesmc

此外,对芯片设计师来说,借助Arm Neoverse CSS及Arm全面设计,在新架构中他们无需改变其现有的芯片设计流程。因为Arm全面设计生态系统汇集了半导体设计和制造行业的专业知识,从软硬件合作伙伴到代工厂和EDA技术的先行者,这样可加快针对工作负载优化的定制芯片的开发速度。“这对芯片设计者来说,是帮助其加速和优化,而不是去改变他的设计流程。”dxMesmc

Arm生态系统近期合作案例

Mohamed Awad认为,Arm的独特之处在于,能够帮助合作伙伴从头开始、根据所需构建定制化的CPU,能够做好CPU和加速器之间的连接。合作伙伴还可利用Arm强大的软件生态系统,来赋能自己的整个开发并加速产品上市进程。据悉,Arm推出Neoverse CSS之后,它能够提供完整的子系统,Arm的合作伙伴既可以直接采用,也可以按需选用。比如,微软近期发布的Cobalt 100 CPU,便基于Neoverse CSS。dxMesmc

据介绍,NVIDIA GH200 Grace Hopper超级芯片使用Arm Neoverse 搭配 NVIDIA GPU的架构。该芯片有72颗Arm Neoverse核心+NVIDIA的GPU,其AI性能较基于x86架构的系统可提升10倍。NVIDIA希望借助Arm技术带来的灵活性,设计出自己的芯片以进一步优化系统,同时还能充分利用Arm强大的软件生态系统。dxMesmc

Arm也在中国本地厂商在进行合作。比如,阿里巴巴的倚天710基于Arm Neoverse平台打造的CPU;初创企业鸿钧微电子、遇贤微电子都基于Arm平台打造服务器 SoC解决方案;云豹智能也借助Arm来创建云计算与数据中心的DPU解决方案;联想则是将基于Arm架构的解决方案部署到5G领域。通过携手中国本土的合作伙伴,Arm将在中国进一步地推动Neoverse的发展。dxMesmc

最后,Mohamed Awad强调说,如今,Arm在中国有近400家技术授权客户,中国合作伙伴基于Arm架构芯片的总出货量已累计达300亿颗。“中国是Arm非常重要的市场之一,来自中国市场的创新也是Arm不断发展,并在业务上取得成功的原因之一。”dxMesmc

责编:Clover.li
本文为国际电子商情原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
李晋
国际电子商情助理产业分析师,专注汽车电子、人工智能、消费电子等领域的市场及供应链趋势。
  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

近期热点

广告
广告

EE直播间

更多>>

在线研讨会

更多>>