最近数据中心GPU的价格可谓水涨船高——AI热度不减,似乎很多企业都期望借着生成式AI的东风发展一把——至少是不能输给竞争对手。热钱涌向大模型AI技术初创公司的趋势也还在。基于自家数据或行业训练模型,尤其LLM,当然就需要大量算力。
对应英伟达、AMD的GPU自然就变得相当紧俏了,紧俏到国内H800、A800价格开始飙升——当然和美国可能再度收紧技术控制的消息面有关;紧俏到连OpenAI都说近期GPU用量成为发展瓶颈;甚至紧俏到国外已经有AI技术公司开始买游戏显卡来获得算力;紧俏到国外媒体担忧这会不会引发新一波的游戏显卡涨价热潮...7EUesmc
据说英伟达H100到明年Q1之前,都将处于售罄状态,只不过英伟达已经打算开足马力提高供货能力了:每季度H100新增40万张出货量。这么一说,市场还真可谓东边太阳西边雨啊——同为尖端制造工艺,手机、PC市场又是何等模样。但大概也正是手机、PC当前的寥落,才让英伟达有机会在H100这样的HPC大芯片立马增加供货。7EUesmc
7EUesmc
此前我们就报道过,受到行业下行期持续,及消费电子市场颓势的影响,台积电N5工艺的产能利用率已经跌到了70%以下。和N5同代的4nm工艺,包括英伟达Hopper架构GPU所用的4N工艺,也在其中。这其实也某种程度缓解了了AI大芯片供不上货的尴尬。但问题是,作为一颗完整的芯片,乃至完整的加速卡,像H100这样的紧俏货,供应链的瓶颈可能并不在前道fab制造部分。7EUesmc
SemiAnalysis最近撰文推测了当前数据中心显卡供不应求的瓶颈所在,结合他们的分析,我们来谈谈这条供应链的现状。7EUesmc
先谈一个基础事实,对于数据中心GPU而言,显卡或加速卡中间的那颗芯片——封装在一起的除了中央主要做计算的die——也就是GPU最精华的部分,这颗die的四周通常还围绕着存储die,也就是显卡的内存部分。7EUesmc
对大部分图形显卡来说,内存更多会选用GDDR,GDDR颗粒其实不会和计算die封装在同一颗芯片上——比如以英伟达GeForce RTX 4090显卡为例,能很明确看到中央GPU芯片周围围绕的GDDR内存,和GPU die离得还比较远。7EUesmc
但数据中心HPC/AI显卡的带宽需求明显增大——尤其大模型上马以后,这类GPU就会采用规格更高的HBM(High Bandwidth Memory)内存。HBM通过先进封装的方式,与计算die封装在一颗芯片上,比如下图这样(注意彩色die周围的那6颗黑色HBM)。7EUesmc
7EUesmc
前两年我们还特别撰文探讨过HBM——这种内存最早是AMD应用到GPU上,但很显然现在主要的用量都在英伟达这边。AMD早在游戏显卡上就尝试过HBM,而英伟达则是在2016年的Tesla架构数据中心GPU上开始采用HBM内存。HBM本身是一种将DRAM die在垂直方向叠起来的高带宽内存,现在常见的HBM会叠8层;最新的一批加速卡可能会叠至多12层die,比如AMD的MI300X。7EUesmc
HBM通过大量增加pin数达成了1024bit位宽,相比内存中比较常见的DDR提升了16倍,带宽自然不在一个量级——现在最先进的HBM3标称的带宽甚至已经达到了1075GB/s,I/O速度8.4Gbps;与此同时每bit数据传输消耗能量显著低于DDR规格,这和数据通路长度也有一定关系——也就涉及到HBM常规的封装方式了。7EUesmc
7EUesmc
HBM内存通过2.5D封装的方式,和GPU计算die放在同一颗芯片上。有关2.5D封装,此前好些文章都详细谈过了。一般当代数据中心GPU,除了底下的封装基板之外,会有一层硅中介(silicon interposer),HBM die和GPU的计算die都放在硅中介上面,然后两片die通过硅中介来达成互联。这是现在用HBM内存的GPU一般都会选择的先进封装方式。7EUesmc
如前文所述,GPU的计算die所需的fab前道尖端制造工艺,因为手机、PC空余了不少产能,所以逻辑计算die的制造并不会成为产能瓶颈,那么瓶颈会不会在HBM内存上呢?7EUesmc
现在造HBM颗粒的主要市场玩家有三个,分别是SK海力士(SK Hynix)、三星、美光。SemiAnalysis提到,SK海力士是这一市场的最大赢家——这家公司2022年6月开始生产HBM3,是目前唯一能够量产HBM3的企业,超过95%的市场份额——也是绝大部分英伟达H100产品的HBM内存供应来源。AMD MI300X和接下来的英伟达H100 refresh都会用SK海力士的12层24GB HBM3内存。7EUesmc
三星此前发布消息称,其HBM3内存产品会在2023年下半年出货。虽然三星在HBM产品上的步伐走得明显不如SK海力士那么快,但三星在这一市场的投入也相当巨大,要从SK海力士的手中抢夺市场的信心也相当充足。另外,三星路线图显示,他们还准备在HBM4之上就逻辑外围引入FinFET结构器件,这也是其相较另外两家对手的优势项。7EUesmc
美光相比另外两家,步子走得明显比较慢。主要原因是美光前期在HMC技术上投入不少,这原本是HBM的有力竞争技术,无奈受制于生态和某些技术问题,HBM最终成为毫无疑问的行业标准。美光转向HBM之时,就已经落后于SK海力士和三星了。SemiAnalysis消息称,美光目前仍然卡在HBM2E上。但美光在最近的财报电话会议上说2024年就会在HBM3E技术上实现领先,并且Q3、Q4就为英伟达的下一代GPU提供HBM3E内存。7EUesmc
看起来HBM并不是这波数据中心显卡供货的瓶颈。7EUesmc
如果说HBM内存颗粒本身并非供货瓶颈,GPU计算die也不是,那么在成本大头方面,还有一项就是将两者封装到一起的先进封装技术了。至少SemiAnalysis认为,当前GPU供货的主要瓶颈就是台积电CoWoS封装。7EUesmc
只要采用HBM内存,除了会有少部分高算力HPC加速芯片采用三星的2.5D封装方案,绝大部分都会用台积电CoWoS封装。某些networking、超算、FPGA芯片也会选择CoWoS封装,但CoWoS的需求大头基本都是AI芯片。国内典型用了CoWoS技术的如壁仞GPU芯片BR100。7EUesmc
可以说,CoWoS、HBM某种程度上已经成为主要面向AI的技术。也正因如此,CoWoS不像别的技术那样,可以从其他类型或应用的芯片上转移过来,实际上CoWoS的产能今年Q1就已经占得很满。在GPU需求量爆发之际,供应链也变得因此跟不上GPU供给。三星、Intel,以及个别OSAT封测厂——典型如日月光其实也掌握2.5D封装技术,但就AI芯片市场,台积电CoWoS是绝对主流。7EUesmc
此前台积电表示已经有客户致电提出后道封装产能扩张需求,尤其是CoWoS封装,台积电称正在做这方面的评估。只不过当时台积电应该并未预期AI需求来得这么快。今年6月,台积电宣布开启先进后道fab 6工厂,其洁净间面积能够达成3D Fabric产能每年100万片wafer。当然这些产能并不都是给CoWoS的,还包括扇出型封装、3D堆叠等。7EUesmc
值得一提的是,台积电wafer level fan-out晶圆级扇出型封装现阶段的产能利用率是不足的,很显然是因为手机AP SoC的需求量低了,毕竟手机芯片是扇出型封装的主场。扇出型封装的某些工艺步骤和CoWoS是相似的,比如说沉积、电镀、RDL成型等。那么扇出型封装的部分产能可以分配给CoWoS。7EUesmc
当然CoWoS技术其实有好几种不同的类型,我们日常说的最多的用硅中介的方案是CoWoS-S;另外还有不用硅中介,而采用RDL重分布层、成本更低的CoWoS-R,以及类似于Intel EMIB硅桥方案的CoWoS-L。这些以前我们都分析过,这些就不细谈了。7EUesmc
7EUesmc
来源:SemiAnalysis7EUesmc
SemiAnalysis给出了一张当前台积电CoWoS客户产能分布图——有关这张图更详细的分析,可以移步SemiAnalysis的原文。目前CoWoS客户大头毫无疑问是英伟达,过去好几年都是这样——随着H100的持续扩产,未来这种局面也不会变。预计到2024年下半年,英伟达的下一代GPU封装尺寸可能会达到H100的两倍还多,则对封装也就提出了更高的要求。7EUesmc
据说英伟达有想过在封装方面采用双供应商的策略,但三星的先进封装技术方案和产能都让英伟达不够满意;Amkor则无法提供完整的端到端2.5D工艺技术——也就是说一整套流程是需要其他参与者打配合的——不过我们此前也谈过,这可能是传统OSAT于先进封装时代的出路。7EUesmc
要知道英伟达过去就fab前道制造始终保持着多供应商的思路,避免过度依赖。但现如今暂时只能主要依靠台积电,即便未来这种局面可能会发生变化。7EUesmc
台积电CoWoS的第二号大客户是博通——当然了,主要需求其实是博通深度参与的谷歌TPU芯片,尤其TPU v5从今年Q2开始起量——加上谷歌现如今不仅在传统业务上有需求,还期望在生成式AI上能够赶上OpenAI;博通自己也有networking芯片方面的一些需求,另外Meta的设计业务也会带来一些量。7EUesmc
另外的一些CoWoS客户依次还包括了Marvell、AMD与赛灵思、Alchip、微软、平头哥、思科等。其中实则涉及到这些芯片设计公司的下游客户,比如亚马逊Trainium等。7EUesmc
SemiAnalysis并未在分析中指明数据中心GPU瓶颈若在CoWoS封装上,具体表现在怎样的数量级上——大概是基于现有市场需求量,及台积电可提供的CoWoS产能做出的。7EUesmc
我们认为,这个推测也是完全合理的。前不久的慕展上,我们走访了多家先进封装设备供应商,有厂商发言人明确告诉我们,台积电作为半导体制造的前道fab角色主力,虽然也在做先进封装——且先进封装亦的确为未来市场方向;但从利润率的角度来看,后道封装业务是在拖后腿的,这使得台积电在先进封装技术的扩产上显得意兴阑珊。7EUesmc
所以台积电谈到要将这部分产能转移给OSAT,缓解产能问题,实际可能是从营收的角度所做的权衡。此前我们分析台积电Q1季报时,就提过,2022年台积电营收占比中7%来自先进封装;预计到2023年,这个值仍然保持在6%-7%。当然这和扇出型封装营收下降可能有关,但也可能表明了台积电在封装技术上做扩产的保守选择。7EUesmc
接下来几个月,观察英伟达数据中心GPU的供货情况,及出货量变化,可进一步明确台积电这方面的思路和发展策略。7EUesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
半导体对于原始设备制造商(OEM)来说正变得至关重要,因为它们提供了现代汽车中已成为标准配置的电子功能。
通过收购 Flex Logix,ADI 显著增强了数字产品组合
根据IPnest在今年4月最新发布的“设计IP报告”,2023年全球设计IP市场收入达到了70.4亿美元,其中许可(License)费用增长14%,版税(Royalty)费用下降6%,这也是继2021年增长20.4%、2022年增长20.9%之后,IP行业营收再次实现年度增长。
截至8月6日,德州仪器、意法半导体、瑞萨电子、英飞凌、恩智浦、安森美等国际巨头原厂均公布了最新的第二季度营收(第三季度财年报)业绩报告。从数据来看,各大厂商最新季度报告和去年同期相比有不小幅度的下滑,但均表示需求将逐步恢复……
欧盟大力投资以RISC-V开源架构实现芯片独立的倡议。这项工作由巴塞罗那超级计算中心牵头,该中心在RISC-V技术的开发方面一直走在前列。
种种迹象表明,得益于自身对神经网络计算进行的专门优化,在端侧和边缘侧处理复杂神经网络算法时拥有的更高效率和更低能耗,神经网络处理器(NPU)正成为推动AI手机、AI PC和端侧AI市场前行的强大动能,并有望开启属于自己的大规模商用时代。
戴尔首席运营官 Jeff Clarke 在上周公司的财报电话会议上透露 Nvidia 最新的 AI 加速器将消耗 1,000 瓦,比前身增加 42%。即便如此,他表示即将推出的 Nvidia 芯片(他称之为 B20
9年的时间不算长,但FPGA行业发生了很多事:AMD收购赛灵思、微芯收购Microsemi、Lattice深耕低功耗市场、本土FPGA厂商的市场份额从5年前不足5%快速提升至目前的20-30%。但从2015年收购Altera,到2024年宣布成立Altera,又好像什么都没发生。
效法美国,出台《芯片法案》。欧盟希望通过吸引更多投资,来提高半导体制造业的生产能力,以确保供应链的安全。
明年,全球分销商TOP50强的座次究竟如何变化,让我们拭目以待!
本次大会邀请了40多位重磅嘉宾进行分享,行业领域专家大咖齐聚一堂,精彩观点碰撞,吸引了来自国内外汽车电子与半导体产业领域代表性企业和组织机构近1700人报名,1000+人次出席参会。
随着芯片技术的发展,对芯片质量问题的测试变得更具挑战性。
近日,Tokyo Electron(以下简称“TEL”)宣布,将在日本宫城县建造一座新的生产大楼,由TEL的制造子公司TEL宫城公司
近日,北京大学物理学院杨学林、沈波团队,联合宽禁带半导体研究中心等多个科研机构,在氮化镓外延薄膜中位错的原
数据中心/云计算可以说是人工智能领域的核心,占据了英伟达总收入的85%~90%。
近日,重庆市人民政府办公厅印发《重庆市推动经济持续向上向好若干政策举措》,提出支持科技领军企业、产业链龙
2月10日消息,据彭博社记者马克·古尔曼报道,苹果公司取消了一款与Mac连接使用的AR眼镜项目,但仍在积极推进独立
韩国媒体TheBell报道,三星正在为旗下自研处理器Exynos2600投入大量资源,以确保其按时量产。
尽管全球平板电脑市场在2024年的大部分时间都保持着两位数的增长,但在2024年Q4,平板电脑出货量仅同比增长3%。
2月7日,日本AR眼镜光学厂商Cellid宣布,公司通过定向增发完成总额1300万美元(约人民币9478.95万元)的融资。
近日,多家媒体发布消息称,瑞芯微前副总经理陈锋将出任Arm在中国的合资公司安谋科技首席执行官(CEO)一职。
美国市场研究机构Gartner发布2024年全球半导体厂商营收排行榜。
随着传统扩展方式的成本和复杂性上升,先进封装已成为满足人工智能(尤其是大型语言模型训练)性能需求的一种方式
2024年Q4,全球笔记本电脑出货量同比增长了6%,达到5450万台。
英飞凌位于曼谷南部沙没巴干府的新后道厂破土动工,该厂将扩大公司在亚洲的生产布局。
2024年,集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化
雅加达,印尼- 2025年1月14日 - 全球技术解决方案供应商艾睿电子(Arrow Electronics)与印尼初创协会合作(STARFIN
无畏挑战 共创未来祥龙回首留胜景,金蛇起舞贺新程。在2025年元旦新年之际,深圳市凯新达科技有限公司(以下简
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准;
配套USB网关,轻松实现Wi-
随着与三安光电的碳化硅合资工厂落地重庆,2024年6月,意法半导体与重庆市彭水自治县同步启动了可持续发展合作
凯新达科技 自由之旅 征途同行
NVIDIA Jetson Orin™ Nano Super 开发者套件是一款尺寸小巧且性能强大的超级计算机,重新定义了小型边
德州仪器今日推出了全新的集成式汽车芯片,能够帮助各个价位车辆的驾乘人员,实现更安全、更具沉浸感的驾驶体验
广州飞虹半导体科技有限公司成立于广州越秀区,诚信经营20多年。主要研发、生产、经营:场效应管、三极管等半
近日,半导体存储品牌企业江波龙与工业和信息化部电子第五研究所(中国赛宝实验室,以下简称“电子五所”)在江波龙
深圳迈巨微电子有限公司深耕锂电池管理芯片领域,围绕电池健康和安全,电池电量计算二个核心技术能力,提供完善的
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈