伴随生成式AI市场的不断扩大,其对快速、强大的计算处理器,以及海量数据存储,提供了更高的要求。
受通胀压力和宏观经济下行的双重影响,自2022年开始全球云计算市场增速出现下降,但长期来看其需求依旧稳固。CAvesmc
Gartner数据显示,尽管以 IaaS、PaaS、SaaS 为代表的全球云计算市场在2022年规模约接近5000亿美元,增速为19%,仍较2021年32.5%的高速增长回落明显,但对比全球整体经济仅3.4%的增长,这一增速还是较为可观。该机构还预测,在大模型等新算力需求刺激下,全球云计算需求仍将长期保持稳定增长,到 2026年其市场规模将突破万亿美元。CAvesmc
作为云计算的基础,数据中心不可或缺。当云计算高速发展时,数据中心应用规模也会随之扩张。CAvesmc
IDC数据显示,2022年全球服务器出货量高达1500万台,销售额超过1200亿美元,同比分别增长 12%和 22.5%。同期,全球 AI 服务器市场规模同比增长17.3%,超过180亿美元。随着训练数据规模和模型复杂度暴增,全球AI服务器出货占比正在大幅提升,随之而来的AI芯片需求也在大增。CAvesmc
1月底,传出来自英伟达、AMD 等客户的“爆款急单”持续增加,台积电不仅加速推进CoWoS 等先进封装扩产计划,且还上调产能目标。据悉,此时英伟达的订单占比接近50%,其明星产品H100的交付周期仍长达10个月。CAvesmc
不过,随着今年台积电CoWoS产能逐季得到释放,以及英特尔将于第二季度加入先进封装(月产能约5千片)行列,英伟达将向广达、超微(Supermicro)、华硕、技嘉、华擎等厂商提供更多 AI GPU产品,这将推动AI服务器出货量进一步增长。据统计,中国台湾服务器出货量占全球总市场的80%以上,而该地AI服务器的代工更是占据全球90%的市场份额。CAvesmc
据资策会产业情报研究所(MIC)预测,全球AI服务器出货量占比将从2023年12.4%增至2027年20.9%。其中,AI服务器出货量将在2024达到194.2万台、2025年达236.4万台,到2027年进一步增至320.6万台,2022年至2027年间的复合成长率为24.7%。CAvesmc
此外,伴随着AI服务器比例的快速增长,头部处理器厂商将推出支持PCIe Gen5的第二代服务器CPU,而性能更优的 PCIe Gen5 SSD产品也将随即在下半年问世和采用。CAvesmc
随着越来越多的行业持续加大对生成式AI技术的投入,预计到2032年其市场规模将超过1,100亿美元,2022年到2032年间年复合增长率逾27%。 伴随生成式AI市场的不断扩大,其对快速、强大的计算处理器,以及海量数据存储,提供了更高的要求。CAvesmc
CAvesmc
图1:2022-2032年全球AI市场规模预测CAvesmc
当前,大型语言模型(LLM)所使用的数据量和参数规模正呈“指数级”增长。以GPT为例,GPT-3 模型参数拥有1750亿个,单次训练所需总算力约3640 PF-days(即以每秒一千万亿次计算,运行时间为3640天)。作为GPT-3的升级版——GPT-4参数数量进一步扩大至1.8万亿个,是GPT-3 规模的10倍,训练算力需求达GPT-3的68倍,要在2.5 万个A100上训练约90-100天(MFU约32%到36%)。CAvesmc
2020年5月,英伟达推出了新一代GPU芯片,英伟达CEO黄仁勋介绍道:“A100 AI训练和推理性能较前代V100提升了20倍。”而作为下一代继任者,H100芯片于2022年初发布,当年9月量产。H100较A100获得了大量的技术更新和升级,所有设计均达到新的性能和效率水平。CAvesmc
以700亿参数的LLaMA 2大模型为例,H200的推理速度几乎较 H100提升一倍,能耗则降低一半。高带宽的内存芯片可为GPU提供更快的并行数据处理速度。产品参数显示,H200显存已由H100 80GB 飙升至141GB ,带宽从3.35TB/s增加至4.8TB/s 。其中,H200整体性能的提升的最大“功臣”就是HBM3e内存技术。CAvesmc
2013年,韩国存储厂商SK海力士首次推出HBM存储技术,该技术后续又衍生出HBM2、HBM2e和HBM3,带宽和 I/O 速度进一步提升。作为HBM3的下一代产品,SK海力士于2023年8月推出了HBM3e,其宣称单颗带宽可以达到1.15TB/s。按照计划,该厂商将于今年开始量产HBM3e。CAvesmc
在SK海力士布局HBM3e后,其他存储大厂陆续跟进,如三星或已在去年第4季度向北美客户供货;美光表示将在今年实现追赶,并有望在今年下半年向英伟达下一代GPU产品供货。CAvesmc
据Gartner预测,2023年全球HBM存储市场规模约为20亿美元,预计到2025年将暴增至近50亿美元,增长率将近150%。从应用需求来看,目前对HBM用量最多是AI GPU产品,而受益于推理模型应用的推动,FPGA对HBM的用量或在2025年后出现显著增长。CAvesmc
IDC中国研究经理杨昀煦表示:“目前自然语言生成、图像生成已经是PB级数据量,正在落地的音、视频生成达到EB级别。” 她指出,当AIGC应用深入到行业场景后,例如,制造业的搬运、喷涂等产线;医疗行业的精准手术操作、航空航天的卫星维护以及智慧城市中的交通管理等机器人控制工作场景中后,数据量将急速上升,达到ZB级,且从训练数据的收集、预处理、写入读出,到稳定训练集、兼顾企业数据安全以及最后训练结果数据形成资源池,对推理结果进行使用,这整套流程下来对存储技术的多维度能力提出挑战。CAvesmc
也正因AI训练和推理需求的持续火热,不仅推动了英伟达产品的供不应求,更拉高其业绩大幅增长。CAvesmc
在2024财年三季报中,英伟达营收增长206%至181亿美元;净利润暴增1259%至92亿美元。 作为英伟达业务的核心,其数据中心业务同比增长279%至145亿美元。据该公司管理层预计,其四季度收入将较三季度增长34%,达到200亿美元。在核心GPU产品销量上,据Omdia口径统计,其在2023年第三季共售出近 50万块A100和 H100 GPU,而基于 H100的服务器的交付周期已延长至36到52周。该机构认为,H100 最大买家为Meta和微软,两家公司都采购了15万块H100,采购量远超谷歌、亚马逊、甲骨文和腾讯。CAvesmc
从营收规模来看,英伟达虽尚不及英特尔,但得益于在火热的AI芯片市场的强势地位,该公司市值持续上扬。2023年该公司股价上涨了约240%,而截至2024年1月30日,其最新市值超过1.5万亿美元,远超风头正旺的芯片代工龙头台积电和老牌芯片厂商博通和英特尔。CAvesmc
CAvesmc
图2:各半导体公司市值(截至2024年1月30日)CAvesmc
凭借在图形芯片领域数十年来的积累,英伟达坐享丰厚的行业红利,这也让其他芯片大厂眼红。见此,AMD等厂商开始涉足AI芯片领地。CAvesmc
2023年12月,AMD推出了用于大模型训练和推理以及高性能计算 AI芯片MI300XGPU和MI300AAPU。其中,AMD的最新AI芯片InstinctMI300X,已获得微软和Meta两家巨头的青睐。据AMD CEO苏姿丰介绍,InstinctMI300X性能可与英伟达H100HGX相媲美。而来自中国的电信设备巨头华为,则于2023年9月发布了两款采用自家达芬奇架构的人工智能处理器——昇腾310和910,前者用于推理和后者用于训练。CAvesmc
而作为H100 的升级款—H200已在2023年全球超算大会(11月中旬)发布,并有望于今年第二季度推出,而英伟达最受关注的B100 或有望于3月的GTC 大会上亮相,预计9、10 月量产入市。据统计,2022年全球AI芯片市场规模约168.6亿美元,其中英伟达市场份额超过80%。同时在全球AI服务器加速芯片市场,该厂商市占比超过95%。CAvesmc
此外,另据OpenAl 测算,自 2012年以来,世界头部AI模型训练算力需求每3至4个月就翻一番,而每年头部训练模型所需算力增幅高达10倍。但摩尔定律的规律却是,每隔18至24个月芯片计算性能大约只翻一番。可见,芯片的计算性能增速是滞后的,而算力需求的暴增将推动更多芯片的销量。长期来看,随着更多厂商AI芯片的入市,市场竞争亦将更为激烈。CAvesmc
尽管以大模型为主的生成式AI技术的发展,为人们的生产生活提升了效率和便利性,但在其应用背后却隐藏着高昂的部署成本。CAvesmc
据国盛证券报告估算,GPT-3单次训练成本约为140万美元,对于一些更大的LLM训练成本在200万到1200万美元之间。以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约8亿美元,日均耗电费用约5万美元。正因如此,自2019年以来,OpenAI获得了来自微软的130亿美元的巨额投资(持股49%)。CAvesmc
事实上,ChatGPT 的模型计算本质上是借助微软 IDC (互联网数据中心)资源——在云端完成计算。可见,作为承接AI计算任务的重要算力基础设施的IDC,其成本和规模并非多数企业所能承受。CAvesmc
不过,随着生成式AI的快速发展和迭代,更为个性化和低成本的计算需求正在形成。据Alphabet董事长John Hennessy评估,每一次基于生成式 AI 的网络搜索查询(query)其成本是传统搜索的10倍(微调可降低成本)。所以,部署在云端(侧)和终端(侧)的混合AI才是AI的未来。混合AI将支持生成式 AI服务商(含开发者和提供商)利用边缘终端的计算能力降低成本。CAvesmc
据杨昀煦介绍,随着数据生成的速度和复杂性不断增加,大数据的处理和分析需要更强大的计算能力的同时,更需要高效的数据处理方法;边缘计算则将数据处理和计算放在更靠近物或者数据源头的一侧,需要网、算、存更集成的平台来满足要求;云计算对比来讲则更集中化、规模化,但对业务和数据灵活性要求更高。结合行业来看,三种技术在不同行业的不同应用场景中被要求发挥不同的性能特征,不同的工作场景都对存储技术带来不同的要求。她指出,大数据环境的海量非结构化数据存储、边缘计算领域对数据传输和处理效率上的要求、以及云计算对数据存储安全以及可扩展性提出要求。CAvesmc
CAvesmc
图3:生成式AI生态链使应用数量激增CAvesmc
与仅在云端进行处理不同,混合 AI 架构可根据不同计算需求,在云端和边缘终端间分配并协调AI工作负载。通过云端和边缘终端协作,可实现更强大、更高效且高度优化的Al。CAvesmc
如今,随着个人计算需求的落地,被定义为个人AI助理的AI PC将成为AI普惠的首选终端。因此,OEM厂商将其视作新商机,并开始进行商业部署,比如联想AI PC将在2024年率先搭载个人大模型,“AI与PC结合将形成‘ 算力平台+个人大模型+AI应用 ’的新型混合体”。CAvesmc
而随着AI应用落地和更新周期的复苏,联想预计今年全球PC出货量或实现5%的增幅,戴尔(Dell)则预计全年增速为3%-4%。此外,全球最大处理器厂商英特尔乐观宣称,到2025 年将实现出货高达1亿台PC的目标,几乎占PC TAM(总目标市场)总量的30%。CAvesmc
此外,基于生成式AI的设备开始向手机行业渗透。据Counterpoint Research初步预测, 2024年AI智能手机出货量将超过1亿部。到2027年, 此类手机出货量将达5.22亿部,复合年增长率为83%。该机构将“生成式AI手机”定义为,能够生成创建,诸如艺术作品、音乐、视频等原创内容,且可在本地运行AI模型的智能手机。CAvesmc
在移动设备处理器领域,高通和联发科亦都所布局。其中,高通在报告中指出,“骁龙作为提升顶级 Android 体验的领先移动平台,其中就包含已出货的20 多亿个具备AI能力的处理器”。另外,该公司还引用第三方数据指出,“公司将以超过 40%的市场份额保持 AI 智能手机处理器出货量的领导地位,远超苹果(25%)和联发科(24%)等其他公司。”CAvesmc
随着强大性能的生成式AI模型不断缩小,手机端侧的处理能力将持续提升,如在今年1月8日,OPPO发布了首个端侧应用70亿参数大语言模型手机。CAvesmc
此前,高通在报告中表示,“参数超过10亿的AI 模型能在手机上运行,且性能和精确度水平达到与云端相似的水平。不久的将来,拥有100亿或更高参数的模型将能够在终端上运行。”CAvesmc
CAvesmc
表1:中国手机厂商在大语言模型(LLM)的部署CAvesmc
杨昀煦称,在各个行业的大规模的、复杂的数据处理需求的场景里,“智能化”应用都能发挥很好的作用,帮助快速、科学、有效的提供决策辅助,如在交通的调度场景、制造的工业设计、电力行业的智能电网管理、金融行业的客户分析、风险分析、水利行业的水位、流量检测等领域。CAvesmc
随着工业“智能化改造数字化转型”加速落地,智能制造进程的持续推进,以及融入AI技术的各类多样化消费需求的不断涌现,正在成为推动算力投资的新引擎。CAvesmc
以往中国计算产业的大量核心芯片和重要器件主要依赖进口,但是近年来,中国本土企业依托超大规模市场优势,形成覆盖全产业链的生态,厚积薄发,涌现出一批先进计算技术成果。CAvesmc
比如,华为推出了推理芯片昇腾310和训练芯片910,其中昇腾910B AI芯片已被百度采购,用以替代英伟达同类产品。此外,壁仞科技还推出了首款用GPU芯片BR100;以及天数智芯(智铠100)、沐曦(N100)等发布AI 推理芯片。与此同时,专注于NAND闪存的长江存储(YMTC)和专注于 DRAM 存储的长鑫存储(CXMT)都将受益于AI热门的应用需求。CAvesmc
尖端技术突破,并不只能简单被视作产业升级,最重要的是,“独立自主”更关乎国家命运与安全。CAvesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
当地时间2月10 - 11日,由法国、印度联合主办的人工智能行动峰会(AI Action Summit)在巴黎大皇宫隆重举行。
在汽车行业智能化与电动化浪潮的冲击下,传统汽车巨头纷纷寻求战略转型与资本布局的优化……
国际电子商情10日讯 最新数据显示,2024年全球半导体行业迎来了历史性突破,销售额首次突破6000亿美元大关,达到6276亿美元,同比增长19.1%……
斥资9500亿韩元收购日本FICT,MBK Partners到底图什么?
自特朗普开启第二任期以来,芯片关税的征收似乎已成定局。随着特朗普芯片关税逼近,有消息称台积电2025年先进制程价格大涨超15%以上……
全球芯片市场的激烈竞争中,中国芯片产业迎来了历史性突破。2024年,中国芯片出口首次突破1万亿元大关,成为全球市场的焦点。然而,尽管成绩斐然,高端芯片的进口依赖仍然显著,未来的挑战依然严峻……
国际电子商情5日讯 日本电子巨头松下公司正在考虑出售或缩减其陷入困境的电视业务,集中力量发展人工智能数据中心等高利润领域……
先进封装技术作为提升芯片性能的关键手段,正成为全球半导体产业竞争的焦点。进入2025年,尤其在人工智能、5G通信、汽车电子和高性能计算等新兴技术的推动下,市场对芯片的性能、功耗和集成度提出了更高要求,促使全球半导体厂商加大在先进封装技术研发和产能扩充上的投入。最近一段时间,格芯和台积电等巨头纷纷加码布局,美国补贴政策的落地,标志着一场围绕先进封装的全球竞争已然拉开帷幕……
当地时间1月22日上午,OpenAI正式官宣一项重大战略举措——启动“星际之门计划”(The Stargate Project)。该计划的核心是成立一家全新公司,旨在为OpenAI
国际电子商情讯 美国商业专利数据库IFI Claims日前公布了2024年度美国专利授权量50强名单。这份榜单不仅反映了各大公司的创新能力,还揭示了全球科技行业的竞争格局。
国际电子商情24日讯,被看作“晴雨表”的模拟芯片巨头德州仪器(Texas Instruments Inc.)23日公布了令人失望的2025年第一季度盈利预测,暗示工业芯片市场衰退将持续……
国际电子商情23日讯 韩国科技巨头SK海力士日前发布的2024财年及第四季度财务报告显示,公司营业收入达66.1930万亿韩元,营业利润23.4673万亿韩元,净利润19.7969万亿韩元,营业利润率达35%,净利润率30%,均创下历史新高。这一成绩不仅超越2018年存储器市场繁荣期,还凸显了SK海力士在AI半导体存储器领域的强大竞争力。
近日,Tokyo Electron(以下简称“TEL”)宣布,将在日本宫城县建造一座新的生产大楼,由TEL的制造子公司TEL宫城公司
近日,北京大学物理学院杨学林、沈波团队,联合宽禁带半导体研究中心等多个科研机构,在氮化镓外延薄膜中位错的原
数据中心/云计算可以说是人工智能领域的核心,占据了英伟达总收入的85%~90%。
近日,重庆市人民政府办公厅印发《重庆市推动经济持续向上向好若干政策举措》,提出支持科技领军企业、产业链龙
2月10日消息,据彭博社记者马克·古尔曼报道,苹果公司取消了一款与Mac连接使用的AR眼镜项目,但仍在积极推进独立
韩国媒体TheBell报道,三星正在为旗下自研处理器Exynos2600投入大量资源,以确保其按时量产。
尽管全球平板电脑市场在2024年的大部分时间都保持着两位数的增长,但在2024年Q4,平板电脑出货量仅同比增长3%。
2月7日,日本AR眼镜光学厂商Cellid宣布,公司通过定向增发完成总额1300万美元(约人民币9478.95万元)的融资。
近日,多家媒体发布消息称,瑞芯微前副总经理陈锋将出任Arm在中国的合资公司安谋科技首席执行官(CEO)一职。
美国市场研究机构Gartner发布2024年全球半导体厂商营收排行榜。
随着传统扩展方式的成本和复杂性上升,先进封装已成为满足人工智能(尤其是大型语言模型训练)性能需求的一种方式
2024年Q4,全球笔记本电脑出货量同比增长了6%,达到5450万台。
英飞凌位于曼谷南部沙没巴干府的新后道厂破土动工,该厂将扩大公司在亚洲的生产布局。
2024年,集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化
雅加达,印尼- 2025年1月14日 - 全球技术解决方案供应商艾睿电子(Arrow Electronics)与印尼初创协会合作(STARFIN
无畏挑战 共创未来祥龙回首留胜景,金蛇起舞贺新程。在2025年元旦新年之际,深圳市凯新达科技有限公司(以下简
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准;
配套USB网关,轻松实现Wi-
随着与三安光电的碳化硅合资工厂落地重庆,2024年6月,意法半导体与重庆市彭水自治县同步启动了可持续发展合作
凯新达科技 自由之旅 征途同行
NVIDIA Jetson Orin™ Nano Super 开发者套件是一款尺寸小巧且性能强大的超级计算机,重新定义了小型边
德州仪器今日推出了全新的集成式汽车芯片,能够帮助各个价位车辆的驾乘人员,实现更安全、更具沉浸感的驾驶体验
广州飞虹半导体科技有限公司成立于广州越秀区,诚信经营20多年。主要研发、生产、经营:场效应管、三极管等半
近日,半导体存储品牌企业江波龙与工业和信息化部电子第五研究所(中国赛宝实验室,以下简称“电子五所”)在江波龙
深圳迈巨微电子有限公司深耕锂电池管理芯片领域,围绕电池健康和安全,电池电量计算二个核心技术能力,提供完善的
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈