为了搭建好的AI基础设施，英伟达也是蛮拼的-国际电子商情

没有人会相信近十年间，与训练模型和数据相关的计算量会扩大100万倍。而在生成式AI需求爆发式增长的背景下，行业更需要进行充分的供应链准备，以满足全球对AI的需求，这也是黄仁勋之所以多次强调加速计算的原因所在。

过去十年中，云计算以每年20%的增幅高速增长，并迅速发展成为一个万亿美元的产业。IDC预测称，到2025年，云将超过本地基础设施，成为65%的企业组织存储、管理和分析运营数据的主要方式。但与之前相比，企业更关注云计算带来的运营成本效益，已经迁移到云端的客户开始关注平台和软件服务。ALFesmc

DGX Cloud：随时随地将AI带给每家公司

NVIDIA在GTC 2023上描绘了为全球客户构建数据中心和AI基础设施的蓝图，并推出了全新的DGX 计算机, 搭载了8颗NVIDIA GPU。ALFesmc

其实早在2016年，NVIDIA创始人兼首席执行官黄仁勋先生就亲手向OpenAI交付了第一台NVIDIA DGX超级计算机。此后数年里，NVIDIA DGX从最初被用作AI技术的研究设备，逐步被企业扩展至数据优化和AI处理，据称财富前100强公司中约有半数采用了DGX。进入2023年后，随着ChatGPT的走红，部署像ChatGPT这样的大型语言模型(LLM)正在成为DGX越来越重要的一项工作。ALFesmc

而为了加快把DGX能力带给初创企业和其他各类企业，以助力其快速打造新产品和制定AI战略，NVIDIA最新发布了NVIDIA DGX Cloud。通过与微软Azure、Google Cloud和Oracle Cloud Infrastructure合作，“从浏览器上”即可实现将NVIDIA DGX AI超级计算机“带给每家公司”的愿景。这一模式也被称之为Training-as-a-Service，或者Model Making-as-a-Service。 ALFesmc

实际上，这并不是英伟达第一次公布DGX Cloud。此前在英伟达2022财年四季度财报发布时，黄仁勋先生就向外界透露说英伟达将与云服务厂商展开合作，让客户以使用网页浏览器的方式，就能通过NVIDIA DGX Cloud来使用DGX计算机，从而训练和部署大型语言模型或完成其他AI工作负载。ALFesmc

简单而言，DGX Cloud可提供 NVIDIA DGX AI超级计算专用集群，并配以NVIDIA AI Enterprise软件推动AI端到端开发和部署。每个企业都可以通过一个简单的网络浏览器访问自己的AI超级计算机，免除了购置、部署和管理本地基础设施的复杂性。同时，企业可按月租用DGX Cloud集群，以便能够快速、轻松地扩展大型多节点训练工作负载的开发，而无须等待需求量通常很大的加速计算资源。ALFesmc

目前，NVIDIA正在与领先的云服务商联合托管DGX Cloud基础设施，Oracle Cloud Infrastructure(OCI)将首当其冲，通过其OCI超级集群，提供专门构建的RDMA网络、裸金属计算以及高性能本地块存储，可扩展到超过32,000个GPU所组成的超级集群。微软Azure预计将在下个季度开始托管DGX Cloud，该服务将很快扩展到Google Cloud等。ALFesmc

赋能生成式AI

为了加速企业使用生成式AI的工作，NVIDIA发布的另一项重磅消息则是推出NVIDIA AI Foundations云服务系列，为需要构建、完善和运行自定义大型语言模型及生成式 AI的客户提供服务，他们通常使用专有数据进行训练并完成特定领域的任务。ALFesmc

AI Foundations服务包括三类：NVIDIA NeMo，用于构建自定义语言文本-文本转换生成模型；Picasso视觉语言模型制作服务，适用于想要构建使用授权或专有内容训练而成的自定义模型的客户；以及BioNeMo，助力2万亿美元规模的药物研发行业的研究人员。ALFesmc

NeMo和Picasso服务运行在可通过浏览器访问的NVIDIA DGX Cloud上。开发人员可以通过简单的应用编程接口(API)使用每项服务上提供的模型。一旦模型可以部署，企业就能够使用NVIDIA AI Foundations云服务大规模地运行推理工作负载。ALFesmc

每项云服务都包含六个要素：预训练模型、数据处理框架、矢量数据库和个性化服务、经过优化的推理引擎、各种API、以及NVIDIA专家提供的支持，可帮助企业针对其自定义用例调整模型。ALFesmc

从已公布的用户案例来看：ALFesmc

Adobe正与NVIDIA共同开发新一代先进的生成式AI模型，侧重于将生成式AI深度集成到全球顶尖创作者和营销人员所使用的应用中。

Shutterstock正在与NVIDIA一起训练一个生成式文本-3D转换基础模型，创作时间可从数小时缩短至数分钟。通过使用NVIDIA Picasso生成式AI云服务构建自定义模型，Shutterstock将帮助3D艺术家创建物体形状、帮助展开物体、生成纹理和材质，甚至为非3D内容创作者制作可直接用于各种应用和平台的完整3D模型。

Getty Images正在与NVIDIA一起训练负责任的生成式文本-图像，以及文本-视频转换基础模型。这些模型将使用简单的文本提示创建图像和视频，并将在Getty Images完全授权的资产上进行训练。Getty Images将根据这些模型所产生的收入向艺术家支付版权费。

生物技术公司安进(Amgen)使用其专有的抗体专利数据对BioNeMo ESM模型架构进行了预训练和微调。该公司将在DGX Cloud上训练五个用于分子筛选和优化的自定义模型，所需要的时间从三个月缩短到了几周。

与此同时，加速生成式AI模型的快速部署也是NVIDIA关心的重点。为此，黄仁勋先生发布了用于AI视频、图像生成、大型语言模型部署和推荐器推理的推理平台，这些平台将NVIDIA的全套推理软件与最新的NVIDIA Ada、Hopper和Grace Hopper处理器相结合，包括同时在最近推出的NVIDIA L4 Tensor Core GPU和NVIDIA NVL GPU。ALFesmc

用于AI视频的NVIDIA L4可提供比CPU高出120倍的由AI支持的视频性能，同时提高99%的能效。

用于图像生成的NVIDIA L40针对图形以及AI赋能的2D视频和3D图像生成进行了优化。

用于大型语言模型部署的NVIDIA NVL是规模化部署ChatGPT等大型语言模型的理想选择。

用于推荐模型的NVIDIA Grace Hopper是图形推荐模型、矢量数据库和图形神经网络的理想选择。

ALFesmc

Google Cloud是首家支持L4 Tensor Core GPU的云服务提供商，该公司已推出新的G2虚拟机并在近日提供私人预览版。此外，谷歌还将L4 GPU集成到其Vertex AI模型商店中。资料显示，L4 GPU是一款适用于几乎所有工作负载的通用GPU，具有更加强大的AI视频功能，可提供比CPU高120倍的AI视频性能，同时能效提高了99%。ALFesmc

BlueField-3 DPU提升数据中心的性能、效率和安全性

据IDC统计，全球算力的需求每3.5个月就会翻一倍，远远超过了当前算力的增长速度。在此驱动下，全球计算、存储和网络基础设施也在发生根本转变，一些复杂的工作负载，在通用的CPU上不能很好的处理，为减轻CPU/GPU内核的负担，很多一级云服务提供商开始考虑如何在单芯片DPU上就可实现网络、存储、安全等关键任务的加速工作。ALFesmc

2020年10月，英伟达将基于Mellanox的SmartNIC技术推出 BlueField DPU（数据处理器），并将CPU、GPU、DPU称之为组成“未来计算的三大支柱”。作为面向数据中心的专用处理器，DPU新增了AI、安全、存储和网络等各种加速功能，能够对性能敏感且通用的基础设施工作负载进行加速，从而更好地支撑CPU、GPU的上层业务，成为整个网络的中心节点。ALFesmc

有行业人士表示，未来，用于数据中心的DPU量级将达到和数据中心服务器等量的级别。“每台服务器可能没有GPU，但一定会有一块或者几块DPU卡，这将是一个千亿量级的市场。”ALFesmc

本届GTC 2023上，NVIDIA宣布Oracle云基础设施（OCI）已选择 NVIDIA BlueField-3 DPU作为其网络堆栈的最新部分，从而为其客户提供一个强大的新选项，用于从CPU卸载数据中心基础设施任务。ALFesmc

BlueField-3 DPU是NVIDIA第三代数据处理器，与上一代BlueField DPU相比，BlueField-3 DPU支持高达400Gbps的以太网和InfiniBand网络连接，提供了4倍的计算能力、4倍的加密加速性能、2倍的存储处理性能和4倍的内存带宽。测试显示，与未使用DPU的服务器相比，使用NVIDIA BlueField DPU的服务器可降低高达24%的功耗。ALFesmc

通过NVIDIA DOCA软件框架，BlueField DPU可完全向后兼容。NVIDIA DOCA为开发者提供先进的零信任安全功能，使开发者能够创建用于控制资源访问的计量云服务、验证每个应用程序和用户、隔离可能被入侵的机器，并帮助保护数据免遭破坏和盗窃。ALFesmc

结语

在计算机科学界，没有人会相信近十年间，与训练模型和数据(从AlexNet训练到现在)相关的计算量会扩大100万倍。而在生成式AI需求爆发式增长的背景下，行业更需要进行充分的供应链准备，以满足全球对AI的需求。这也解释了黄仁勋之所以多次强调加速计算的原因所在，毕竟，通过执行这样的全栈操作，不但可以将计算性能显著提升，更可以有效节省计算时间，从而节约能源，助推可持续发展。ALFesmc

责编：Lefeng.shao

本文为国际电子商情原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

邵乐峰

ASPENCORE中国区首席分析师。

进入专栏

人工智能

微信扫一扫，一键转发
关注“国际电子商情” 微信公众号

巴黎AI峰会现分歧：联合声明遇冷，“空谈”质疑待解
当地时间2月10 - 11日，由法国、印度联合主办的人工智能行动峰会(AI Action Summit)在巴黎大皇宫隆重举行。
雷诺重启与富士康谈判，拟出售日产股份
在汽车行业智能化与电动化浪潮的冲击下，传统汽车巨头纷纷寻求战略转型与资本布局的优化……
解读年初9家半导体巨头财报：行业分化的信号与未来
大家今天都开工了吧？
半导体市场增长强劲，2024年销售额首破6000亿美元大关
国际电子商情10日讯最新数据显示，2024年全球半导体行业迎来了历史性突破，销售额首次突破6000亿美元大关，达到6276亿美元，同比增长19.1%……
软银65亿美元收购Ampere谈判进入尾声，最快本月官宣
国际电子商情8日讯软银集团（SoftBank）以65亿美元（含债务）估值对美国芯片设计公司Ampere Computing LLC的收购交易接近达成，最快可能在本月官宣。交易若最终完成，将成为2025年全球半导体行业最具标志性的并购事件之一……
2024年全球半导体市场增长18.1%，AI和数据中心成核心驱
国际电子商情7日讯据市调机构Gartner近日发布的最新数据，2024年全球半导体市场收入总额达6260亿美元，同比增长18.1%，
豪掷9500亿韩元！韩国私募基金MBK Partners收购日本FICT
斥资9500亿韩元收购日本FICT，MBK Partners到底图什么？
特朗普关税影响，传台积电2025年先进制程报价或涨超15%
自特朗普开启第二任期以来，芯片关税的征收似乎已成定局。随着特朗普芯片关税逼近，有消息称台积电2025年先进制程价格大涨超15%以上……
全球市场“卖爆”！2024年中国芯片出口首破万亿元大关
全球芯片市场的激烈竞争中，中国芯片产业迎来了历史性突破。2024年，中国芯片出口首次突破1万亿元大关，成为全球市场的焦点。然而，尽管成绩斐然，高端芯片的进口依赖仍然显著，未来的挑战依然严峻……
日本电子巨头松下或出售电视业务！世上再无松下电视？
国际电子商情5日讯日本电子巨头松下公司正在考虑出售或缩减其陷入困境的电视业务，集中力量发展人工智能数据中心等高利润领域……
台积电、格芯加码重金布局，2025年先进封装市场迎来新机
先进封装技术作为提升芯片性能的关键手段，正成为全球半导体产业竞争的焦点。进入2025年，尤其在人工智能、5G通信、汽车电子和高性能计算等新兴技术的推动下，市场对芯片的性能、功耗和集成度提出了更高要求，促使全球半导体厂商加大在先进封装技术研发和产能扩充上的投入。最近一段时间，格芯和台积电等巨头纷纷加码布局，美国补贴政策的落地，标志着一场围绕先进封装的全球竞争已然拉开帷幕……
史无前例，美国3.6万亿投资开启AI行业“星际之门计划”
当地时间1月22日上午，OpenAI正式官宣一项重大战略举措——启动“星际之门计划”(The Stargate Project）。该计划的核心是成立一家全新公司，旨在为OpenAI

全球半导体设备市场，方兴未艾！
近日，Tokyo Electron（以下简称“TEL”）宣布，将在日本宫城县建造一座新的生产大楼，由TEL的制造子公司TEL宫城公司
中国北大研究团队，氮化镓技术获新进展
近日，北京大学物理学院杨学林、沈波团队，联合宽禁带半导体研究中心等多个科研机构，在氮化镓外延薄膜中位错的原
2025年数据中心五大趋势
数据中心/云计算可以说是人工智能领域的核心，占据了英伟达总收入的85%～90%。
重庆发布新政，聚焦高端芯片与器件发展
近日，重庆市人民政府办公厅印发《重庆市推动经济持续向上向好若干政策举措》，提出支持科技领军企业、产业链龙
消息称苹果取消Mac连接AR眼镜，独立AR眼镜研发仍推进中
2月10日消息，据彭博社记者马克·古尔曼报道，苹果公司取消了一款与Mac连接使用的AR眼镜项目，但仍在积极推进独立
三星2nmSF2工艺试产良率约30%？
韩国媒体TheBell报道，三星正在为旗下自研处理器Exynos2600投入大量资源，以确保其按时量产。
2024年Q4平板电脑市场整体增长放缓，iPad占据40%市场份额
尽管全球平板电脑市场在2024年的大部分时间都保持着两位数的增长，但在2024年Q4，平板电脑出货量仅同比增长3%。
AR微显示厂商Cellid完成1300万美元融资
2月7日，日本AR眼镜光学厂商Cellid宣布，公司通过定向增发完成总额1300万美元（约人民币9478.95万元）的融资。
多家半导体大厂官宣换帅！
近日，多家媒体发布消息称，瑞芯微前副总经理陈锋将出任Arm在中国的合资公司安谋科技首席执行官（CEO）一职。
全球半导体厂商营收10强排行榜出炉！
美国市场研究机构Gartner发布2024年全球半导体厂商营收排行榜。
2024年先进封装晶圆占比近半
随着传统扩展方式的成本和复杂性上升，先进封装已成为满足人工智能（尤其是大型语言模型训练）性能需求的一种方式
2024年AIPC未能提振笔电市场，仅从2023年的低点温和增长5%
2024年Q4，全球笔记本电脑出货量同比增长了6%，达到5450万台。

英飞凌在泰国新建后道工厂，优化和丰富生产布局
英飞凌位于曼谷南部沙没巴干府的新后道厂破土动工，该厂将扩大公司在亚洲的生产布局。
芯耀辉：从传统IP到IP2.0，AI时代国产IP机遇与挑战齐飞
2024年，集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化
艾睿电子与印尼初创协会合作，支持本地科技初创公司
雅加达，印尼- 2025年1月14日 - 全球技术解决方案供应商艾睿电子（Arrow Electronics）与印尼初创协会合作（STARFIN
【凯新达科技】新年欢聚，共绘年会精彩篇章！
无畏挑战共创未来祥龙回首留胜景，金蛇起舞贺新程。在2025年元旦新年之际，深圳市凯新达科技有限公司（以下简
CES 2025新品：摩尔斯微电子推出Wi-Fi芯片MM8108
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准；
配套USB网关，轻松实现Wi-
ST与彭水共绘可持续发展新篇章
随着与三安光电的碳化硅合资工厂落地重庆，2024年6月，意法半导体与重庆市彭水自治县同步启动了可持续发展合作
【凯新达科技】2025年度旅游活动景点精彩报道
凯新达科技自由之旅征途同行
超高性价比AI电脑：英伟达NVIDIA Jetson Orin Nano Super真香！iCEas
NVIDIA Jetson Orin™ Nano Super 开发者套件是一款尺寸小巧且性能强大的超级计算机，重新定义了小型边
TI推出新一代支持边缘AI的雷达传感器和汽车音频处理器，改进车内驾
德州仪器今日推出了全新的集成式汽车芯片，能够帮助各个价位车辆的驾乘人员，实现更安全、更具沉浸感的驾驶体验
【原厂入驻】飞虹半导体现已入驻iCEasy商城！
广州飞虹半导体科技有限公司成立于广州越秀区，诚信经营20多年。主要研发、生产、经营:场效应管、三极管等半
携手共进，江波龙与电子五所在中山展开深度交流
近日，半导体存储品牌企业江波龙与工业和信息化部电子第五研究所（中国赛宝实验室，以下简称“电子五所”）在江波龙
【原厂入驻】迈巨微电子现已入驻iCEasy商城！
深圳迈巨微电子有限公司深耕锂电池管理芯片领域，围绕电池健康和安全，电池电量计算二个核心技术能力，提供完善的

为了搭建好的AI基础设施，英伟达也是蛮拼的

DGX Cloud：随时随地将AI带给每家公司

赋能生成式AI

BlueField-3 DPU提升数据中心的性能、效率和安全性

结语

杂志声明