没有人会相信近十年间,与训练模型和数据相关的计算量会扩大100万倍。而在生成式AI需求爆发式增长的背景下,行业更需要进行充分的供应链准备,以满足全球对AI的需求,这也是黄仁勋之所以多次强调加速计算的原因所在。
过去十年中,云计算以每年20%的增幅高速增长,并迅速发展成为一个万亿美元的产业。IDC预测称,到2025年,云将超过本地基础设施,成为65%的企业组织存储、管理和分析运营数据的主要方式。但与之前相比,企业更关注云计算带来的运营成本效益,已经迁移到云端的客户开始关注平台和软件服务。iYxesmc
NVIDIA在GTC 2023上描绘了为全球客户构建数据中心和AI基础设施的蓝图,并推出了全新的DGX 计算机, 搭载了8颗NVIDIA GPU。iYxesmc
其实早在2016年,NVIDIA创始人兼首席执行官黄仁勋先生就亲手向OpenAI交付了第一台NVIDIA DGX超级计算机。此后数年里,NVIDIA DGX从最初被用作AI技术的研究设备,逐步被企业扩展至数据优化和AI处理,据称财富前100强公司中约有半数采用了DGX。进入2023年后,随着ChatGPT的走红,部署像ChatGPT这样的大型语言模型(LLM)正在成为DGX越来越重要的一项工作。iYxesmc
而为了加快把DGX能力带给初创企业和其他各类企业,以助力其快速打造新产品和制定AI战略,NVIDIA最新发布了NVIDIA DGX Cloud。通过与微软Azure、Google Cloud和Oracle Cloud Infrastructure合作,“从浏览器上”即可实现将NVIDIA DGX AI超级计算机“带给每家公司”的愿景。这一模式也被称之为Training-as-a-Service,或者Model Making-as-a-Service。 iYxesmc
实际上,这并不是英伟达第一次公布DGX Cloud。此前在英伟达2022财年四季度财报发布时,黄仁勋先生就向外界透露说英伟达将与云服务厂商展开合作,让客户以使用网页浏览器的方式,就能通过NVIDIA DGX Cloud来使用DGX计算机,从而训练和部署大型语言模型或完成其他AI工作负载。iYxesmc
简单而言,DGX Cloud可提供 NVIDIA DGX AI超级计算专用集群,并配以NVIDIA AI Enterprise软件推动AI端到端开发和部署。每个企业都可以通过一个简单的网络浏览器访问自己的AI超级计算机,免除了购置、部署和管理本地基础设施的复杂性。同时,企业可按月租用DGX Cloud集群,以便能够快速、轻松地扩展大型多节点训练工作负载的开发,而无须等待需求量通常很大的加速计算资源。iYxesmc
目前,NVIDIA正在与领先的云服务商联合托管DGX Cloud基础设施,Oracle Cloud Infrastructure(OCI)将首当其冲,通过其OCI超级集群,提供专门构建的RDMA网络、裸金属计算以及高性能本地块存储,可扩展到超过32,000个GPU所组成的超级集群。微软Azure预计将在下个季度开始托管DGX Cloud,该服务将很快扩展到Google Cloud等。iYxesmc
为了加速企业使用生成式AI的工作,NVIDIA发布的另一项重磅消息则是推出NVIDIA AI Foundations云服务系列,为需要构建、完善和运行自定义大型语言模型及生成式 AI的客户提供服务,他们通常使用专有数据进行训练并完成特定领域的任务。iYxesmc
AI Foundations服务包括三类:NVIDIA NeMo,用于构建自定义语言文本-文本转换生成模型;Picasso视觉语言模型制作服务,适用于想要构建使用授权或专有内容训练而成的自定义模型的客户;以及BioNeMo,助力2万亿美元规模的药物研发行业的研究人员。iYxesmc
NeMo和Picasso服务运行在可通过浏览器访问的NVIDIA DGX Cloud上。开发人员可以通过简单的应用编程接口(API)使用每项服务上提供的模型。一旦模型可以部署,企业就能够使用NVIDIA AI Foundations云服务大规模地运行推理工作负载。iYxesmc
每项云服务都包含六个要素:预训练模型、数据处理框架、矢量数据库和个性化服务、经过优化的推理引擎、各种API、以及NVIDIA专家提供的支持,可帮助企业针对其自定义用例调整模型。iYxesmc
从已公布的用户案例来看:iYxesmc
与此同时,加速生成式AI模型的快速部署也是NVIDIA关心的重点。为此,黄仁勋先生发布了用于AI视频、图像生成、大型语言模型部署和推荐器推理的推理平台,这些平台将NVIDIA的全套推理软件与最新的NVIDIA Ada、Hopper和Grace Hopper处理器相结合,包括同时在最近推出的NVIDIA L4 Tensor Core GPU和NVIDIA NVL GPU。iYxesmc
iYxesmc
Google Cloud是首家支持L4 Tensor Core GPU的云服务提供商,该公司已推出新的G2虚拟机并在近日提供私人预览版。此外,谷歌还将L4 GPU集成到其Vertex AI模型商店中。资料显示,L4 GPU是一款适用于几乎所有工作负载的通用GPU,具有更加强大的AI视频功能,可提供比CPU高120倍的AI视频性能,同时能效提高了99%。iYxesmc
据IDC统计,全球算力的需求每3.5个月就会翻一倍,远远超过了当前算力的增长速度。在此驱动下,全球计算、存储和网络基础设施也在发生根本转变,一些复杂的工作负载,在通用的CPU上不能很好的处理,为减轻CPU/GPU内核的负担,很多一级云服务提供商开始考虑如何在单芯片DPU上就可实现网络、存储、安全等关键任务的加速工作。iYxesmc
2020年10月,英伟达将基于Mellanox的SmartNIC技术推出 BlueField DPU(数据处理器),并将CPU、GPU、DPU称之为组成“未来计算的三大支柱”。作为面向数据中心的专用处理器,DPU新增了AI、安全、存储和网络等各种加速功能,能够对性能敏感且通用的基础设施工作负载进行加速,从而更好地支撑CPU、GPU的上层业务,成为整个网络的中心节点。iYxesmc
有行业人士表示,未来,用于数据中心的DPU量级将达到和数据中心服务器等量的级别。“每台服务器可能没有GPU,但一定会有一块或者几块DPU卡,这将是一个千亿量级的市场。”iYxesmc
本届GTC 2023上,NVIDIA宣布Oracle云基础设施(OCI)已选择 NVIDIA BlueField-3 DPU作为其网络堆栈的最新部分,从而为其客户提供一个强大的新选项,用于从CPU卸载数据中心基础设施任务。iYxesmc
BlueField-3 DPU是NVIDIA第三代数据处理器,与上一代BlueField DPU相比,BlueField-3 DPU支持高达400Gbps的以太网和InfiniBand网络连接,提供了4倍的计算能力、4倍的加密加速性能、2倍的存储处理性能和4倍的内存带宽。测试显示,与未使用DPU的服务器相比,使用NVIDIA BlueField DPU的服务器可降低高达24%的功耗。iYxesmc
通过NVIDIA DOCA软件框架,BlueField DPU可完全向后兼容。NVIDIA DOCA为开发者提供先进的零信任安全功能,使开发者能够创建用于控制资源访问的计量云服务、验证每个应用程序和用户、隔离可能被入侵的机器,并帮助保护数据免遭破坏和盗窃。iYxesmc
在计算机科学界,没有人会相信近十年间,与训练模型和数据(从AlexNet训练到现在)相关的计算量会扩大100万倍。而在生成式AI需求爆发式增长的背景下,行业更需要进行充分的供应链准备,以满足全球对AI的需求。这也解释了黄仁勋之所以多次强调加速计算的原因所在,毕竟,通过执行这样的全栈操作,不但可以将计算性能显著提升,更可以有效节省计算时间,从而节约能源,助推可持续发展。iYxesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
国际电子商情24日讯,被看作“晴雨表”的模拟芯片巨头德州仪器(Texas Instruments Inc.)23日公布了令人失望的2025年第一季度盈利预测,暗示工业芯片市场衰退将持续……
国际电子商情23日讯 韩国科技巨头SK海力士日前发布的2024财年及第四季度财务报告显示,公司营业收入达66.1930万亿韩元,营业利润23.4673万亿韩元,净利润19.7969万亿韩元,营业利润率达35%,净利润率30%,均创下历史新高。这一成绩不仅超越2018年存储器市场繁荣期,还凸显了SK海力士在AI半导体存储器领域的强大竞争力。
国际电子商情讯 美东时间2025年1月20日,美国总统唐纳德·特朗普在其就职首日签署了一系列行政令,废除了前总统拜登政府的78项政策,其中包括对人工智能的监管政策。这一举动不仅引发了广泛的政治讨论,也对高科技行业和半导体产业产生了深远影响……
CSIA:共同捍卫人工智能这个全人类的智慧结晶。
国际电子商情17日讯 1月16日,中国汽车工业协会(中汽协)发布声明,坚决反对拜登政府发布的禁止使用中国智能网联汽车软硬件的规则。
在当前全球科技竞争愈发激烈的背景下,美国政府对AI芯片实施的出口管制政策成为了业界焦点。国际电子商情16日获悉,台积电董事长魏哲家在今(16)日法说会上对此政策的影响进行了回应……
国际电子商情16日讯 在全球NAND闪存市场供过于求的背景下,闪存价格已经连续四个月下跌。为此,SK海力士日前也宣布加入减产行列,这家韩国存储芯片制造商计划在2025年上半年将其NAND闪存产量减少10%……
当地时间1月15日,美国商务部BIS修订了《出口管制条例》,并把25家中国实体新增至实体清单。最新被列入实体清单的中国企业,涵盖了AI大模型公司、AI芯片设计企业以及光刻机相关企业等领域。
国际电子商情15日讯 日本政府正积极采取措施以提升其在全球芯片设计领域的竞争力,计划投入1600亿日元(约合74.37亿元人民币)支持本土芯片设计产业。这一举措标志着日本从生产环节向设计研发上游的转型,旨在缩小与中国和美国在该领域的差距……
寒武纪股市“非理性繁荣”?
2024年,中国企业纷纷抢购半导体,导致集成电路进口量显著增长。这种购买热潮的背后,是对中美科技竞争加剧的担忧,以及对美国政府可能实施更严格贸易限制、限制中国获取高端芯片的预期。
国际电子商情14日讯 在拜登政府即将离任之际,美国总统拜登通过白宫官网正式公布了针对人工智能(AI)的临时最终出口管制规则,并启动了为期120天的公众意见征询期。
根据TrendForce集邦咨询最新研究报告指出,NANDFlash产业2025年持续面临需求疲弱、供给过剩的双重压力。
据TrendForce集邦咨询调查,1月21日嘉义地区芮氏规模6.4地震对邻近的晶圆代工厂、面板厂影响情况,TSMC(台积电)及
从拉各斯到内罗毕,从开罗到约翰内斯堡,线下零售渠道依然是非洲智能手机市场的中坚力量,在绝大多数地区贡献了超
荷兰特文特大学科学家开发出一种新工艺,能在室温下制造出晶体结构高度有序的半导体材料。
TrendForce集邦咨询公布了1月下旬面板报价,2025年1月下旬,电视面板价格上涨;显示器、笔记本面板价格持稳。
国家大基金队伍之一大基金三期再次出手,巨资布局人工智能(AI)。
根据TrendForce集邦咨询调查1月21日嘉义地区芮氏规模6.4地震对邻近的晶圆代工厂、面板厂影响情况,TSMC(台积电
根据Trend根据TrendForce集邦咨询最新《2025红外线感测应用市场与品牌策略》报告,目前激光雷达(LiDAR)在车用市
1月14日,美国射频厂商MACOM宣布拟投资3.45亿美元(折合人民币约25.28亿元),对其位于马萨诸塞州和北卡罗来纳州的
全球晶圆代工龙头台积电最新财报亮眼。
继美光和三星两大半导体厂商发生人事变动之后,近日,英特尔前首席架构师跳槽至高通的消息再次引发业界高度关注
根据TrendForce集邦咨询最新研究,美国2024年12月非农就业人数和制造业采购经理人指数(PMI)皆优于市场预期,美国
英飞凌位于曼谷南部沙没巴干府的新后道厂破土动工,该厂将扩大公司在亚洲的生产布局。
2024年,集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化
雅加达,印尼- 2025年1月14日 - 全球技术解决方案供应商艾睿电子(Arrow Electronics)与印尼初创协会合作(STARFIN
无畏挑战 共创未来祥龙回首留胜景,金蛇起舞贺新程。在2025年元旦新年之际,深圳市凯新达科技有限公司(以下简
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准;
配套USB网关,轻松实现Wi-
随着与三安光电的碳化硅合资工厂落地重庆,2024年6月,意法半导体与重庆市彭水自治县同步启动了可持续发展合作
凯新达科技 自由之旅 征途同行
NVIDIA Jetson Orin™ Nano Super 开发者套件是一款尺寸小巧且性能强大的超级计算机,重新定义了小型边
德州仪器今日推出了全新的集成式汽车芯片,能够帮助各个价位车辆的驾乘人员,实现更安全、更具沉浸感的驾驶体验
广州飞虹半导体科技有限公司成立于广州越秀区,诚信经营20多年。主要研发、生产、经营:场效应管、三极管等半
近日,半导体存储品牌企业江波龙与工业和信息化部电子第五研究所(中国赛宝实验室,以下简称“电子五所”)在江波龙
深圳迈巨微电子有限公司深耕锂电池管理芯片领域,围绕电池健康和安全,电池电量计算二个核心技术能力,提供完善的
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈