生成式AI大规模商用前提：提效率、降成本、降功耗……-国际电子商情

与大多数应用程序不同，虽然ChatGPT软件正在步入正轨，但是支持运行该应用程序的硬件却并非如此。

生成式人工智能(AI)的大规模落地取决于提高处理效率和降低总拥有成本。与互联网及其万维网应用程序的发明类似，生成式人工智能已经抓住了公众的想象力。ChatGPT技术一经发布就受到了各界的广泛关注，它是迄今为止用户增长最快的应用程序，仅在问世的前两个月内，注册用户数就突破了1亿人。hEVesmc

生成式AI正取得所有行业的关注，并有望释放出无与伦比的生产力浪潮。具体来看，生成式AI的市场潜力巨大，它可助力多个领域的发展，比如，辅助药物研发，提高医生诊断准确率，提高订单预测准确率，以及帮助程序员编写高质量软件代码。预计每年将能为全球经济增加4万亿美元以上的价值。hEVesmc

生成式AI大语言模型面临的硬件挑战

与大多数应用程序不同，虽然ChatGPT软件正在步入正轨，但是支持运行该应用程序的硬件却并非如此。hEVesmc

生成式AI大语言模型所面临的硬件挑战来源于——算法使用了大量的参数来生成结果。例如，ChatGPT的前一代模型GPT-3.5需要1,750亿个参数，虽然官方暂未公布GPT-4版的参数量，但是机构预估其参数量约有1.7万亿个。对此，支持生成式AI大语言模型的AI硬件加速器必须扩展到能够处理1,750亿到近2万亿个参数的标准，才能满足每个用户的查询操作。hEVesmc

在当前的计算架构上，处理器核心和存储器之间的大量数据流，通常在计算核心外部来进行处理。这种设置会导致内存瓶颈的出现，通常它也被称为“内存墙”，会带来严重的带宽限制。hEVesmc

以上因素不仅排除了CPU计算架构，而且还排除了GPU等其他AI计算架构。以GPT-4为例，其中高端的GPU约有97%的时间处于空闲状态，这相当于大约只有3%的效率。在这样的低效率下，一个标称计算能力为1 PetaOPS(每秒一千兆/一千万亿次运算)的处理器，只能产生大约30 teraOPS(每秒一兆/一万亿次运算)的处理速度。hEVesmc

如今，这些算法在高性能计算集群上执行，每个集群需要消耗大量的能源。随之而来的问题是，执行ChatGPT-4用户查询所需的功耗已经超出极限，这导致发电厂超载和能源分配网络压力过大。hEVesmc

ChatGPT的运行成本极其高昂

ChatGPT的功耗并非阻碍其商用落地的全部因素。ChatGPT技术的快速推出，进一步拉高了其配套硬件的投资成本。ChatGPT需要大量的计算资源和能源，它需要高端的硬件设备来支持运行，而高端设备的采购成本非常高昂，给企业和组织带来了巨大的财务压力。根据目前市场上先进处理器的采购选择，支持每秒运行10万次查询的GPT-4处理系统的采购成本高达数千亿美元，而运行该系统的能源年成本将在数亿美元左右。hEVesmc

显然，高昂的成本是大规模部署ChatGPT创新技术的障碍。hEVesmc

生成式AI大规模落地需满足三大要求

不过，这也为半导体行业的发展提供了机遇，通过提供支持性的硬件，可推动生成式AI大语言模型的发展。这需要一个可行的解决方案来解决可用基础设施架构不足的问题：hEVesmc

将处理效率从2%至4%提高到至少50%。标称计算能力为1 PetaOPS的AI处理器，必须在现实工作负载下提供至少500 TeraOPS的处理速度。
降低硬件成本。一个“有效的”而非“理论上的”计算能力为1 PetaOPS的AI处理器的成本不得超过1万美元。
更低的功耗。一个“有效的”而非“理论上的”计算能力为1 PetaOPS的AI处理器的功耗必须不超过100W。

总体而言，为了实现经济可持续性和节能，ChatGPT处理系统的成本效益必须提高两个数量级以上。只有把GPT-4系统上每秒运行10万次查询的年总成本从数千亿美元降低到100亿美元以下，才能实现生成式AI的承诺。hEVesmc

本文翻译自国际电子商情姊妹平台EETimes Europa，原文标题：The Promise and Reality of Generative AIhEVesmc

责编：Clover.li

本文为国际电子商情原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

业界新闻人工智能处理器

上一篇:安富利中国：凝聚芯力量，共创可持续未来
下一篇:存储主控芯片交易案告吹！监管部门处理细节披露

微信扫一扫，一键转发
关注“国际电子商情” 微信公众号

英集芯取消并购辉芒微
国际电子商情讯，3月17日晚间，深圳英集芯科技股份有限公司发布公告称，公司决定终止购买辉芒微电子（深圳）股份有限公司控制权，公司芯股票自2025年3月18日开市起复牌。
2024年全球IC设计公司营收TOP10揭晓
全球前十大IC设计公司全年营收合计达2498亿美元，同比激增49%。其中，英伟达以1243亿美元营收蝉联榜首，占据前十总份额的50%，与其他厂商形成断层式差距。
奥迪宣布裁员7500人！电动化转型遇阻，缩减用人成本
继宝马、奔驰裁员之后，奥迪也开始宣布裁员。
加码国产化！思远凭借DDR5 PMIC跨界存储赛道
最近，国产存储领域出现了一个新进者——思远半导体。这家在智能穿戴、TWS耳机、移动电源、BMS等领域深耕十数年的电源管理芯片(PMIC)Fabless，如今把业务范围成功地扩展到了存储电源领域。
突发！华大九天出资收购芯和半导体控股权
3月17日午间，华大九天发布公告称，正在筹划通过发行股份及支付现金等方式，购买芯和半导体的控股权，其股票自当日开市时起开始停牌，预计在不超过10个交易日的时间内披露本次交易方案。
四部委联合发布《人工智能生成合成内容标识办法》
近日，国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》（以下简称《标识办法》），该办法自 2025年9月1日起正式施行。
再次挥舞制裁大棒，美国意欲脱钩中国锂电池
日前，美国国会众议院以口头表决的方式一致通过了编号H.R.1166的《与依赖外国对手电池脱钩法》，禁止美国国土安全部采购宁德时代、比亚迪、远景能源、亿纬锂能、海辰储能和国轩高科六家中国企业生产的电池。
促进人工智能+消费！国家提振消费专项行动方案来了
2025年3月16日，中共中央办公厅、国务院办公厅印发《提振消费专项行动方案》并发出通知。其中涉及到“人工智能+”行动，促进“人工智能+消费”。
苹果iPhone 17 Air新爆料：厚5.5毫米，无SIM卡槽
国际电子商情讯，据彭博社资深记者马克·古尔曼（Mark Gurman）最新爆料，苹果正秘密打造一款颠覆性产品——iPhone 17 Air，该机型将以“史上最薄iPhone”姿态冲击市场，该机型将无SIM卡槽，机身厚度仅5.5毫米，较现有iPhone薄约2毫米。
微软断供！华为再无Windows可用，鸿蒙PC要来了吗？
"以后只有用我们的鸿蒙PC了。”
传长江存储4月涨价，涨幅或超10%
国际电子商情讯，继闪迪、美光宣布涨价之后，业内也传出长江存储也将涨价。根据中国闪存市场报道，根据渠道反馈，长江存储零售品牌致态也将于4月起面向渠道上调提货价格，幅度或将超过10%。
首款原生鸿蒙正式版手机要来了！DeepSeek加持
“全国人民买得起、想不到的产品”

英飞凌预计2025财年AI业务营收将突破6亿欧元，未来两年内有望超10
美通社消息，3月14日，“2025英飞凌消费、计算与通讯创新大会”（ICIC2025）在深圳举行。本届大会汇聚600多位业界精
湖南公布电子信息制造业重点项目，涉13个MLED、显示类项目
近日，湖南省工信厅发布了《2025年湖南电子信息制造业重点项目名单》，涵盖先进计算、音视频、新一代半导体、人
总投资7.6亿，惠科东莞平板显示项目二期开工
3月15日，质鼎集团公众号消息，惠科东莞平板显示集群电子商务项目二期正式开工。
中国台湾20家电子企业2024年第四季度和全年财报汇总，富士康、台积
富士康、台积电、广达、华硕、联发科、友达光电等中国台湾20家电子企业2024年第四季度和全年财报汇总。
全球LED显示屏市场机遇与挑战分析
近年来，LED显示屏市场持续演进。回顾2024年，行业呈现出哪些发展态势？展望2025年及未来，市场又将面临哪些机遇与
索尼发布全新RGBLED背光技术
近日，索尼正式发布新一代RGBLED背光技术系统，可实现4000尼特峰值亮度。索尼计划该系统将于2025年开始量产，并将
AI爆发，本土先进封装如何突破？
AI芯片是半导体最大的增长点，先进封装则是制造AI芯片的关键技术。此前英伟达H100成本约3000美元，而用先进封装
欧美车用固态电池验证加速，预计最快2026年逐步实现量产
截止2024年底，17家欧美固态电池企业融资总额已突破42亿美元。
中国半导体走向幕后时代
曾几何时，中国半导体几乎不断有大基金投资、大项目上马，以及美国制裁的新闻。长期处于聚光灯下，中国半导体成为
Dynabook（原东芝PC部门）在退出10年后重返美国消费市场
Dynabook在退出十年后宣布重返美国消费市场。
中国大陆PC市场出现反弹，预计2025年将实现3%的增长
Canalys最新数据显示，受到消费需求激增8%的推动，2024年第四季度中国大陆的PC市场开始复苏，同比增长2%。
受苹果手机年末生产高峰及中国补贴政策带动，4Q24智能手机产量季增
根据TrendForce集邦咨询最新调查，2024年第四季由于Apple（苹果）手机生产进入高峰，以及中国部分地方提供消费补贴

德州仪器推出全球超小型MCU，助力微型应用创新
德州仪器近日推出了全球超小型 MCU，进一步扩展了品类齐全的 Arm® Cortex®-M0+ MSPM0 MCU 产品组合。
芯向未来，2025英飞凌消费、计算与通讯创新大会成功举办
创新是企业持续发展最大的价值。
闪迪独立上市后首秀“肌肉”: UFS 4.1新品、企业级SSD满足云到端
“闪迪(Sandisk)又回来了！”在3月12日的存储年度盛会CFMS MemoryS 2025上，闪迪公司全球产品副总裁Eric Spa
摩尔斯微电子推出MM8102 Wi-Fi HaLow芯片，推动物联网新浪潮
摩尔斯微电子推出合规的Wi-Fi HaLow片上系统（Soc），开启欧洲连接技术新纪元。超低功耗、远距离连接功能现已为
存储大佬们都说了啥？MemoryS 2025 产业大咖演讲内容合集
CFMS | MemoryS 2025已圆满落幕，期间包括三星电子、长江存储、铠侠、美光、闪迪、高通、Arm、慧荣科技、S
安森美推出面向工业应用的先进深度传感器
Hyperlux™ ID iToF 系列将深度测量距离提升至最远 30 米，提高工业环境中的生产效率和安全性
西部数据推出大容量存储方案，赋能NAS用户、创意专业人士与内容创
26TB大容量CMR HDD助力WD Red Pro与G-DRIVE/G-RAID系列专业级产品矩阵，赋能数据存储拓展与生产力跃升
恩智浦发布全新一代S32K5微控制器系列，推进SDV区域控制架构发展，扩
全新一代MCU可以满足各种区域控制架构和电气化系统需求，助力汽车制造商向软件定义汽车（SDV）过渡。
将出色的高
【原厂入驻】聚洵半导体现已入驻iCEasy商城！
聚洵半导体科技（上海）有限公司（Gainsil Semiconductor Technology)于2016年成立于上海张江科学城，是一家全球
4月必逛电子展！六大热门新赛道，来NEPCON China 2025一展全看
领域新成果领域新成果4月必逛电子展！AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道，来NEPCO
英飞凌成为全球首个在安全控制器中采用后量子加密算法而获得Comm
后量子加密技术帮助保护数字基础设施免受量子计算机在将来带来的潜在威胁。
踏时代之浪，共绘创新可持续新篇章
英飞凌坚信低碳化和数字化是未来十年的关键驱动力，半导体在应对能源挑战和推动数字化转型中扮演着重要角色。

生成式AI大规模商用前提：提效率、降成本、降功耗……

生成式AI大语言模型面临的硬件挑战

ChatGPT的运行成本极其高昂

生成式AI大规模落地需满足三大要求

杂志声明