与大多数应用程序不同,虽然ChatGPT软件正在步入正轨,但是支持运行该应用程序的硬件却并非如此。
生成式人工智能(AI)的大规模落地取决于提高处理效率和降低总拥有成本。与互联网及其万维网应用程序的发明类似,生成式人工智能已经抓住了公众的想象力。ChatGPT技术一经发布就受到了各界的广泛关注,它是迄今为止用户增长最快的应用程序,仅在问世的前两个月内,注册用户数就突破了1亿人。hEVesmc
生成式AI正取得所有行业的关注,并有望释放出无与伦比的生产力浪潮。具体来看,生成式AI的市场潜力巨大,它可助力多个领域的发展,比如,辅助药物研发,提高医生诊断准确率,提高订单预测准确率,以及帮助程序员编写高质量软件代码。预计每年将能为全球经济增加4万亿美元以上的价值。hEVesmc
与大多数应用程序不同,虽然ChatGPT软件正在步入正轨,但是支持运行该应用程序的硬件却并非如此。hEVesmc
生成式AI大语言模型所面临的硬件挑战来源于——算法使用了大量的参数来生成结果。例如,ChatGPT的前一代模型GPT-3.5需要1,750亿个参数,虽然官方暂未公布GPT-4版的参数量,但是机构预估其参数量约有1.7万亿个。对此,支持生成式AI大语言模型的AI硬件加速器必须扩展到能够处理1,750亿到近2万亿个参数的标准,才能满足每个用户的查询操作。hEVesmc
在当前的计算架构上,处理器核心和存储器之间的大量数据流,通常在计算核心外部来进行处理。这种设置会导致内存瓶颈的出现,通常它也被称为“内存墙”,会带来严重的带宽限制。hEVesmc
以上因素不仅排除了CPU计算架构,而且还排除了GPU等其他AI计算架构。以GPT-4为例,其中高端的GPU约有97%的时间处于空闲状态,这相当于大约只有3%的效率。在这样的低效率下,一个标称计算能力为1 PetaOPS(每秒一千兆/一千万亿次运算)的处理器,只能产生大约30 teraOPS(每秒一兆/一万亿次运算)的处理速度。hEVesmc
如今,这些算法在高性能计算集群上执行,每个集群需要消耗大量的能源。随之而来的问题是,执行ChatGPT-4用户查询所需的功耗已经超出极限,这导致发电厂超载和能源分配网络压力过大。hEVesmc
ChatGPT的功耗并非阻碍其商用落地的全部因素。ChatGPT技术的快速推出,进一步拉高了其配套硬件的投资成本。ChatGPT需要大量的计算资源和能源,它需要高端的硬件设备来支持运行,而高端设备的采购成本非常高昂,给企业和组织带来了巨大的财务压力。根据目前市场上先进处理器的采购选择,支持每秒运行10万次查询的GPT-4处理系统的采购成本高达数千亿美元,而运行该系统的能源年成本将在数亿美元左右。hEVesmc
显然,高昂的成本是大规模部署ChatGPT创新技术的障碍。hEVesmc
不过,这也为半导体行业的发展提供了机遇,通过提供支持性的硬件,可推动生成式AI大语言模型的发展。这需要一个可行的解决方案来解决可用基础设施架构不足的问题:hEVesmc
总体而言,为了实现经济可持续性和节能,ChatGPT处理系统的成本效益必须提高两个数量级以上。只有把GPT-4系统上每秒运行10万次查询的年总成本从数千亿美元降低到100亿美元以下,才能实现生成式AI的承诺。hEVesmc
本文翻译自国际电子商情姊妹平台EETimes Europa,原文标题:The Promise and Reality of Generative AIhEVesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
国际电子商情讯,3月17日晚间,深圳英集芯科技股份有限公司发布公告称,公司决定终止购买辉芒微电子(深圳)股份有限公司控制权,公司芯股票自2025年3月18日开市起复牌。
全球前十大IC设计公司全年营收合计达2498亿美元,同比激增49%。其中,英伟达以1243亿美元营收蝉联榜首,占据前十总份额的50%,与其他厂商形成断层式差距。
继宝马、奔驰裁员之后,奥迪也开始宣布裁员。
最近,国产存储领域出现了一个新进者——思远半导体。这家在智能穿戴、TWS耳机、移动电源、BMS等领域深耕十数年的电源管理芯片(PMIC)Fabless,如今把业务范围成功地扩展到了存储电源领域。
3月17日午间,华大九天发布公告称,正在筹划通过发行股份及支付现金等方式,购买芯和半导体的控股权,其股票自当日开市时起开始停牌,预计在不超过10个交易日的时间内披露本次交易方案。
近日,国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》(以下简称《标识办法》),该办法自 2025年9月1日起正式施行。
日前,美国国会众议院以口头表决的方式一致通过了编号H.R.1166的《与依赖外国对手电池脱钩法》,禁止美国国土安全部采购宁德时代、比亚迪、远景能源、亿纬锂能、海辰储能和国轩高科六家中国企业生产的电池。
2025年3月16日,中共中央办公厅、国务院办公厅印发《提振消费专项行动方案》并发出通知。其中涉及到“人工智能+”行动,促进“人工智能+消费”。
国际电子商情讯,据彭博社资深记者马克·古尔曼(Mark Gurman)最新爆料,苹果正秘密打造一款颠覆性产品——iPhone 17 Air,该机型将以“史上最薄iPhone”姿态冲击市场,该机型将无SIM卡槽,机身厚度仅5.5毫米,较现有iPhone薄约2毫米。
"以后只有用我们的鸿蒙PC了。”
国际电子商情讯,继闪迪、美光宣布涨价之后,业内也传出长江存储也将涨价。根据中国闪存市场报道,根据渠道反馈,长江存储零售品牌致态也将于4月起面向渠道上调提货价格,幅度或将超过10%。
“全国人民买得起、想不到的产品”
美通社消息,3月14日,“2025英飞凌消费、计算与通讯创新大会”(ICIC2025)在深圳举行。本届大会汇聚600多位业界精
近日,湖南省工信厅发布了《2025年湖南电子信息制造业重点项目名单》,涵盖先进计算、音视频、新一代半导体、人
3月15日,质鼎集团公众号消息,惠科东莞平板显示集群电子商务项目二期正式开工。
富士康、台积电、广达、华硕、联发科、友达光电等中国台湾20家电子企业2024年第四季度和全年财报汇总。
近年来,LED显示屏市场持续演进。回顾2024年,行业呈现出哪些发展态势?展望2025年及未来,市场又将面临哪些机遇与
近日,索尼正式发布新一代RGBLED背光技术系统,可实现4000尼特峰值亮度。索尼计划该系统将于2025年开始量产,并将
AI芯片是半导体最大的增长点,先进封装则是制造AI芯片的关键技术。此前英伟达H100成本约3000美元,而用先进封装
截止2024年底,17家欧美固态电池企业融资总额已突破42亿美元。
曾几何时,中国半导体几乎不断有大基金投资、大项目上马,以及美国制裁的新闻。长期处于聚光灯下,中国半导体成为
Dynabook在退出十年后宣布重返美国消费市场。
Canalys最新数据显示,受到消费需求激增8%的推动,2024年第四季度中国大陆的PC市场开始复苏,同比增长2%。
根据TrendForce集邦咨询最新调查,2024年第四季由于Apple(苹果)手机生产进入高峰,以及中国部分地方提供消费补贴
德州仪器近日推出了全球超小型 MCU,进一步扩展了品类齐全的 Arm® Cortex®-M0+ MSPM0 MCU 产品组合。
创新是企业持续发展最大的价值。
“闪迪(Sandisk)又回来了!”在3月12日的存储年度盛会CFMS MemoryS 2025上,闪迪公司全球产品副总裁Eric Spa
摩尔斯微电子推出合规的Wi-Fi HaLow片上系统(Soc),开启欧洲连接技术新纪元。超低功耗、远距离连接功能现已为
CFMS | MemoryS 2025已圆满落幕,期间包括三星电子、长江存储、铠侠、美光、闪迪、高通、Arm、慧荣科技、S
Hyperlux™ ID iToF 系列将深度测量距离提升至最远 30 米,提高工业环境中的生产效率和安全性
26TB大容量CMR HDD助力WD Red Pro与G-DRIVE/G-RAID系列专业级产品矩阵,赋能数据存储拓展与生产力跃升
全新一代MCU可以满足各种区域控制架构和电气化系统需求,助力汽车制造商向软件定义汽车(SDV)过渡。
将出色的高
聚洵半导体科技(上海)有限公司(Gainsil Semiconductor Technology)于2016年成立于上海张江科学城,是一家全球
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCO
后量子加密技术帮助保护数字基础设施免受量子计算机在将来带来的潜在威胁。
英飞凌坚信低碳化和数字化是未来十年的关键驱动力,半导体在应对能源挑战和推动数字化转型中扮演着重要角色。
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈