剖析Imagination的A-Series GPU新架构：和高通Adreno和Arm Mali比比-国际电子商情

本月月初，Imagination Technologies在上海进行了一次宣称是“15年来最重要的GPU IP发布”。这次发布的GPU IP新品名为A-Series，没有沿用早前以数字为系列代号的传统，而且似乎还弱化了PowerVR在产品名中的存在……

J4hesmc

同代比较知名的竞品就属骁龙855的Adreno 640了，另外Evans并没有具体说对比的Arm Mali竞品是哪个型号，die shot也看不出来。不过PPT上标注了MP12，亦即这是个12核GPU，市面上比较新、而且符合该特征的产品就是Exynos 9820了，其GPU为Mali G76MP12，所以猜测Evans对比的这款GPU正是Arm Mali G76。如果将Adreno 640的性能、占地面积视作100%，则“Arm需要额外84%的占地面积，才能达到相同的性能水平，也就是说功耗必然也更高”，“而Imagination达到和高通相当的性能，在芯片面积和功耗方面都要小得多。”即便是达到175%的性能水平，占地面积和能耗依然更小。J4hesmc

这个数据当然是非常好看的，不过实际上这种对比可能并不公平，因为一方面Exynos 9820和骁龙855在制造工艺上就有差别，而且G76也并非Arm Mali最新的GPU IP。今年年中，Arm就在Computex大会上宣布了Mali G77的问世。推测A-Series的实际GPU芯片产品至少也要2020年才能面市，所以A-Series首波真正要应战的应该是Arm Mali G77，以及高通刚刚发布的Adreno 650。J4hesmc

好在Mali G77在宣传中提到性能密度（performance density）相比G76也就提升为30%；而高通则宣称Adreno 650性能提升25%；就Imagination公布的数字来看，A-Series即便与这两者同场竞技也完全有充沛的余力一战，而且基本是无压力的状态，主体上还是要看Imagination令IP实体化的速度和表现。J4hesmc

J4hesmc

Imagination PowerVR产品执行副总裁Steve EvansJ4hesmc

为什么“性能暴涨”？

那么达成这种性能暴涨的原因是什么？Imagination PowerVR产品管理和技术营销高级总监Kristof Beets在接受我们采访时，首先提到的就是“完全重构的ALU（算术逻辑单元），我们对其进行了大量精简，现在其内部就是相当简单、干净的MAD管线（MAD是指乘法累加单元）”，执行单元从过去的2个MAD单元，变为现在的1个MAD（而且还抛弃了Furian架构中的MUL乘法单元），也就是说每个时钟周期单条管线的执行能力实际是下降的——这也是ALU拓宽的重要前提。J4hesmc

J4hesmc

A-Series在架构上也因此有了“128条ALU管线同时并行”，也就是128-wide ALU。128线程宽度是什么概念呢？早前的Rogue架构采用的是32线程宽度wavefront（wavefront是GPU代码的最小可执行单元，SIMD过程中数据处理的最小单元，在所有线程中同时执行同一指令，Nvidia称其为warp），不过单个SIMD仅支持16-wide；Furian架构则真正加宽到了32-wide，即单个时钟周期执行32-wide wavefront。J4hesmc

作为对比，Arm Mali G77的SIMD宽度是16-wide，这还是相较G76的一倍拓宽。所以A-Series单就ALU结构来看，显然是独占鳌头的。这也表明Imagination真正开始从指令级并行彻底转往线程级并行（TLP），实现ALU的更高利用率。这么做理论上能够极大提升性能密度。Beets补充说由于管线精简，“compiler也大幅简化了，它只需要在管线中找乘法累加实现100%运算即可，架构中也更容易实现高利用率，是设计中实现性能密度和能效提升的重要组成部分。”J4hesmc

不过有这么宽的ALU，如何改进整个架构的前端，去喂饱这么宽的执行单元就成为一个问题了。前端调度效率低的话，这么宽的ALU管线只会出现大量闲置，以及效率的下降。J4hesmc

针对这部分，Beets在演讲着重介绍了data master（数据管理）——各种不同的data master将工作负载分配到GPU中去，比如有Geometry Data Master负责几何数据管理；还有2D Data Master、3D Data Master，以及Compute Data Master（负责通用型计算数据管理）。这些不同的data master基于内存的命令队列中读取数据，驱动任务负载进入GPU。

本文为国际电子商情原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

2/6 首页上一页 1 2 3 4 5 6 下一页尾页

阅读全文，请先

黄烨锋

欧阳洋葱，编辑、上海记者，专注成像、移动与半导体，热爱理论技术研究。

进入专栏

市场分析

上一篇:华为：鸿蒙系统明年8月正式开放
下一篇:1.8万亿智能音箱上演三国杀，其“硬核”秘密在哪儿？

微信扫一扫，一键转发
关注“国际电子商情” 微信公众号

两大趋势：另眼看半导体行业发展史
本文从观察到的两个有趣的市场与宏观趋势出发，来观览这高速发展、属于人类技术与生产力变革史的后续四五十年。
国产GPU独角兽壁仞科技再获融资，上海国资领投
市场传言称金额达数亿元。
速写中国半导体产业发展史：自主化之路的70年努力
半导体产业本身是一个需要国际合作且产业链条极长的行业。一颗在美国设计的芯片，最终销往中国，从原材料到成品芯片，可能涉及大约10个国家和地区：有的负责提供材料和解决方案，有的
中国分销引擎：驱动本土创新，引领全球进步
最后，请用一句话寄语“国际电子商情40周年”。
1985-2025：中国电子元器件分销的黄金40年
1985年，《国际电子商情》应运而生。
英飞凌强势突围RISC-V MCU+汽车赛道，还有哪些潜力玩家？
RISC-V与汽车的结合将成为兵家必争之地。
人工智能的下一个前沿应用：Agentic AI
到2029年，Agentic AI将取代80%的人工客服。
2024年分销商TOP4确定：文晔第一，大联大第三！
早在2024年Q3，文晔科技的营收就已经超过艾睿电子。去年Q4笔者有发文表示，“2024年度的分销商营收排名将发生较大变化”。
赴港上市、30亿融资、合资厂通线……25年伊始中国SiC
进入2025年以来，短短2个月内，从8英寸碳化硅合资工厂通线，到企业赴港IPO，再到12家相关企业获得近30亿元融资，国内SiC企业在碳化硅赛道上丝毫没有停下来的意愿。
养老机器人国际标准来了！中国产业链迎机遇
会做饭、会做家务，会唱会跳，还是个小医生……养老机器人离我们的生活不远了！
断电封楼、欠薪解散！智驾“泡沫”正在破裂？
纵目科技和图森未来，跌倒在2025年的春天…
国际MCU大厂，难，难，难！
微控制器(MCU)领域曾长期被国际大厂所主导，它们凭借深厚的技术积累、广泛的市场布局，在过往的岁月里收获了丰厚的业绩回报。然而，2024年，这一格局发生了令人始料未及的转变，国际MCU大厂在这一年纷纷陷入业绩困境，财报数据惨淡、利润下滑、营收缩水等问题接踵而至。是什么因素让这些行业巨头遭遇“滑铁卢”？2025年会不会出现触底反弹？让行业从业者十分关注。

英飞凌预计2025财年AI业务营收将突破6亿欧元，未来两年内有望超10
美通社消息，3月14日，“2025英飞凌消费、计算与通讯创新大会”（ICIC2025）在深圳举行。本届大会汇聚600多位业界精
湖南公布电子信息制造业重点项目，涉13个MLED、显示类项目
近日，湖南省工信厅发布了《2025年湖南电子信息制造业重点项目名单》，涵盖先进计算、音视频、新一代半导体、人
总投资7.6亿，惠科东莞平板显示项目二期开工
3月15日，质鼎集团公众号消息，惠科东莞平板显示集群电子商务项目二期正式开工。
中国台湾20家电子企业2024年第四季度和全年财报汇总，富士康、台积
富士康、台积电、广达、华硕、联发科、友达光电等中国台湾20家电子企业2024年第四季度和全年财报汇总。
全球LED显示屏市场机遇与挑战分析
近年来，LED显示屏市场持续演进。回顾2024年，行业呈现出哪些发展态势？展望2025年及未来，市场又将面临哪些机遇与
索尼发布全新RGBLED背光技术
近日，索尼正式发布新一代RGBLED背光技术系统，可实现4000尼特峰值亮度。索尼计划该系统将于2025年开始量产，并将
AI爆发，本土先进封装如何突破？
AI芯片是半导体最大的增长点，先进封装则是制造AI芯片的关键技术。此前英伟达H100成本约3000美元，而用先进封装
欧美车用固态电池验证加速，预计最快2026年逐步实现量产
截止2024年底，17家欧美固态电池企业融资总额已突破42亿美元。
中国半导体走向幕后时代
曾几何时，中国半导体几乎不断有大基金投资、大项目上马，以及美国制裁的新闻。长期处于聚光灯下，中国半导体成为
Dynabook（原东芝PC部门）在退出10年后重返美国消费市场
Dynabook在退出十年后宣布重返美国消费市场。
中国大陆PC市场出现反弹，预计2025年将实现3%的增长
Canalys最新数据显示，受到消费需求激增8%的推动，2024年第四季度中国大陆的PC市场开始复苏，同比增长2%。
受苹果手机年末生产高峰及中国补贴政策带动，4Q24智能手机产量季增
根据TrendForce集邦咨询最新调查，2024年第四季由于Apple（苹果）手机生产进入高峰，以及中国部分地方提供消费补贴

德州仪器推出全球超小型MCU，助力微型应用创新
德州仪器近日推出了全球超小型 MCU，进一步扩展了品类齐全的 Arm® Cortex®-M0+ MSPM0 MCU 产品组合。
芯向未来，2025英飞凌消费、计算与通讯创新大会成功举办
创新是企业持续发展最大的价值。
闪迪独立上市后首秀“肌肉”: UFS 4.1新品、企业级SSD满足云到端
“闪迪(Sandisk)又回来了！”在3月12日的存储年度盛会CFMS MemoryS 2025上，闪迪公司全球产品副总裁Eric Spa
摩尔斯微电子推出MM8102 Wi-Fi HaLow芯片，推动物联网新浪潮
摩尔斯微电子推出合规的Wi-Fi HaLow片上系统（Soc），开启欧洲连接技术新纪元。超低功耗、远距离连接功能现已为
存储大佬们都说了啥？MemoryS 2025 产业大咖演讲内容合集
CFMS | MemoryS 2025已圆满落幕，期间包括三星电子、长江存储、铠侠、美光、闪迪、高通、Arm、慧荣科技、S
安森美推出面向工业应用的先进深度传感器
Hyperlux™ ID iToF 系列将深度测量距离提升至最远 30 米，提高工业环境中的生产效率和安全性
西部数据推出大容量存储方案，赋能NAS用户、创意专业人士与内容创
26TB大容量CMR HDD助力WD Red Pro与G-DRIVE/G-RAID系列专业级产品矩阵，赋能数据存储拓展与生产力跃升
恩智浦发布全新一代S32K5微控制器系列，推进SDV区域控制架构发展，扩
全新一代MCU可以满足各种区域控制架构和电气化系统需求，助力汽车制造商向软件定义汽车（SDV）过渡。
将出色的高
【原厂入驻】聚洵半导体现已入驻iCEasy商城！
聚洵半导体科技（上海）有限公司（Gainsil Semiconductor Technology)于2016年成立于上海张江科学城，是一家全球
4月必逛电子展！六大热门新赛道，来NEPCON China 2025一展全看
领域新成果领域新成果4月必逛电子展！AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道，来NEPCO
英飞凌成为全球首个在安全控制器中采用后量子加密算法而获得Comm
后量子加密技术帮助保护数字基础设施免受量子计算机在将来带来的潜在威胁。
踏时代之浪，共绘创新可持续新篇章
英飞凌坚信低碳化和数字化是未来十年的关键驱动力，半导体在应对能源挑战和推动数字化转型中扮演着重要角色。

剖析Imagination的A-Series GPU新架构：和高通Adreno和Arm Mali比比

为什么“性能暴涨”？

杂志声明