本月月初,Imagination Technologies在上海进行了一次宣称是“15年来最重要的GPU IP发布”。这次发布的GPU IP新品名为A-Series,没有沿用早前以数字为系列代号的传统,而且似乎还弱化了PowerVR在产品名中的存在……
5H0esmc
5H0esmc
同代比较知名的竞品就属骁龙855的Adreno 640了,另外Evans并没有具体说对比的Arm Mali竞品是哪个型号,die shot也看不出来。不过PPT上标注了MP12,亦即这是个12核GPU,市面上比较新、而且符合该特征的产品就是Exynos 9820了,其GPU为Mali G76MP12,所以猜测Evans对比的这款GPU正是Arm Mali G76。如果将Adreno 640的性能、占地面积视作100%,则“Arm需要额外84%的占地面积,才能达到相同的性能水平,也就是说功耗必然也更高”,“而Imagination达到和高通相当的性能,在芯片面积和功耗方面都要小得多。”即便是达到175%的性能水平,占地面积和能耗依然更小。5H0esmc
这个数据当然是非常好看的,不过实际上这种对比可能并不公平,因为一方面Exynos 9820和骁龙855在制造工艺上就有差别,而且G76也并非Arm Mali最新的GPU IP。今年年中,Arm就在Computex大会上宣布了Mali G77的问世。推测A-Series的实际GPU芯片产品至少也要2020年才能面市,所以A-Series首波真正要应战的应该是Arm Mali G77,以及高通刚刚发布的Adreno 650。5H0esmc
好在Mali G77在宣传中提到性能密度(performance density)相比G76也就提升为30%;而高通则宣称Adreno 650性能提升25%;就Imagination公布的数字来看,A-Series即便与这两者同场竞技也完全有充沛的余力一战,而且基本是无压力的状态,主体上还是要看Imagination令IP实体化的速度和表现。5H0esmc
5H0esmc
Imagination PowerVR产品执行副总裁Steve Evans5H0esmc
那么达成这种性能暴涨的原因是什么?Imagination PowerVR产品管理和技术营销高级总监Kristof Beets在接受我们采访时,首先提到的就是“完全重构的ALU(算术逻辑单元),我们对其进行了大量精简,现在其内部就是相当简单、干净的MAD管线(MAD是指乘法累加单元)”,执行单元从过去的2个MAD单元,变为现在的1个MAD(而且还抛弃了Furian架构中的MUL乘法单元),也就是说每个时钟周期单条管线的执行能力实际是下降的——这也是ALU拓宽的重要前提。5H0esmc
5H0esmc
A-Series在架构上也因此有了“128条ALU管线同时并行”,也就是128-wide ALU。128线程宽度是什么概念呢?早前的Rogue架构采用的是32线程宽度wavefront(wavefront是GPU代码的最小可执行单元,SIMD过程中数据处理的最小单元,在所有线程中同时执行同一指令,Nvidia称其为warp),不过单个SIMD仅支持16-wide;Furian架构则真正加宽到了32-wide,即单个时钟周期执行32-wide wavefront。5H0esmc
作为对比,Arm Mali G77的SIMD宽度是16-wide,这还是相较G76的一倍拓宽。所以A-Series单就ALU结构来看,显然是独占鳌头的。这也表明Imagination真正开始从指令级并行彻底转往线程级并行(TLP),实现ALU的更高利用率。这么做理论上能够极大提升性能密度。Beets补充说由于管线精简,“compiler也大幅简化了,它只需要在管线中找乘法累加实现100%运算即可,架构中也更容易实现高利用率,是设计中实现性能密度和能效提升的重要组成部分。”5H0esmc
不过有这么宽的ALU,如何改进整个架构的前端,去喂饱这么宽的执行单元就成为一个问题了。前端调度效率低的话,这么宽的ALU管线只会出现大量闲置,以及效率的下降。5H0esmc
针对这部分,Beets在演讲着重介绍了data master(数据管理)——各种不同的data master将工作负载分配到GPU中去,比如有Geometry Data Master负责几何数据管理;还有2D Data Master、3D Data Master,以及Compute Data Master(负责通用型计算数据管理)。这些不同的data master基于内存的命令队列中读取数据,驱动任务负载进入GPU。
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
按今日实时汇率,这相当于170亿人民币
数字钥匙为汽车原始设备制造商(OEM)提供了一种展示其数字能力的强大方式,为客户提供无缝、增值的车辆访问和被动启动功能。
随着配套技术的发展,移动机器人已经准备好进入新的市场,改变制造业、最后一英里配送、农业和医疗保健。
国际电子商情6日讯 在全球汽车行业向电动车转型的关键时期,欧洲汽车业正面临前所未有的挑战。数据显示,今年欧洲汽车业裁员累计已超过5万人……
国际电子商情5日讯 随着AI技术的进步和应用领域的拓展,半导体行业正迎来前所未有的发展机遇。WSTS的最新预测报告,2024年全球半导体市场规模将同比增长19.0%,达到6270亿美元的新高。这一增长有望在2025年得到延续,市场规模将同比增长11%至6971亿美元……
国际电子商情3日讯 有市调机构数据显示,中国企业在2024年第三季度迅速崛起,以强劲的增长势头在全球电动汽车动力电池市场中占据主导地位。
国际电子商情3日讯 美国商务部工业与安全局(BIS)在当地时间周一宣布了新的出口管制措施,旨在限制中国获取关键的半导体制造设备和软件,以及高带宽存储器(HBM),这对于中国本土先进芯片的生产能力构成了直接挑战……
11月中国制造业PMI指数回升至50.3%,连续三个月实现环比上升,表明中国经济景气度保持稳定扩张态势,为市场提供了积极的信号……
机器人密度是衡量全球制造业自动化程度的晴雨表。
Vivek Ramaswamy称,美国《CHIPS法案》下的补贴是“浪费”。
半导体对于原始设备制造商(OEM)来说正变得至关重要,因为它们提供了现代汽车中已成为标准配置的电子功能。
以碳化硅为代表的第三代半导体近两年牢牢占据着行业热点。在经历过去几年的高速发展之后,从2024年下半年开始,我们注意到了一些新的变化,涉及市场、产能、技术、价格等多个领域,临近年末,似乎有必要对碳化硅行业进行一番新的梳理。
2024年第三季度,中国大陆云基础设施服务支出达到102亿美元,同比增长11%,重回两位数增长。
2025年半导体制造市场五大展望
12月20日,上海市政府发布公告,华虹集团党委书记、董事长张素心正式离任,由上海联和投资有限公司党委书记、董事
欧盟委员会发布《2024年欧盟工业研发投资记分牌》(The2024EUIndustrialR&DInvestmentScoreboard),谷歌母公司
随着全球半导体产业竞争的加剧,欧洲逐渐意识到自身在芯片制造和封测领域的短板,纷纷出台措施以提升产业链自主
2024年,半导体行业已经出现分化,消费电子、汽车和工业市场表现持续疲软,而人工智能领域的发展继续推动GPU和高
近日,芯片制造领域传来重大消息:Rapidus开始安装ASMLEUV光刻机,成为首家接收EUV光刻设备的日本半导体公司。
品牌战略管理咨询公司英图博略(Interbrand)日前发布《2024中国最佳品牌》榜单。
为抢抓半导体与集成电路产业重大发展机遇,深圳市龙华区政府印发了《关于支持半导体与集成电路产业发展若干措
这标志着非美国公司首次在服务器市场排名中位居榜首。
根据TrendForce集邦咨询最新调查,2024年VR与MR头戴装置出货量约为960万台,年增8.8%。
据TrendForce集邦咨询最新OLED技术及市场发展分析报告,由于陆系笔记型电脑品牌大规模采购,预计2024年OLED笔电
可实现电信、数据中心和专业音频/视频设备市场的无缝集成。
最近,Rambus推出了业界首个HBM4控制器IP,这一里程碑式的产品进一步巩固了公司在内存接口技术的前沿地位。该控
喆塔科技与国家集成电路创新中心共建“高性能集成电路数智化联合工程中心”签约揭牌仪式圆满举行
专为下一代智能可穿戴设备、无线耳机、医疗设备和物联网应用而设计。
我国的高质量发展,源自于国家政策与市场需求的双方面驱动。顺应“新质生产力”建设的巨大需求,集成电路产业正
联想手写笔Pro搭载了汇顶科技新一代的主动笔驱动芯片,为消费者带来更流畅自然的书写体验。
在2024德国慕尼黑国际电子元器件博览会上,创实技术展示了包括用于助听器、电源管理芯片等领域的高性能电子元
泰凌微电子获蓝牙 6.0 认证,助力蓝牙技术拓展与应用升级
泰凌微电子:国内首家获得Zigbee PRO R23 + Zigbee Direct认证的芯片公司
2024年11月20日,由全球高科技产业研究机构TrendForce集邦咨询以及旗下全球半导体观察主办的“MTS2025存储产
此次合作旨在大幅提升成本、能效、驾驶体验和车辆续航里程。
据TrendForce集邦咨询分析,截至2023年,全球传统乘用车中LED头灯的普及率已达72%,而在电动汽车领域,这一比率更是
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈