本月月初,Imagination Technologies在上海进行了一次宣称是“15年来最重要的GPU IP发布”。这次发布的GPU IP新品名为A-Series,没有沿用早前以数字为系列代号的传统,而且似乎还弱化了PowerVR在产品名中的存在……
5H0esmc
比如3D Data Master,还执行一些其他的固定功能预处理,包括HSR(隐面消除,是GPU的核心技术之一)、针对shader的工作负载生成。随后进入到“Triangle Task Merging”(三角形合并)——Beets表示这是一个关键模块;PDS(Programmable Data Sequencer,可编程数据定序器)再对资源进行分配管理,为工作负载和管理任务预留寄存器空间——这个组件能够针对未来的线程从cache中预取数据。5H0esmc
接下来是指令scheduler(调度器)和decoder(解码器),分发解码后才正式进入到执行单元。然后就是128-wide的ALU了,这里值得一提的是,在主ALU管线之外还有一个副ALU线路方案(Secondary ALU),如上图所示。这部分管线仅有主ALU管线1/4的宽度,每周期并行执行32个线程,不过有一些更为复杂的指令,执行任务包括各种操作与迭代、数据转换、超越指令等。Beets表示,在更低的速率上工作,是基于对真实应用场景各种工作负载所做的权衡。“针对ALU结构,我们分析了大量应用,去理解其中的平衡点,实现最高的效率。”5H0esmc
以上是对单个ALU簇的大致理解,也是A-Series获得性能暴涨的主要原因。我们往更高层级看一看其架构变化。在多年前的Rogue架构分享中,Imagination曾有一度将每个USC(Unified Shading Cluster)算作一个核心。到A-Series看来,大概已经不能这么算了,因为其性能扩展方式比较“模块化”。5H0esmc
前文谈到的这样一个主体128-wide ALU管线实际就是一个USC。这样一个USC,加上周边的固定功能单元,比如TPU(纹理处理单元)、HSR(隐面消除)、各种针对不同数据的管线(如针对几何数据处理、光栅处理、混合处理等),以及可实现更高层级共享的cache,也就共同组成了一个真正意义上的“核心”,只不过这个核心比较大型。下面这张图就是一个完整的核心,在A-Series的弹性架构中构成真正的、完整的一个IP方案。5H0esmc
5H0esmc
在AXM 8-256方案中,这样的一个GPU“核心”内部有一个ALU簇(即一个USC),一个TPU纹理处理单元,以及其他专用单元。而在更高配置的AXT 16-512产品中,一个“核心”则包含了两个128-wide的ALU簇(达成每个时钟周期512次浮点运算),两个TPU(达成每个时钟周期采样16个双线性过滤texel)。5H0esmc
作为对比,Mali G77标称每个时钟周期 64 FLOPs、2 texels,也就是说一个AXM 8-256核心就相当于8个Mali G77核心的性能水平。这其实也表明了Mali仍在走GPU的小核心、多核心路线,而Imagination在走宽核心路线。5H0esmc
5H0esmc
而如果是性能更高的AXT 32-1024,就是将这样一个GPU核心“复制”一份,实现性能翻番;那么达到最高配的AXT 64-2048实际上就是四个这样的核心。与此同时,针对各种单元的调度和监控,有一个小型的固件处理器(firmware processor),这一点将在后文中进一步提及。5H0esmc
Beets说这样的弹性架构,可以方便地选择性能提升,或者通过减少并行管线、纹理单元的方式,实现符合自身应用所需的配置。5H0esmc
5H0esmc
尤为值得一提的是,他特别列举了各种操作类型在流经GPU时的全套逻辑。比如上面这张图就是几何图形处理过程(geometry processing flow)的例子,绿色模块表示的是需要处理这些数据和操作所涉及的模块,箭头则表示整个流程方向:GPU获取到内存中的命令结构,Geometry Data Master首先检查内存中的命令队列,获取命令并将工作负载推到GPU内部;随后读取几何图形,各种各样的三角形就会填充到cache中,再进入几何图形管线(geometry pipeline),之后流经ALU,返回的结果还需要进入到Tiling Engine(因为Imagination的GPU IP是典型的Tile-based Rendering基于块渲染的架构),将这些三角形转换至应用于屏幕不同的tile区域,最终输出到内存。
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
按今日实时汇率,这相当于170亿人民币
数字钥匙为汽车原始设备制造商(OEM)提供了一种展示其数字能力的强大方式,为客户提供无缝、增值的车辆访问和被动启动功能。
随着配套技术的发展,移动机器人已经准备好进入新的市场,改变制造业、最后一英里配送、农业和医疗保健。
国际电子商情6日讯 在全球汽车行业向电动车转型的关键时期,欧洲汽车业正面临前所未有的挑战。数据显示,今年欧洲汽车业裁员累计已超过5万人……
国际电子商情5日讯 随着AI技术的进步和应用领域的拓展,半导体行业正迎来前所未有的发展机遇。WSTS的最新预测报告,2024年全球半导体市场规模将同比增长19.0%,达到6270亿美元的新高。这一增长有望在2025年得到延续,市场规模将同比增长11%至6971亿美元……
国际电子商情3日讯 有市调机构数据显示,中国企业在2024年第三季度迅速崛起,以强劲的增长势头在全球电动汽车动力电池市场中占据主导地位。
国际电子商情3日讯 美国商务部工业与安全局(BIS)在当地时间周一宣布了新的出口管制措施,旨在限制中国获取关键的半导体制造设备和软件,以及高带宽存储器(HBM),这对于中国本土先进芯片的生产能力构成了直接挑战……
11月中国制造业PMI指数回升至50.3%,连续三个月实现环比上升,表明中国经济景气度保持稳定扩张态势,为市场提供了积极的信号……
机器人密度是衡量全球制造业自动化程度的晴雨表。
Vivek Ramaswamy称,美国《CHIPS法案》下的补贴是“浪费”。
半导体对于原始设备制造商(OEM)来说正变得至关重要,因为它们提供了现代汽车中已成为标准配置的电子功能。
以碳化硅为代表的第三代半导体近两年牢牢占据着行业热点。在经历过去几年的高速发展之后,从2024年下半年开始,我们注意到了一些新的变化,涉及市场、产能、技术、价格等多个领域,临近年末,似乎有必要对碳化硅行业进行一番新的梳理。
2024年第三季度,中国大陆云基础设施服务支出达到102亿美元,同比增长11%,重回两位数增长。
2025年半导体制造市场五大展望
12月20日,上海市政府发布公告,华虹集团党委书记、董事长张素心正式离任,由上海联和投资有限公司党委书记、董事
欧盟委员会发布《2024年欧盟工业研发投资记分牌》(The2024EUIndustrialR&DInvestmentScoreboard),谷歌母公司
随着全球半导体产业竞争的加剧,欧洲逐渐意识到自身在芯片制造和封测领域的短板,纷纷出台措施以提升产业链自主
2024年,半导体行业已经出现分化,消费电子、汽车和工业市场表现持续疲软,而人工智能领域的发展继续推动GPU和高
近日,芯片制造领域传来重大消息:Rapidus开始安装ASMLEUV光刻机,成为首家接收EUV光刻设备的日本半导体公司。
品牌战略管理咨询公司英图博略(Interbrand)日前发布《2024中国最佳品牌》榜单。
为抢抓半导体与集成电路产业重大发展机遇,深圳市龙华区政府印发了《关于支持半导体与集成电路产业发展若干措
这标志着非美国公司首次在服务器市场排名中位居榜首。
根据TrendForce集邦咨询最新调查,2024年VR与MR头戴装置出货量约为960万台,年增8.8%。
据TrendForce集邦咨询最新OLED技术及市场发展分析报告,由于陆系笔记型电脑品牌大规模采购,预计2024年OLED笔电
可实现电信、数据中心和专业音频/视频设备市场的无缝集成。
最近,Rambus推出了业界首个HBM4控制器IP,这一里程碑式的产品进一步巩固了公司在内存接口技术的前沿地位。该控
喆塔科技与国家集成电路创新中心共建“高性能集成电路数智化联合工程中心”签约揭牌仪式圆满举行
专为下一代智能可穿戴设备、无线耳机、医疗设备和物联网应用而设计。
我国的高质量发展,源自于国家政策与市场需求的双方面驱动。顺应“新质生产力”建设的巨大需求,集成电路产业正
联想手写笔Pro搭载了汇顶科技新一代的主动笔驱动芯片,为消费者带来更流畅自然的书写体验。
在2024德国慕尼黑国际电子元器件博览会上,创实技术展示了包括用于助听器、电源管理芯片等领域的高性能电子元
泰凌微电子获蓝牙 6.0 认证,助力蓝牙技术拓展与应用升级
泰凌微电子:国内首家获得Zigbee PRO R23 + Zigbee Direct认证的芯片公司
2024年11月20日,由全球高科技产业研究机构TrendForce集邦咨询以及旗下全球半导体观察主办的“MTS2025存储产
此次合作旨在大幅提升成本、能效、驾驶体验和车辆续航里程。
据TrendForce集邦咨询分析,截至2023年,全球传统乘用车中LED头灯的普及率已达72%,而在电动汽车领域,这一比率更是
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈