ARM开发了一种向量指令集(vector instruction),旨在将64位的V8架构推进高性能运算应用领域;而日本厂商富士通(Fujitsu)采用ARM架构所开发、设置于日本理研研究所(Riken Institute)的K Computer(原本采用Sparc架构)后续版本(Post-K),达到了8 petaflops的运算性能,成为2011年时全球最强的超级计算机系统。TGaesmc
K Computer让ARM处理器首次进军超级计算机领域,一个由Intel x86架构称霸的稀有市场;而ARM期望能进一步扩展在这个市场的版图,慢慢取代如IBM或Cray等由超级计算机厂商自主开发的处理器。ARM的强项在于其相较于x86架构更具省电效益的潜力,此特性对于实际上不太容易为想要打造的超大规模系统提供大量电力的超级计算机来说颇具帮助。TGaesmc
目前ARM支持的Neon SIMD指令集仅限于128位,锁定客户端系统的成像与视讯应用;而其可伸缩向量扩充指令集(scalable vector extensions,SVE),支持在128位上128~2048位长度的增量(increment),使用者能写入一次向量程序代码,并能无须重新编译、在任何尺寸的向量设计上执行该程序代码,而此功能号称是其他架构无法支持的。TGaesmc
SVE是一组新的指令集,锁定科学研究任务而非以数字信号处理器(DSP)为基础的多媒体加速应用;富士通表示,该公司打算在2020年推出的K Computer后续版本采用SVE,让系统性能比前一代提升五十倍、省电效益提升十五倍。TGaesmc
据了解,SVE是一种负载/储存(load/store)架构,采用最多32个向量缓存器(register)以及16个述词(predicate)暂存器,加上控制缓存器以及一个first-fault缓存器;所谓的述词缓存器是用来管理关于控制回路的不同决策,ARM为其未来对SVE的扩展预留了编程空间。TGaesmc
SVE规格是由数个合作伙伴共同开发,预定明年初公布,ARM才该开始研究将如何为该扩充指令集制作开放源码Linux修补程序。
ARM展现了SVE上不同向量长度的可伸缩特性,图中的结果是根据以不同向量长度编译的程序代码之模拟(来源:ARM)TGaesmc
所有的ARM 64位核心授权厂商都能取得SVE技术;ARM院士暨主架构师Nigel Stephens在近日于美国硅谷举行的Hot Chips大会上表示,该公司已经有多个合作伙伴正在进行开发,但目前不能透露任何公司名称。TGaesmc
而对富士通来说,K Computer的合作案,提供与开始进军高性能运算领域的ARM建立更进一步伙伴关系的机会;负责开发K Computer后续版本处理器、目标是让该系统在2020年达到exaflop性能等级的富士通主架构师Toshio Yoshida 表示,Sparc目前仍是该公司商业用服务器偏好的架构,不过他们也看到一系列采用ARM芯片之技术与科学用新系统的商机。TGaesmc
Yoshida 透露,富士通的K Computer后续版本将采用512位SIMD向量单元,在I/O部分将采用该公司的某个版本Tofu互连以及其他加速器核心;不过他对于该处理器芯片目前锁定采用哪种先进制程节点三缄其口。他表示,富士通选择512位向量长度,是因为那正好是其前一代Sparc架构系统256位SIMD的一 倍:“我们想在这个领域把步伐放慢一点。”
SVE占据28位的编码区域,而且只有ARM的64位核心能支持(来源:ARM)TGaesmc
补充:富士通基于新一代芯片研发的超级计算机预算1300亿日元(折合人民币86亿元,太湖之光的投资是18亿人民币),运算性能是京电脑的100倍,但功耗只有3-4倍,也就是说其性能达到了100亿亿次级别,是中国太湖之光计算机的10倍多。双方合作的新一代ARM处理器将使用TSMC的7nm工艺制造,预计将于2020年面世,不过具体细节还未知。
TGaesmc