“双路和多路的Xeon处理器可以满足70%以上的应用需求,但是对于一些特殊领域,比如金融分析、石油和天然气勘探、生命科学、医疗成像、科学计算和网络安全等需要非常高的计算能力的领域,Xeon已不能很好地满足要求。通过在前端总线(FSB)上增加一个FPGA协处理器模块可以明显提升并行性能10倍以上,同时降低了系统总功耗,满足这些特殊应用的需求。”赛灵思嵌入式处理部总监Ralph Witting说道。
为了提升其Xeon或其它处理器的性能,英特尔正在FSB端和南桥端分别增加协处理器,用户可通过“即插即用”加速器的解决方案来提高其Xeon系统的处理性能。英特尔宣布建立了完整的加速器支撑系统,包括与硬件无关的Intel QuickAssist技术加速器抽象层等,可以实现“即插即用”的加速方案。
此次IDF上,赛灵思和Altera两家主要的FPGA厂商均展示了此类加速器,特别是基于前端总线的加速器。Ralph Witting解释道,在前端总线上插入FPGA加速器能直接提升访问内存的速度,因为它离内存近,能大幅提升服务器的并行处理能力;而在南桥上连接加速器,主要是针对一些特殊功能提供加速器,比如游戏功能,从而不需要再增加另外的服务器或系统。此次IDF上,英特尔还提出了针对南桥加速器的标准——Geneseo,Geneseo将基于PCI-express总线来统一各种加速器接口。但是Ralph Witting认为:“基于FSB的加速器会先在市场上应用起来。”
基于FSB的FPGA加速器能提供的加速功能包括:计算库、搜索、流处理、加密、编解码、打包处理、信号处理、随机数生成等多种功能。其实,基于FSB的加速器与基于南桥的加速器在功能上还是有一些重叠的。
赛灵思展示的加速计算模块,基于其65nm工艺的Virtex-5 FPGA。H8Aesmc
赛灵思此次展示的是其Xilinx ACP M1模块,它采用的是基于65nm工艺的Virtex-5 FPGA,与双路800MHz前端总线的Xeon配合时,存储器与FPGA之间的传输速度达到6.5Gbytes/s;而与四路1066MHz前端总线的Xeon配合时,传输速度更可高达8.5GHz。Virtex-5 FPGA采用了SelectIO和RocketIO技术,可以支持众多的高速并行和串行连接标准。Ralph Witting透露,基于此加速器的终端系统会在今年10月上市。
同样,Altera也展示了其FPGA在FSB加速模块方面的应用。专业开发高性能创新计算解决方案的公司XtremeData在其XD2000i加速模块中选用了Stratix(r) III FPGA,该模块可直接插入双插槽或者四插槽服务器的处理器插槽中。Altera亚太区市场总监梁乐观表示:“当这些XtremeData协处理器模块安装在现有商用CPU平台中后,并行和流水线处理功能可以有效地加速应用程序的算法部分。大大降低了成本,节省了功耗和空间。”
XtremeData模块以简单明了的方式集成了FPGA协处理功能,对数据中心基础结构的影响很小。它支持高密度紧凑外形封装,包括1U服务器、刀片服务器以及高级电信计算体系结构(ATCA)平台等。XtremeData公司CEO Ravi Chandran在评论为什么选择Stratix III时说道:“FPGA加速功能的关键在于并行处理能力,因此,Stratix III体系结构中的硬件资源是最重要的因素,例如乘法器、桶形移位寄存器和存储器等。”
其实,像这种在CPU上增加处理器的做法早就有了,比如图形加速器就是针对特定功能的ASIC加速器。现在FPGA厂商瞄准的是一些更灵活的应用,无法用ASIC的固定功能完成的。至于哪些应用程序由FPGA完成,哪些程序由CPU来完成,则需要服务器/客户机的用户自己定义了。但是Ralph Witting解释说:“在中国市场,一些提供服务器的OEM会帮助客户制定应用软件,比如华为、中兴都会为客户提供类似的软件支持服务,他们会定义哪些功能由FPGA完成,哪些功能由CPU完成。同时,我们也会给这些OEM进行培训。”
增强并行处理能力正在成为业界一个对付不断升级的性能需求的普遍做法,不论是在低端的消费电子厂品中,还是在高端的服务平台、通信平台上。前者有ARM与各种编解码加速器配合;后者有CPU与FPGA加速器或硬件加速器配合,还有TI和飞思卡尔等也在推多核DSP,其原因也是为了通过并行计算来增加处理能力。业界由不断提升CPU/DSP的主频转向并行计算已成为一个不争的事实,这为FPGA厂商带来了极大的商机,因为FPGA天生就是为并行计算而设计,未来FPGA厂商的路会越走越宽广,日子越来越红火,会不会有更多的FPGA厂商加入到这个主流队伍中来?我们拭目以待。
责编:Quentin