摩尔定律跟不上年轻又活力十足的云端应用需求?
“摩尔定律速度趋缓以及云端服务的成长,已经把我们带到了一个反曲点(inflection point);”负责数据中心硬件采购的谷歌资深营运总监Prasad Sabada表示:“游戏规则又一次改变,我们需要产业界以有意义的方式来响应。”3yCesmc
具体来说,他呼吁推动处理器的优化,降低本文切换(context switching)以及其他对谷歌实际工作负载十分关键的运作之延迟:“我们已经看到许多处理器针对Spec性能评测基准进行优化,但是在谷歌,我们的工作负载与Spec大不相同。”
谷歌引述史丹佛大学(Stanford)制作的图表,表示处理器性能进展停滞(来源:谷歌)3yCesmc
谷歌也想要更低延迟的内存芯片,“我们能从降低内存延迟取得很大的进展,就像处理器的性能提升那样;”Sabada所指的是新一代内存架构的潜力表现。3yCesmc
在近一年前,谷歌的竞争对手Facebook开始支持英特尔(Intel)的3D XPoint内存,这种新一代内存在许多方面的表现号称优于今日的NAND闪存;英特尔已经在去年底开始限量提供该内存芯片样品。3yCesmc
在互连方面,Sabada表示,今日的典型处理器总线有许多针对I/O与加速器组件的overhead存取,并不适合新兴的内存架构;此外,需要光学接口例如硅光子(silicon photonics)技术,来连结数据中心里的服务器。3yCesmc
Sabada指出IBM的OpenCAPI接口就是谷歌支持的技术之一,但他并未提到另两个在去年发表的技术CCIX与GenZ,分别是开放性加速器接口,以及储存级(storage-class)内存。3yCesmc
谷歌寻求更低成本的2.5D芯片堆栈
在封装技术方面,Sabada表示将逻辑、内存、数字与模拟裸晶结合在同一片基板上的2.5D芯片堆栈技术“令人振奋”,是一种实现异质芯片的“酷方法”;不过他也3yCesmc
指出,该类技术的大量生产良率与成本还未达到令人满意的程度。3yCesmc
AMD的绘图处理器部门首席架构师最近也表达了类似的挫折,该公司同样正尝试将芯片堆栈技术推向主流市场。3yCesmc
Sabada请求芯片产业高层加速各领域技术的创新,但他也理解,设计与生产先进芯片的复杂度与成本越来越高。“我们已经遭遇障碍,频率的提升不是我们习惯的,基本上我们看到了单核心处理器性能的限制;”他指出,种种挑战推动了往多核心处理器的转移,但:“这在云端环境中会是一个挑战。”3yCesmc
谷歌在去年发表了张量处理单元(Tensorflow processing unit,TPU),将之视为未来潮流;Sabada表示:“我们已经迈入加速器时代…TPU只是你们将在接下来看到的这类组件案例之一。”他并指出,机器学习将会是云端运算的关键驱动力,那是一个利用人工智能的强大应用案例,也是谷歌许多云端产品支持的能力。3yCesmc
3yCesmc