资料中心AI晶片谁与争锋？-国际电子商情

为了能在AI性能方面实现重大进展，资料中心正为多款晶片展开测试，预计明年将部署其中一些晶片，并针对不同的工作负载导入多款加速器…

看好深度学习加速器市场预计将达到250亿美元的庞大商机，资料中心正积极为多款晶片展开实验室测试，预计将在明年部署其中的一些晶片，并可能针对不同的工作负载挑选多款加速器。wLBesmc

目前为止，包括Graphcore、Habana、ThinCI和Wave Computing等50家供应商的AI晶片都在其客户实验室中进行测试。在日前于美国加州举行的人工智慧硬体高峰会(AI Hardware Summit)上，来自这两大阵营——晶片供应商及其资料中心客户的代表们均表达了各自的立场。wLBesmc

微软(Microsoft) Azure部门的杰出晶片工程师Marc Tremblay指出，一个逐渐明朗的问题是「没有所谓的通用编译器——这些晶片架构各不相同」。Marc Tremblay的部门负责管理超过1百万台的伺服器。wLBesmc

微软勾勒资料中心AI晶片版图

该资料中心巨擘正在开发称为Lotus的自家执行环境，可将人工智慧(AI)图形映射至硬体语言。Facebook上周也推出一款通用的深度学习编译器Glow，以支援其生态伙伴策略。wLBesmc

资料中心渴望能在AI性能方面实现重大飞跃进展，超越被誉为当今「训练加速器之王」(the king of training accelerators)的辉达(Nvidia)运算架构Volta。Tremblay在发表专题演说时提到，「有些训练任务在GPU上执行需要22天的时间，甚至还有超过2个月时间的，但我们希望尽快就会有答案。」wLBesmc

语音辨识应用程式(App)大约使用4,800万个参数。研究人员正致力于研究神经网路；这些神经网路使用非对称连接产生自己的模型，进一步将运算需求提升到新的层次。wLBesmc

Tremblay说：「我们需要10-50倍的频宽，才足以支援更多深奥的神经网路出现。」。wLBesmc

针对16晶片的系统，当今的GPU价格高达40万美元且功耗相当高，即使是交换器晶片也需要散热片。他说，在晶片丛集上进行线性扩展「有时需要进行一些工程师不想做的任务。」wLBesmc

目前，微软采用V100和上一代GPU，并密切「关注」Nvidia上周发布的T4晶片。Tremblay指出，它看起来可望用于同时执行多个神经网路。wLBesmc

此外，微软以及其他资料中心巨擘都在其x86 CPU上执行多种深度学习任务。「对我们来说，它通常是免费的，因为x86晶片并非一直在执行中。」他指出，软体最佳化——例如英特尔(Intel) Cascade Lake中的新AI指令，将有助于推动多年的进展。wLBesmc

未来，资料中心可能会采用多个加速器，让每个加速器分别映射到最适合的特定工作负载。Tremblay简介了各种不同的语音、视觉、语言、搜寻和其他AI App，每一个App都各自具有延迟和吞吐量要求。wLBesmc

MS_landscape_x_800 wLBesmc

微软杰出晶片工程师Marc Tremblay介绍AI晶片发展现况（来源：Microsoft）wLBesmc

有些App使用多达20种类型的神经网路，使得跨不同神经网路模型的灵活性成为必备要求。范围甚至包括对延迟敏感的Bing搜寻采用单个批次处理，而为其他App采用超过100个批次处理。因此，Tremblay为其测试的晶片分配了一个稳定的数字作为其灵活性的衡量标准。wLBesmc

他说：「新创公司先忽略安全和虚拟化等问题。他们并不需要从一开始就准备齐全，但最终我们都必须着手以成熟的CPU和GPU实现各种功能。」wLBesmc

他总结道，关于资料中心AI的好消息是「我们还有很长的路要走，但如今的进展令人难以置信......许多创新不断涌现，AI的未来前景光明。」。wLBesmc

Wave Computing瞄准资料流系统

新创公司Wave Computing在会中介绍其资料流(dataflow)架构细节。如同其竞争对手Cerebras一样，Wave将会销售完整系统，因为要达到性能提升的目标需要的进展并不只是来自处理器。wLBesmc

具体来说，Wave目前的16nm处理器使用HMC记忆体上的15GByte/s埠，连接板上的4个晶片和系统上的4块板子。记忆体及其互连是透过其处理器丛集串流图形的关键，有助于避免处理器透过相对较窄的PCI Express汇流排馈入延迟。wLBesmc

Wave选择HMC的部份原因出于权宜之计。该新创公司与HMC供应商美光(Micron)建立了策略联盟，但对于一家规模相对较小的新创公司而言，竞争的HBM记忆体似乎过于复杂且风险高。wLBesmc

目前在金融、随选视讯和制造业等市场约有6家公司正在测试用于其IT部门的部份机架。为了服务像微软等大型资料中心，Wave需要一个全机架的系统，该系统将会采用基于HBM的下一代7nm处理器。wLBesmc

Wave_chip_x_800 wLBesmc

Wave的首款系统使用HMC连接4个四路处理器板（来源：Wave Computing）wLBesmc

针对其关键的互连技术，该新创公司仍在研究如何从序列HMC转换至平行的HBM记忆体。虽然HMC支援多个埠，但HBM通常配置一个执行高达307Gbytes/s的快速埠——1,024I/O中的每一接脚都支援2.4 Gbits/s的速度。wLBesmc

Wave最初关注的是企业用户，因而发展成为其服务业务。该公司在菲律宾建立了一支20人的团队，协助IT部门学习如何开发自家深度学习模型。有些大型资料中心的资料科学家经常自行处理数据。wLBesmc

有趣的是，Wave原本是在Tallwood Venture Capital育成中心的一支团队，到了2009年才独立出来，这时间大约是深度学习开始蓬勃发展的三年前。当时，该公司的目标在于打造能以高阶语言编程的更高效率FPGA竞争方案，希望挑战Tabula和Achronix。wLBesmc

Wave的深度学习处理器右途径是让图形元素流经电路，并加以执行。Wave共同创办人兼技术长Chris Nichol在主题演讲中表示，它可以为任务设置最佳精确规格的指令，而电路在完成执行后会回到睡眠状态。一位市场观察家曾经发布一份关于此系统架构的白皮书。 https://www.eetimes.com/document.asp?doc_id=1333538wLBesmc

Wave_system_x_800 wLBesmc

Wave的处理器丛集，可让图形资料流经电路wLBesmc

Graphcore聚焦完整系统

Graphcore发表其采用236亿个电晶体的Colossus，该晶片目标在于将整个神经网路模型保留于其300 Mbytes的晶片上记忆体。该新创公司声称可以在其1,216个核心上平行处理7,000个程式，每个核心都有100 GFlops的效能。wLBesmc

Colossus支援高达30 TBytes/s的内部记忆体频宽，外部支援在80个通道上的2.5 TBits/s晶片到晶片间互连。在单个PCIe Gen4 x16板卡中封装2个晶片，提供31.5 GByte/s的I/O性能。wLBesmc

针对该新创公司的架构或时间表，Cerebras执行长Andrew Feldman并未详谈，但他表示必须打造完整的系统。他在会中的一场专题讨论中指出，「如果你做好了PCI介面卡，就可能受限于功率、散热和I/O。」唯有提供完整的系统才不至于造成系统扩展的阻碍。wLBesmc

新的硬体将为新的AI工作负载铺路，从而带动更多需求。他说，深度学习「研究人员最担心受限。他们有一连串的问题和想法，而且[今天发展相对较慢]的电脑也造成阻碍。」wLBesmc

至于产品，他说将会透过管理神经网路稀疏性，以提供1,000倍的性能提升。他说，该公司并不会使用任何奇特的技术，但确实需要新颖的核心、记忆体架构、编译器、结构和技术，从而为资料中心冷却系统以及降低功耗。wLBesmc

SambaNova Systems是另一家在会中首度亮相的新创公司。如同Cerebras、Graphcore和Wave一样，SambaNova Systems拥有一支经验丰富的架构师团队，将基于史丹佛大学(Stanford University) Spatial的编译器整合于其资料流晶片中。wLBesmc

编译：Susan HongwLBesmc

(参考原文：AI Chips Put to Data Center Tests，by Rick Merritt)wLBesmc

阅读全文，请先

Rick Merritt

EE Times硅谷采访中心主任。Rick的工作地点位于圣何塞，他为EE Times撰写有关电子行业和工程专业的新闻和分析。他关注Android，物联网，无线/网络和医疗设计行业。他于1992年加入EE Times，担任香港记者，并担任EE Times和OEM Magazine的主编。

进入专栏

业界新闻人工智能市场分析

微信扫一扫，一键转发
关注“国际电子商情” 微信公众号

上市分销商2024年度业绩快报抢先看
2024年，6家上市分销商中有3家实现归母净利润同比增长。
Q1财测大降25%，安森美称将“精简”业务
在全球半导体行业面临增长放缓的背景下，安森美(onsemi)在2024年第四季度业绩下滑，并预计2025年第一季度营收将大幅下降。为应对市场挑战，公司宣布将采取“精简”业务等措施以提升竞争力……
计划融资超40亿，哪吒汽车等待“复活”
工厂正待复产……
巴黎AI峰会现分歧：联合声明遇冷，“空谈”质疑待解
当地时间2月10 - 11日，由法国、印度联合主办的人工智能行动峰会(AI Action Summit)在巴黎大皇宫隆重举行。
汽车巨头紧急呼吁重启美国50亿美元充电计划：仅建126个
美国50亿美元的电动汽车充电计划陷入停滞，仅建成126个充电桩。汽车巨头们终于坐不住了，紧急呼吁政府重启这一关键项目……
雷诺重启与富士康谈判，拟出售日产股份
在汽车行业智能化与电动化浪潮的冲击下，传统汽车巨头纷纷寻求战略转型与资本布局的优化……
2024年全球手机销量前十榜单公布，谁是全球销量冠军？
近日市场研究机构Counterpoint Research和Canalys均发布了2024年全球销量前十的手机榜单。虽然其中有部分机型或者排名不同，但这两份榜单均仅有苹果和三星两大品牌入选……
半导体市场增长强劲，2024年销售额首破6000亿美元大关
国际电子商情10日讯最新数据显示，2024年全球半导体行业迎来了历史性突破，销售额首次突破6000亿美元大关，达到6276亿美元，同比增长19.1%……
长安、东风汽车同日宣布重组，市场猜测可能合并
2月9日晚，中国兵器装备集团有限公司（简称“兵器装备集团”）旗下长安汽车、长城军工、建设工业等上市公司发布通告，透露接到兵器装备集团的通知，集团正在与其他国资央企筹划重组事宜。同日，东风汽车集团有限公司（简称“东风公司”）旗下的东风股份、东风科技也宣布，东风公司正在探讨与其他国资央企的重组可能性。
豪掷180亿韩元，韩国计划投资MicroLED
国际电子商情8日讯韩国正加速布局下一代显示技术，计划投资180亿韩元推动MicroLED等技术研发，以巩固其全球市场地位。
韩国芯片巨头Magnachip寻求再次出售，LX集团或成最大赢
国际电子商情8日讯在显示器行业长期低迷的背景下，曾因美国干预而搁置出售计划的韩国芯片制造商Magnachip，在时隔数年后再度寻求出售……
软银65亿美元收购Ampere谈判进入尾声，最快本月官宣
国际电子商情8日讯软银集团（SoftBank）以65亿美元（含债务）估值对美国芯片设计公司Ampere Computing LLC的收购交易接近达成，最快可能在本月官宣。交易若最终完成，将成为2025年全球半导体行业最具标志性的并购事件之一……

全球半导体设备市场，方兴未艾！
近日，Tokyo Electron（以下简称“TEL”）宣布，将在日本宫城县建造一座新的生产大楼，由TEL的制造子公司TEL宫城公司
中国北大研究团队，氮化镓技术获新进展
近日，北京大学物理学院杨学林、沈波团队，联合宽禁带半导体研究中心等多个科研机构，在氮化镓外延薄膜中位错的原
2025年数据中心五大趋势
数据中心/云计算可以说是人工智能领域的核心，占据了英伟达总收入的85%～90%。
重庆发布新政，聚焦高端芯片与器件发展
近日，重庆市人民政府办公厅印发《重庆市推动经济持续向上向好若干政策举措》，提出支持科技领军企业、产业链龙
消息称苹果取消Mac连接AR眼镜，独立AR眼镜研发仍推进中
2月10日消息，据彭博社记者马克·古尔曼报道，苹果公司取消了一款与Mac连接使用的AR眼镜项目，但仍在积极推进独立
三星2nmSF2工艺试产良率约30%？
韩国媒体TheBell报道，三星正在为旗下自研处理器Exynos2600投入大量资源，以确保其按时量产。
2024年Q4平板电脑市场整体增长放缓，iPad占据40%市场份额
尽管全球平板电脑市场在2024年的大部分时间都保持着两位数的增长，但在2024年Q4，平板电脑出货量仅同比增长3%。
AR微显示厂商Cellid完成1300万美元融资
2月7日，日本AR眼镜光学厂商Cellid宣布，公司通过定向增发完成总额1300万美元（约人民币9478.95万元）的融资。
多家半导体大厂官宣换帅！
近日，多家媒体发布消息称，瑞芯微前副总经理陈锋将出任Arm在中国的合资公司安谋科技首席执行官（CEO）一职。
全球半导体厂商营收10强排行榜出炉！
美国市场研究机构Gartner发布2024年全球半导体厂商营收排行榜。
2024年先进封装晶圆占比近半
随着传统扩展方式的成本和复杂性上升，先进封装已成为满足人工智能（尤其是大型语言模型训练）性能需求的一种方式
2024年AIPC未能提振笔电市场，仅从2023年的低点温和增长5%
2024年Q4，全球笔记本电脑出货量同比增长了6%，达到5450万台。

英飞凌在泰国新建后道工厂，优化和丰富生产布局
英飞凌位于曼谷南部沙没巴干府的新后道厂破土动工，该厂将扩大公司在亚洲的生产布局。
芯耀辉：从传统IP到IP2.0，AI时代国产IP机遇与挑战齐飞
2024年，集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化
艾睿电子与印尼初创协会合作，支持本地科技初创公司
雅加达，印尼- 2025年1月14日 - 全球技术解决方案供应商艾睿电子（Arrow Electronics）与印尼初创协会合作（STARFIN
【凯新达科技】新年欢聚，共绘年会精彩篇章！
无畏挑战共创未来祥龙回首留胜景，金蛇起舞贺新程。在2025年元旦新年之际，深圳市凯新达科技有限公司（以下简
CES 2025新品：摩尔斯微电子推出Wi-Fi芯片MM8108
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准；
配套USB网关，轻松实现Wi-
ST与彭水共绘可持续发展新篇章
随着与三安光电的碳化硅合资工厂落地重庆，2024年6月，意法半导体与重庆市彭水自治县同步启动了可持续发展合作
【凯新达科技】2025年度旅游活动景点精彩报道
凯新达科技自由之旅征途同行
超高性价比AI电脑：英伟达NVIDIA Jetson Orin Nano Super真香！iCEas
NVIDIA Jetson Orin™ Nano Super 开发者套件是一款尺寸小巧且性能强大的超级计算机，重新定义了小型边
TI推出新一代支持边缘AI的雷达传感器和汽车音频处理器，改进车内驾
德州仪器今日推出了全新的集成式汽车芯片，能够帮助各个价位车辆的驾乘人员，实现更安全、更具沉浸感的驾驶体验
【原厂入驻】飞虹半导体现已入驻iCEasy商城！
广州飞虹半导体科技有限公司成立于广州越秀区，诚信经营20多年。主要研发、生产、经营:场效应管、三极管等半
携手共进，江波龙与电子五所在中山展开深度交流
近日，半导体存储品牌企业江波龙与工业和信息化部电子第五研究所（中国赛宝实验室，以下简称“电子五所”）在江波龙
【原厂入驻】迈巨微电子现已入驻iCEasy商城！
深圳迈巨微电子有限公司深耕锂电池管理芯片领域，围绕电池健康和安全，电池电量计算二个核心技术能力，提供完善的

资料中心AI晶片谁与争锋？

微软勾勒资料中心AI晶片版图

Wave Computing瞄准资料流系统

Graphcore聚焦完整系统

杂志声明