先进工艺制造:台积电10纳米
自不必说,台积电号称全亚洲最会赚钱的制造企业,也是目前摩尔定律扛旗者,苹果A1X芯片独家供应商,全球最先进晶圆代工业者。z20esmc
2016年8月,华为首款16纳米芯片麒麟950正式量产上市,震惊整个国内电子制造产业。这意味着,中国IC设计公司首次实现最先进工艺进行量产,跻身为一线厂商。z20esmc
随后,华为手机再度加速先进工艺制造进程。在德国柏林IFA2017大展上,华为发布的麒麟970选择了台积电全新的10nm工艺。在工艺节点上,麒麟970已经和国际一流厂商处于同一起跑线上,高通的骁龙830和联发科X30处理器采用的也是10nm的制作工艺。z20esmc
z20esmc
因为新制程的关系,麒麟970相比上一代960将会有20%的功耗降低,同时在封装尺寸上还将缩小40%。麒麟970再次刷新了麒麟系列芯片中晶体管数量的记录——55亿个晶体管,远超上一代麒麟960的40亿个。相比之下,骁龙835只有30亿,苹果iphone7系列使用的A10处理器也不过33亿个。z20esmc
CPU、GPU性能发展降速,重点是降功耗
但实际上,这次麒麟970的CPU和GPU部分是“不思进取”的。麒麟970 的CPU采用4Cortex-A73+4Cortex-A53的公版大小核设计,其中A73大核主频为2.4GHz(麒麟 960 是 2.36GHz),A53小核主频为1.8GHz(麒麟 960 是 1.84GHz)。可以看到,麒麟970和960的CPU核心配置基本一致,没有明显提升。在功耗方面将有20%的降低,但是主要得益于采用了10nm的工艺。z20esmc
在GPU方面,970采用了全新的Mali G72MP12,这也是手机首次用上12核GPU。但是就其组成Mali G72图形处理器单元来说,相对于上一代麒麟960的G71图形处理器单元来说,并没有大幅度的性能提升。在拍照方面,麒麟970采用了两个ISP,在拍照这一应用场景中取得了很大进展:更快的反应速度、更快的对焦速度、运动拍摄帧率更大、暗光场景下的拍摄能力更强。z20esmc
z20esmc
实际性能上,余承东表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,并且能效比提升了 50%。照理说,由于麒麟 970 的 GPU 核心架构比麒麟 960 更先进,核心数还多了 50%,并且工艺更先进,GPU 性能提升的幅度应该远不止 20%。之所以出现这种情况,很可能是华为将麒麟 970 的 GPU 主频压得比较低,从而更好地降低功耗(于是就有了提升幅度高达 50% 的能效比)。不出意外,麒麟 960 上出现的 GPU‘满血跑’时功耗感人的情况,麒麟 970 上不会再出现。z20esmc
首次集成NPU,打造最强手机AI芯片
麒麟970冷漠了CPU和GPU,其实是另有新欢。麒麟 970 的开发团队在继承过去数代成果的基础上,首次集成 NPU(Neural Network Processing Unit)专用硬件处理单元,创新设计了 HiAI 移动计算架构,其 AI 性能密度大幅优于 CPU 和 GPU。z20esmc
z20esmc
用了HiAI移动计算架构之后,麒麟970的AI性能密度大幅优于CPU和GPU。同样是四个Cortex-A73核心,在处理同样的AI应用任务时,新的异构计算架构拥有大约50倍能效和25倍性能优势,这意味着麒麟970芯片可以用更少的能耗更快地完成AI计算任务。例如在图像识别速度上,内部测试显示,这种性能允许麒麟970每分钟处理2005张图像,而在没有NPU的情况下每分钟只能处理97张图像。z20esmc
z20esmc
据此前报道,这颗NPU并非华为独立打造,技术方面主要由国内AI芯片创业公司寒武纪负责。后者去年已经发布了第一款深度学习专用处理器“寒武纪1A”,同时还为其配套了专用的指令集系统。就在两个星期之前,寒武纪还完成了A轮融资,总金额达到1亿美元,融资方包括国投创业、阿里巴巴、联想等一批知名巨头和VC。z20esmc
z20esmc
所以NPU是专门为了人工智能而生,根据官方现场PPT,这颗NPU的性能将达到1.92T FP16(半精度浮点运算)。相比之下,经常拿来作为神经网络研究的NVIDIA GTX1080,FP32的处理能力为8.87T。由此换算,GTX1080的FP16能力大约为17.74T。换句话说,NPU的性能约等于1/9个GTX1080。z20esmc
z20esmc
其实,麒麟 970 整合NPU构想早在五年前就已经开始酝酿。在过去的几年里,产业界已经逐渐看到 CPU 的应用瓶颈,而 GPU 虽然也开始参与计算工作,但其主要的显示工作随着分辨率的提高而负担不断加重,所以要让这个已经分身乏术的架构继续增加负荷,对整体性能以及功耗表现也是会产生负面影响。z20esmc
事实上,当初的主流移动芯片架构也已经不会只内建此两种架构,而多半会增加额外的 DSP 单元或者是 ISP 架构,不仅分担主系统的沉重计算负担,也因为让不同类型的计算工作可以摆到更适合的计算架构上,整体功耗也有了明显的改善。z20esmc
可以说,AI 正是基于同样的概念:让适合的架构来做适合的工作,效率才会得到提高。z20esmc
准5G基带,再次领先高通和三星
华为目前是全球最大通信设备商,华为海思最为自豪的是其基带研发技术,早在2014年其研发的麒麟920先于高通支持LTE Cat6技术,随后在2015年先于高通发布支持LTE Cat12的基带,不过此后其就开始落后于高通和三星,要知道高通、三星纷纷发布支持1Gbps下行(LTE Cat16)、1.2Gbps下行(LTE Cat18)的手机芯片。z20esmc
本次华为麒麟970取得对高通和三星的技术领先优势是一个让人惊喜的进步,实现了跨越式的发展。970支持LTE Cat18,最高下载速度达到1.2Gbps(4x4 MIMO,3CC CA,256QAM),要知道骁龙835号称千兆LTE的最高下载速度为1Gbps。难怪其消费者BG CEO余承东表示麒麟970是全球首款支持Pre5G的手机芯片。z20esmc
z20esmc
此外,麒麟 970 终于支持了在同时使用两张 SIM 卡时,主副卡同时用 4G(上一代麒麟 960 的副卡只能支持 3G)。此外,麒麟 970 还特别针对高铁时的使用做了优化,信号更稳定,减少掉线。z20esmc
z20esmc