PIM技术是什么？PIM在人工智能应用的前景？

2021-10-26  作者：全球半导体观察

受新冠肺炎疫情影响，全球数字化转型进程加快，存储器半导体技术的演变模式也随之发生改变。人工智能（AI,Artificial Intelligence）、物联网（IoT,Internet of Things）和大数据等技术正迅速发展，并广泛应用于远程办公、视频会议和在线课堂中，导致待处理的数据量激增。有数据显示，到2025年，全球数据量将达到163泽字节(zettabytes)，其中有5.2泽字节(zettabytes)需进行数据分析。

当前的计算机系统采用冯·诺伊曼(Von Neumann)体系结构²。根据图1所示的内存层次结构，当中央处理器（CPU）处理来自片外主内存（DRAM）的数据时，常用数据会被存储在快速且高能效的缓存（L1、L2、L3）中，以提高性能和能效。但是，在处理大量数据的应用中，大部分数据需从主内存中读取，因为待处理的数据规模非常大，超出了缓存的存储规模。kpIesmc

△ 图1：内存层次结构kpIesmc

在这种情况下，CPU和主内存之间的内存通道带宽成为性能瓶颈³，并且在CPU和主内存之间传输数据需要消耗大量能量。要突破这一瓶颈，需要扩展CPU和主内存之间的通道带宽，但是若当前CPU的针脚数量已经达到极限，带宽的进一步改进便将面临技术方面的难题。在数据存储和数据计算分离的现代计算机结构中，此类内存墙问题的出现是不可避免的。kpIesmc

假设处理器进行乘法运算的功耗约为1，将数据从DRAM提取到处理器所消耗的能量是实际运算所需能量的650倍，这表明最大限度地减少数据传输量对于性能和能效的改进非常重要。（图2）kpIesmc

△图2：运算所需能量与内存读取所需能量对比kpIesmc

深度神经网络（DNN,Deep Neural Network）⁴是机器学习（ML,Machine Learning）的一种，其中最具代表性的是应用于计算机视觉（CV,Computer Vision）的卷积神经网络（CNN,Convolutional Neural Networks）和应用于自然语言处理（NLP,Natural Language Processing）的递归神经网络（RNN,Recurrent Neural Networks）。近来，推荐模型（RM,Recommendation Model）等新应用也倾向于采取DNN技术。其中，递归神经网络主要用于进行矩阵向量乘法运算。递归神经网络具有数据重用量低的特点，内存读取次数越多，通过内存通道传输的数据就越多，这也成为提高性能的瓶颈。kpIesmc

为了突破性能瓶颈，业界正在重新审视应用内存中处理（PIM,Processing In Memory）⁵概念的DRAM。从定义可以看出，PIM技术指直接在内存中处理数据，而不是把数据从内存读取到CPU中再进行处理。这样可以最大限度地减少数据传输量，帮助克服上述瓶颈。从20世纪90年代末到21世纪初，学术界一直在积极研究这一概念，但由于DRAM工艺和逻辑工艺存在技术上的难点，且若以DRAM为载体在内存中实现CPU的功能，成本会相应增加，这导致PIM技术不具备竞争优势，因此迟迟未能进入商业化阶段。然而，PIM需求的日益增长以及工艺技术的进步重新唤起了实施PIM的可能性。kpIesmc

要想理解PIM，必须先了解人工智能的需求。图3给出了神经网络的全连接（FC,Fully Connected）层⁶示例。左图中，输出神经元y1与输入神经元x1、x2、x3和x4相连，并且各个连接的突触权重分别为w11、w12、w13和w14。在处理全连接层的过程中，人工智能运算单元将各个输入神经元的权重相乘，再将各项乘积相加，然后应用如线性整流函数（ReLU,Rectified Linear Unit）等激活函数⁷。概括而言，如右图所示，如果存在多个输入神经元（x1，x2，x3，x4）和输出神经元（y1，y2，y3），人工智能计算单元会将各个输入神经元的连接权重相乘，再将乘积相加。事实上，这些运算可以被视为矩阵的乘法和加法运算，因为输入神经元被等量使用。kpIesmc

△图3：人工智能的关键构成模块：全连接层（示例）kpIesmc

如图4所示，如果内存中可以加入这些运算回路，则无需再将数据传输到处理器中处理，只需将结果传送到处理器即可。这样可以显著减少高能耗的数据传输操作，从而提高复杂运算的能源效率。基于这样的应用理念，SK海力士正在开发PIM DRAM。对于递归神经网络等内存受限型应用，如果可以在DRAM中加入运算回路，则有望显著提高性能和能效。鉴于需要处理的数据量将继续大幅增加，PIM有望成为提高当前计算机系统性能限度的有力选择。kpIesmc

△图4：PIM概念kpIesmc

— — — — — — — — — — — — — —kpIesmc

注释：kpIesmc

¹1泽字节等于1021字节kpIesmc

²冯·诺伊曼体系结构使用CPU和存储装置来驱动计算机。kpIesmc

³这一性能瓶颈也称为冯·诺伊曼瓶颈，即，由于处理器在读取内存过程中处于空闲状态，计算机系统的吞吐量会受处理器的限制。kpIesmc

⁴深度神经网络（DNN, Deep Neural Network）是输入层和输出层之间的多层人工神经网络（ANN, Artificial Neural Network）。神经网络种类多样，但均由相同的部分构成：神经元、突触、权重、偏置和函数。kpIesmc

⁵内存中处理（PIM，有时称为存内计算）指将处理器与RAM（随机存取存储器）集成在单个芯片上。集成后的芯片也被称为PIM芯片。kpIesmc

⁶全连接层：每一层的任意一个神经元均与其前一层的所有神经元相连接。现行大多数机器学习模型中，最后几层都是全连接层，全连接层会编译前几层提取的数据并进行最终输出。kpIesmc

⁷神经网络中的激活函数用于定义如何将输入神经元的加权和映射到网络某一层中一个或多个节点的输出端。线性整流激活函数（ReLU, Rectified Linear Unit）是一个分段线性函数，它把所有的负值都变为0，而正值不变。kpIesmc

责编：Momoz

文章来源及版权属于全球半导体观察，国际电子商情仅作转载分享，对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。如有疑问，请联系Elaine.lin@aspencore.com

全球半导体观察

专注于半导体晶圆代工、IC设计、IC封测、DRAM、NAND Flash、SSD、移动装置、PC相关零组件等产业，致力于提供半导体产业资讯、行情报价、市场趋势、产业数据、研究报告等。

进入专栏

上一篇:5G和千兆宽带服务提供商将面临哪些新机遇？
下一篇:天津理工大学成立集成电路科学与工程学院

微信扫一扫，一键转发
关注“国际电子商情” 微信公众号

最新快讯

2024年全球平板电脑出货量增长9%，小米跃居第五
2024年第四季度，全球平板电脑出货量同比增长5.6%，达到3990万台。使得2024年全年总出货量达到1.476亿台，同比增
材料成本小幅回升，预计2025年第一季电芯价格将趋于稳定
据TrendForce集邦咨询最新调查，2024年中国动力及储能电芯价格历经长期下跌后，至第四季跌幅收敛。
华为发布2025数据中心能源十大趋势
近日，华为举办2025数据中心能源十大趋势发布会，华为数据中心能源领域总裁尧权全面解读数据中心能源十大趋势，为
2025年数据中心五大趋势
数据中心/云计算可以说是人工智能领域的核心，占据了英伟达总收入的85%～90%。
备货需求稳定，1月电视面板价格上涨
TrendForce集邦咨询公布了1月下旬面板报价，2025年1月下旬，电视面板价格上涨；显示器、笔记本面板价格持稳。
消息称苹果取消Mac连接AR眼镜，独立AR眼镜研发仍推进中
2月10日消息，据彭博社记者马克·古尔曼报道，苹果公司取消了一款与Mac连接使用的AR眼镜项目，但仍在积极推进独立
豪掷超55亿！国家大基金2024年布局14家半导体企业
集成电路作为科技产业的核心支撑，是推动数字化发展的关键要素，其技术水平和产业规模直接反映国家的科技竞争力
中国北大研究团队，氮化镓技术获新进展
近日，北京大学物理学院杨学林、沈波团队，联合宽禁带半导体研究中心等多个科研机构，在氮化镓外延薄膜中位错的原
2025全球品牌价值500强榜单出炉！
英国品牌评估咨询公司“品牌金融”(BrandFinance)发布“2025年全球品牌价值500强”榜单(Global5002025)，苹果
Q4全球智能手机市场增长3%，苹果获得全年第一
2024年第四季度，全球智能手机市场增长3%，达到3.3亿台。
AI基建需求续成长，DeepSeek崛起凸显产业将更注重高成本效益
根据TrendForce集邦咨询最新研究，DeepSeek近期连续发布DeepSeek-V3、DeepSeek-R1等AI模型，将促使终端客户未来
6.16亿剥离三家公司，闻泰科技进一步聚焦半导体业务
1月24日，闻泰科技公告，其全资子公司闻泰通讯与立讯通讯达成协议，签署《股权转让协议》，计划转让嘉兴永瑞、上海
2024年Q4，中国智能手机市场同比增长5%
2024年第四季度，中国智能手机市场持续复苏，出货量同比增长5%。
重庆发布新政，聚焦高端芯片与器件发展
近日，重庆市人民政府办公厅印发《重庆市推动经济持续向上向好若干政策举措》，提出支持科技领军企业、产业链龙
超600亿元！国家队重拳出击AI
国家大基金队伍之一大基金三期再次出手，巨资布局人工智能（AI）。
AR微显示厂商Cellid完成1300万美元融资
2月7日，日本AR眼镜光学厂商Cellid宣布，公司通过定向增发完成总额1300万美元（约人民币9478.95万元）的融资。
DeepSeek低成本AI模型将催生光通信需求，光收发模块2025年出货量年
DeepSeek模型虽降低AI训练成本，但AI模型的低成本化可望扩大应用场景，进而增加全球数据中心建置量。
2025年MLCC需求将由AI基建主导，供给过剩格局面临挑战
根据TrendForce集邦咨询最新研究，美国2024年12月非农就业人数和制造业采购经理人指数（PMI）皆优于市场预期，美国
日本研发木基光阻剂，可满足2纳米制程需求
日本两大纸业巨头之一的OjiHoldings正在向成为一家木制材料综合企业转型，其最新目标是开发一种采用木基生物
2024年全球PC出货量增长3.8%，达到2.55亿台
2024年，全球PC市场趋于稳定，并于2025年全盘复苏，进入商用市场更新周期。