当前位置:首页 > 科技 > 正文

突破冯·诺伊曼架构!达摩院发布存算一体芯片

近日,达摩院发布了全球首款基于DRAM的3D键合堆叠存算一体芯片。它解决了传统冯·诺伊曼架构的性能瓶颈,可提供更高容量、高内存的存储,满足诸如人工智能等高并发场景的应用。与传统芯片相比,该芯片可提供20倍以上的片上存储容量(4GByte高速内存),在实际推荐系统应用中,存算一体芯片的性能可提升10倍以上,能效提升超过300倍!

在传统芯片架构中,内存和计算分离,计算单元要先从内存中读取数据,计算完成后再存回内存。然而,面对现在高并发的计算需求,频繁的数据搬运会导致巨大的功耗和算力瓶颈。数据显示,数据从内存单元传输到计算单元需要的功耗是计算本身的200倍,因此真正用于计算的能耗和时间其实占比很低。

另外,存储和处理器的发展不均也严重影响了数据传输的速度。目前,处理器的算力以每两年3.1倍的速度增长,而内存的性能每两年只有1.4倍的提升。时至今日,两者的差距越来越大,数据传输就像处于一个巨大的漏斗中,宽的一端是处理器,而狭窄的一端则是存储器,后者的性能极大地影响了数据传输的速度,这也被认为是传统计算机的阿克琉斯之踵。

突破冯·诺伊曼架构!达摩院发布存算一体芯片  第1张

对于以上两个问题,达摩院计算技术实验室通过混合键合(Hybrid Bonding)3D堆叠技术将DRAM和逻辑芯片结合,最终的测试芯片显示,这种存算技术和架构的优势明显,与数据中心的推荐系统对于带宽/存储的需求完美匹配。该芯片将AI计算芯片和内存芯片通过3D堆叠技术高效封装集成,其中内存die采用了定制化高性能DRAM架构,计算芯片方面,达摩院研发设计了基于流的定制化加速器架构,对推荐系统端到端进行加速,包括匹配、粗排序、神经网络计算、细排序等任务。这种近存架构也有效解决了带宽受限的问题,最终内存、算法以及计算模块完美融合,大幅提升带宽的同时还实现了超低功耗,展示了近存计算在数据中心场景的潜力。

突破冯·诺伊曼架构!达摩院发布存算一体芯片  第2张

目前,达摩院在存算一体架构方向上拥有大量领先成果,在ISCA、Micro、HPCA等顶级计算机体系结构会议上均发表过多篇论文,该芯片的研究成果也被ISSCC 2021收录。

在实际应用上,存算一体芯片在海量数据计算场景中拥有天然的优势,在终端、边缘端以及云端都有广阔的应用前景。例如VR/AR、无人驾驶、天文数据计算、遥感影像数据分析等场景中,存算一体芯片都可以发挥高带宽、低功耗的优势。从长远来看,存算一体技术还将成为类脑计算的关键技术。

有话要说...

推荐阅读