近日,在北京ICC全球CEO峰会上,中国半导体行业协会副理事长魏少军抛出了一枚震撼弹:一款采用成熟14nm制程与18nm DRAM的国产AI芯片,竟声称能够媲美NVIDIA的4nm GPU!这一说法虽显得颇为科幻,但它却代表了国内AI战略的最新进展。这款芯片利用3D混合键合与近内存计算架构,试图打破对NVIDIA CUDA(统一计算架构)的依赖。
魏少军详细介绍了这款芯片的技术亮点:它将14nm的AI芯片与18nm的DRAM进行堆叠键合,并采用3D混合键合技术实现铜对铜的超高密度连接,从而显著提高了内存带宽并降低了运算延迟。传统封装方式通常面临“内存墙”瓶颈——AI训练过程中频繁的数据存取导致能量和时间成本高昂;而这种新架构则使得逻辑运算紧贴内存执行,软件定义的逻辑可以更动态地改善AI工作负载。
此外,魏少军还透露了这款国产14nm AI芯片的性能数据:每瓦达2 TFLOPS(每秒万亿次浮点运算)的能效,总吞吐量高达120 TFLOPS,远超NVIDIA的A100 GPU。然而,通过网络查阅资料显示,NVIDIA A100 GPU的性能高达312 TFLOPS,显然超出了国产AI芯片的性能水平。因此,尽管这款国产芯片在某些方面展现出潜力,但要真正挑战国际大厂,仍然需要更多的努力。
总的来说,这款国产AI芯片的推出代表了中国半导体行业在AI领域的技术进步,未来如果能够不断优化并提高性能,将有望为全球AI计算领域带来更具竞争力的选择。
