英伟达推出新一代AI推理芯片

腾赚网 105 0

在AI技术加速落地的背景下,推理能力正成为行业竞争的新高地。面对真实场景中海量数据处理、百万级Token连续推理等需求,算力基建的价值链被重新定义。英伟达最新推出的Rubin CPX GPU,专为长上下文推理设计,是其首款面向大规模知识处理和AI推理的芯片。官方数据显示,每部署1亿美元的Rubin CPX芯片,可带来约50亿美元收入,投资回报率高达50倍,远超此前产品的水平。同时,GB300 NVL72系统在MLPerf测试中刷新推理性能纪录,进一步巩固其在AI基建领域的领先地位。

随着生成式AI应用普及,长上下文推理需求爆发式增长,对算力提出了更高要求。谷歌、微软、字节等企业数据显示,Token调用量在过去一年内成倍增长,现有硬件面临内存带宽瓶颈与计算冗余的挑战。花旗研究指出,英伟达加快产品迭代节奏,反映“推理时代”已全面到来。甲骨文方面也表示,AI推理市场将远超训练市场,当前算力已接近饱和。东吴证券认为,Rubin CPX的发布不仅代表技术突破,更标志着海外算力基础设施迈入上下文与生成协同的新阶段。硬件与软件深度绑定,推动GPU、存储、光模块等多个环节迎来增长机遇。

抱歉,评论功能暂时关闭!