英伟达发布Rubin CPX GPU,专攻长上下文推理

腾赚网 100 0

在AI技术快速演化的当下,推理能力正成为行业竞争的新高地。生成式AI的落地带来了海量数据处理和长上下文高效运算的新需求,推动算力基建价值重构。在最近的AI基础设施峰会上,英伟达推出了专为长上下文推理设计的Rubin CPX GPU,这是其首款专攻百万级Token处理的芯片。据称,每1亿美元投入可带来50亿美元回报,远超前代产品。

英伟达不仅在产品性能上突破,在MLPerf推理测试中也创下新纪录。花旗研究指出,Rubin CPX提前登场,标志着AI正式迈入“推理时代”。与此同时,甲骨文也在财报会上强调推理市场将远超训练市场,算力需求呈指数级增长。谷歌、微软、字节等大厂的Token调用量也纷纷激增,印证了这一趋势。东吴证券认为,随着长上下文与生成任务的分工日益明确,整个算力产业链将迎来新一轮增长红利。

抱歉,评论功能暂时关闭!