英伟达发布新一代AI推理芯片Rubin CPX

腾赚网 98 0

在AI技术快速发展的浪潮中,算力竞赛的焦点正从模型参数与训练算力转向推理能力。随着生成式AI进入规模化应用阶段,长上下文处理、百万级Token连续推理等需求激增,对算力基础设施提出了更高要求。英伟达在AI基础设施峰会上推出全新Rubin CPX GPU,专为处理超长上下文推理任务设计,成为其首款面向大规模知识处理的推理芯片。据官方数据,Rubin CPX的投资回报率高达50倍,远超前代产品。与此同时,GB300 NVL72系统在MLPerf测试中刷新推理性能纪录,进一步巩固英伟达在AI基建领域的领先地位。

花旗研究指出,英伟达加快产品迭代节奏,Rubin CPX提前发布,标志着行业正式迈入“推理时代”。甲骨文也在近期财报会上强调,AI推理市场将远超训练市场,当前算力资源正被迅速消耗。尽管其股价因市场质疑出现波动,但摩根大通仍认可其在AI领域的长期潜力。从全球大厂数据来看,推理端Token调用量呈爆发式增长,英伟达新品组合有望带动产业链整体升级。东吴证券认为,Rubin CPX的推出不仅代表产品线升级,更意味着海外算力基建进入“上下文与生成协同”新阶段,硬件与软件深度绑定,带动存储、网络、封装等多个环节受益。

抱歉,评论功能暂时关闭!