文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
在AI技术加速落地的背景下,推理能力正成为行业竞争的新高地。面对真实场景中海量数据处理、百万级Token连续推理等需求,算力基建的价值链被重新定义。英伟达最新推出的Rubin CPX GPU,专为长上下文推理设计,是其首款面向大规模知识处理和AI推理的芯片。官方数据显示,每部署1亿美元的Rubin CPX芯片,可带来约50亿美元收入,投资回报率高达50倍,远超此前产品的水平。同时,GB300 NVL72系统在MLPerf测试中刷新推理性能纪录,进一步巩固其在AI基建领域的领先地位。
随着生成式AI应用普及,长上下文推理需求爆发式增长,对算力提出了更高要求。谷歌、微软、字节等企业数据显示,Token调用量在过去一年内成倍增长,现有硬件面临内存带宽瓶颈与计算冗余的挑战。花旗研究指出,英伟达加快产品迭代节奏,反映“推理时代”已全面到来。甲骨文方面也表示,AI推理市场将远超训练市场,当前算力已接近饱和。东吴证券认为,Rubin CPX的发布不仅代表技术突破,更标志着海外算力基础设施迈入上下文与生成协同的新阶段。硬件与软件深度绑定,推动GPU、存储、光模块等多个环节迎来增长机遇。
抱歉,评论功能暂时关闭!