文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
在AI技术快速演化的当下,推理能力正成为行业竞争的新高地。生成式AI的落地带来了海量数据处理和长上下文高效运算的新需求,推动算力基建价值重构。在最近的AI基础设施峰会上,英伟达推出了专为长上下文推理设计的Rubin CPX GPU,这是其首款专攻百万级Token处理的芯片。据称,每1亿美元投入可带来50亿美元回报,远超前代产品。
英伟达不仅在产品性能上突破,在MLPerf推理测试中也创下新纪录。花旗研究指出,Rubin CPX提前登场,标志着AI正式迈入“推理时代”。与此同时,甲骨文也在财报会上强调推理市场将远超训练市场,算力需求呈指数级增长。谷歌、微软、字节等大厂的Token调用量也纷纷激增,印证了这一趋势。东吴证券认为,随着长上下文与生成任务的分工日益明确,整个算力产业链将迎来新一轮增长红利。
抱歉,评论功能暂时关闭!