文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
AI算力格局正在悄然生变。过去GPU是绝对主角,如今智能体(Agent)兴起,CPU成了新瓶颈。研究显示,在Agent执行链路中,工具处理环节90%以上的延迟来自CPU;高并发下,端到端延迟甚至翻倍突破6秒。问题不在GPU算得慢,而在CPU核心数不够、调度不过来。
英伟达已行动起来——掏出20亿美元加注CoreWeave,并力推专为Agent设计的Vera CPU。下一代Rubin架构将大幅增加CPU核心,NVL72机柜也将开放x86支持。国内券商一致指出:长上下文、高并发场景下,大内存CPU才是承载KV Cache的最佳容器。供需失衡随之而来,英特尔与AMD2026年服务器CPU产能早已售罄,价格将上调10%-15%,英特尔甚至临时砍掉消费级供应保数据中心。行业共识越来越清晰:对话靠GPU,执行靠CPU。
抱歉,评论功能暂时关闭!