CPU成AI智能体新瓶颈

腾赚网 93 0

让理财更简单:万0.86超低手续费>>【>>戳我进入<<】

AI算力格局正在悄然生变。过去GPU是绝对主角,如今智能体(Agent)兴起,CPU成了新瓶颈。研究显示,在Agent执行链路中,工具处理环节90%以上的延迟来自CPU;高并发下,端到端延迟甚至翻倍突破6秒。问题不在GPU算得慢,而在CPU核心数不够、调度不过来。

英伟达已行动起来——掏出20亿美元加注CoreWeave,并力推专为Agent设计的Vera CPU。下一代Rubin架构将大幅增加CPU核心,NVL72机柜也将开放x86支持。国内券商一致指出:长上下文、高并发场景下,大内存CPU才是承载KV Cache的最佳容器。供需失衡随之而来,英特尔与AMD2026年服务器CPU产能早已售罄,价格将上调10%-15%,英特尔甚至临时砍掉消费级供应保数据中心。行业共识越来越清晰:对话靠GPU,执行靠CPU。

抱歉,评论功能暂时关闭!