文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
9月10日,英伟达正式推出专为处理长上下文任务设计的GPU Rubin CPX,旨在大幅提升AI推理效率,尤其适用于编程、视频生成等需要处理海量信息的场景。这款芯片专为处理数百万级别tokens的模型打造,预计将在2026年底出货,与下一代旗舰芯片Rubin一同亮相。
英伟达强调,新芯片的加入将显著提升数据中心效率,带来更高的收益。搭载Rubin CPX的机架在处理大上下文任务时,性能可达当前旗舰产品GB300 NVL72的6.5倍,同时提供8exaFLOPs的NVFP4算力,高速内存与带宽也大幅提升。新一代AI服务器NVIDIA Vera Rubin NVL144 CPX将集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU,为复杂AI任务提供更强支持。
抱歉,评论功能暂时关闭!