DeepSeek新模型发布 国产芯片同步适配

腾赚网 95 0

9月29日,深度求索公司发布新一代大语言模型DeepSeek-V3.2-Exp,并在HuggingFace平台开源。该模型采用创新的稀疏Attention架构,显著降低计算开销,提升推理效率,尤其适用于长文本处理场景。这一技术突破迅速引发国产算力阵营响应。

DeepSeek新模型发布 国产芯片同步适配-第1张图片-腾赚网

华为昇腾、寒武纪、海光信息接连宣布完成适配。昇腾实现0day支持,开源vLLM\/SGLang框架下的全部推理代码;寒武纪同步开源vLLM-MLU推理引擎,结合其芯片优势有效压低训练与推理成本;海光信息则通过DCU完成无缝部署与深度调优,依托GPGPU生态和DTK软件栈,展现强劲兼容性与自主能力。三方协同加速推动国产AI软硬件生态融合升级。

抱歉,评论功能暂时关闭!