DeepSeek-V3.1发布,优化国产芯片适配

腾赚网 129 0

DeepSeek正式发布了DeepSeek-V3.1版本,采用了UE8M0 FP8 Scale参数精度。FP8即Float8,用8位二进制数表示浮点数,主要用于深度学习的训练和推理。与传统的FP32或FP16相比,FP8显著降低了显存占用和计算资源需求,同时通过优化设计维持了较高的精度。这一技术对国产芯片的使用效率提升明显,有助于缩小与NV芯片的效率和成本差距,增强国产芯片的可用性。

DeepSeek-V3.1的发布标志着国产AI芯片、开源模型和下游应用的全面闭环。当前国产AI芯片正处于技术突破与生态落地的关键时期,UE8M0 FP8技术将助力国产芯片加速追赶。相关上市公司中,和而泰持有摩尔线程1.244%股份,摩尔线程是首个支持原生FP8的国产GPU厂商。芯原股份的NPU芯原VIP9000支持FP8技术,能让客户在云端完成FP8训练后快速部署到相应硬件中。

抱歉,评论功能暂时关闭!