文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
DeepSeek下周将发布多模态大模型V4,支持图文视频生成,重点适配国产芯片,有望拉动本土AI硬件需求。同步亮相的还有精简版V4 Lite,代号“sealion-lite”,上下文窗口达100万tokens,是V3的近8倍,能一口气处理整部《三体》;原生多模态架构,2000亿参数起步,测试中仅用54行代码就生成高精度SVG图像,空间推理和结构化输出能力明显跃升。

过去一年,DeepSeek持续迭代:V2首创MLA机制降本增效,V3夯实MoE架构,V3.1融合思考与非思考双模式,V3.2长文本推理成本直降七成,R1则以强化学习突破复杂推理,成本不到竞品一成。从Janus系列到V4 Lite,多模态布局早已铺开,这次不是从零出发,而是厚积薄发。
抱歉,评论功能暂时关闭!