月之暗面用二阶优化器突破大模型训练瓶颈

腾赚网 21 0

“没有一百万张显卡,做不了大模型”曾是AI圈的共识,但月之暗面正用技术打破这一神话。公司总裁张予彤近日在清华大学分享时透露,团队在训练万亿参数Kimi K2模型时,首次大规模验证了二阶优化器Muon的可行性,实现token效率翻倍,训练成本直接减半。真正的瓶颈不再是算力,而是数据供给。通过“Day-0 Co-Design”模式,算法与基础设施深度协同,智能产出效率持续叠加。新模型上线后,在多项国际评测中表现对标GPT-5和Claude Sonnet 4.5,更在HELM榜单拿下非思考类模型第一。LMArena盲测显示,Kimi K2 Thinking已是开源模型中的最强选手。

面对巨头围剿,月之暗面选择“不竞争”的竞争策略。张予彤强调,创业公司的优势在于底层创新和敏捷协作——300人团队能当天提出想法、当天实验落地。产品聚焦复杂任务链路,如深度研究、数据分析和网站开发,避开娱乐化与多模态红海。推出的“OK Computer”Agent支持数十种工具调用,即将升级至300步长流程,胜任百万行Excel处理等长时任务。Cursor、Perplexity等全球知名应用已接入Kimi模型,后者更是唯一引入该模型的开源选项。技术驱动加精准定位,让这家独角兽走出了一条高效突围之路。

抱歉,评论功能暂时关闭!