阿里等巨头密集开源大模型
近期,大模型领域热闹非凡。自7月22日起,阿里巴巴连续开源四款模型,涵盖基础、编程、推理和视频生成方向,包括通义万相2.2、千问3最新版基础模型、千问3推理模型以及Qwen3-Coder。7月28日,蚂蚁数科与智谱AI也相继发布新品,聚焦垂直领域。蚂蚁数科推出金融推理大模型Agentar-Fin-R1,并发布基于百灵大模型的MOE架构模型及相关参数版本。智谱AI则推出GLM-4.5,专为智能体应用设计。月之暗面也开源了基于MoE架构的基础模型Kimi K2。
编程能力成为各大厂商发力重点。Kimi K2在代码生成方面表现突出,尤其在前端开发任务中能输出设计感强、视觉效果丰富的代码,还可在无指令情况下自动生成期货交易系统界面。GLM-4.5首次融合推理、编码与智能体能力,提升应用效率。阿里Qwen3-Coder是千问系列首款MoE架构代码模型,支持工具调用,胜任复杂编程任务。Anthropic创始人曾预测,AI编写90%代码的时代已不远。宇树科技创始人王兴兴也表示,今年AI编程成功率大幅提升,生成抽奖软件的成功率已超90%,极大降低开发门槛。阿里云徐志远认为,AI不会替代程序员,而是改变工作方式。未来,程序员的层级概念或被淡化,对AI工具的理解和使用能力将成为关键。金融领域同样迎来大模型热潮。蚂蚁数科CEO赵闻飙指出,通用模型与产业应用间存在“知识鸿沟”,专业金融大模型是AI与金融融合的关键。CTO王维强调,金融场景对准确性和审慎性要求极高,需通过专业推理模型弥合鸿沟。具备强推理能力的垂直模型,将成为智能体的核心支撑,推动业务模式革新与价值创造。