Kimi K2 Thinking刷新HLE测试纪录

腾赚网 2025年11月08日 14:00 20 0

在线活动入口：【欧易OKX安卓注册>>戳我戳我<<】；【欧易OKX苹果注册>>戳我戳我<<】

月之暗面近日宣布推出Kimi K2 Thinking，这是目前最为强大的开源思考模型。该模型在推理过程中能够自主调用工具并逐步展开逻辑分析，在HLE、BrowseComp等多个权威基准测试中表现卓越，尤其在推理能力、代理搜索、代码生成、内容创作及综合智能方面实现显著突破。作为一款先进的AI模型，Kimi K2 Thinking支持连续200至300次工具调用，可在无外界干预的情况下完成多步骤复杂任务。

在极具挑战性的人类终极考试（HLE）基准测试中，Kimi K2 Thinking取得了44.9%的高分，超越Grok4、GPT-5和Claude 4.5等主流大模型。其增强版本Kimi K2 Thinking Heavy表现更为出色，得分提升至51%，展现出更强的深度思考与问题解决能力。这一进展标志着国产AI在开源领域的重要突破，进一步推动人工智能技术向更高层次发展，相关关键词如Kimi K2 Thinking、HLE测试、开源AI模型等也持续受到行业关注。

本文地址： https://www.tengzhuan.com/post/767858.html

文章来源：腾赚网