Kimi K2 Thinking刷新HLE测试纪录

腾赚网 20 0

新春交易大奖赛:百万奖池等你来拿>>【>>戳我进入<<】

在线活动入口:【欧易OKX安卓注册>>戳我戳我<<】【欧易OKX苹果注册>>戳我戳我<<】

月之暗面近日宣布推出Kimi K2 Thinking,这是目前最为强大的开源思考模型。该模型在推理过程中能够自主调用工具并逐步展开逻辑分析,在HLE、BrowseComp等多个权威基准测试中表现卓越,尤其在推理能力、代理搜索、代码生成、内容创作及综合智能方面实现显著突破。作为一款先进的AI模型,Kimi K2 Thinking支持连续200至300次工具调用,可在无外界干预的情况下完成多步骤复杂任务。

在极具挑战性的人类终极考试(HLE)基准测试中,Kimi K2 Thinking取得了44.9%的高分,超越Grok4、GPT-5和Claude 4.5等主流大模型。其增强版本Kimi K2 Thinking Heavy表现更为出色,得分提升至51%,展现出更强的深度思考与问题解决能力。这一进展标志着国产AI在开源领域的重要突破,进一步推动人工智能技术向更高层次发展,相关关键词如Kimi K2 Thinking、HLE测试、开源AI模型等也持续受到行业关注。

抱歉,评论功能暂时关闭!