BBIN·宝盈-Code Arena放榜：阿里千问3.7编程能力超越GPT、Gemini，仅次于Claude系列

客户留言

2026-06-08 03:36:28

5月26日凌晨，全世界权势巨子三方编程榜单Code Arena放榜，阿里最新旗舰模子Qwen3.7-Max患上分1541，逾越GPT-5.五、Gemini-3.5-Flash、GLM-5.一、Kimi-K2.6等一众模子，仅次在Claude系列，于年夜模子厂商中排名全世界第二，这也标记着于代码理解与天生范畴，千问3.7乐成跻身全世界编程模子第一梯队。

Code Arena放榜：阿里千问3.7编程能力超越GPT、Gemini，仅次于Claude系列

图说：Code Arena榜单显示，依附Qwen3.7-Max，阿里位列全世界第二

编程能力是当下模子智能程度的焦点指标，而Code Arena是由知名第三方年夜模子盲测平台LMArena推出的最具影响力的榜单之一。与传统的代码基准测试差别，Code Arena其实不查核伶仃的代码片断天生或者传统算法题，而是由开发者出题，要求模子从零天生完备的、可交互的Web运用步伐，并交由用户对于匿名模子的天生效果举行两两PK，由投票综合天生榜单，是以Code Arena也被认为是今朝全世界最具公信力的AI编程能力评测之一。经全世界开发者以真实利用体验盲测投票，千问3.7模子编程能力位居前4，打破由Claude-Opus-4.7及4.6统治已经久的前四格式，Qwen3.7-Max同样成为今朝榜单中独一冲破1540分年夜关的国产年夜模子。

据相识，面向Agent打造的Qwen3.7-Max于编程、智能体、长程使命等焦点能力上实现了年夜幅冲破，不单能于数小时内自力完成专业团队耗时2周的繁杂项目端到端交付，年夜幅晋升办公主动化及企业级出产力，甚至可以连续运行35小时、累计超1000次东西挪用的繁杂长程使命，自我编程优化芯片内核。

Qwen3.7-Max发布后迅速于全世界激发强烈回声。年夜量自力开发者、AI创作者、企业用户第一时间于社交媒体上分享了测评成果：多位开发者评价其长程自立履行能力使人印象深刻是真正能把工作做完的智能体基座模子；有AI机构于不异提醒词下同步横评了Qwen3.7-Max、Claude-4.7与GPT-5.5，发明千问3.7较上代的机能晋升幅度最年夜、推理成本最低，于输出速率及天生质量两个维度上相较其他模子均有较着上风。

雷峰网(公家号：雷峰网)

-BBIN·宝盈

产品

服务

关于BBIN·宝盈

信息公开

产品 +

服务 +

关于BBIN·宝盈 +

信息公开 +

投资者关系

加入BBIN·宝盈

客户留言