阿里巴巴登顶寰球开源模子!
2025-05-094月29日,阿里巴巴开源了备受期待的新一代通义千问模子Qwen3(简称千问3),在GPQA、AIME24/25、LiveCodeBench等多个泰斗基准测试中全面衰败R1、OpenAI-o1等寰球顶尖模子,发达出极具竞争力的成果,登顶寰球开源模子。 其中,在奥数水平的AIME25测评中,千问3取得81.5分,刷新开源记载;在锻真金不怕火代码智商的Live Code Bench测评中,千问3打破70分大关,发达越过Grok3;在评估模子东谈主类偏好对皆的Arena Hard测评中,千问3以95.