国际权威榜单放榜:阿里通义千问表现不俗
2025-03-18 10:29:39 世界浙商
3月17日,国际权威大模型评测榜单LiveBench放榜,阿里巴巴最新开源的推理模型通义千问QwQ-32B冲入全球前五,超过OpenAI-GPT-4.5preview、Google-Gemini2.0等国内外顶尖模型,成为全球性能最强的开源模型之一。
LiveBench 大模型评测榜
LiveBench是由图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜,对大模型的推理、编程、数学、数据分析、语言理解和指令遵循等能力进行综合全面评估。该榜单采用不断更新的实时题库及数据,杜绝了模型提前针对性训练及微调的可能性,是业界公认的最权威、最公正的大模型榜单之一。在最新一期LiveBench 榜单中,全球排名前十的模型仅两款开源,且均来自中国。
千问QwQ-32B开源当天即登顶全球最大的AI社区HuggingFace模型榜榜首,是当下全球最受欢迎的开源大模型。在刷新开源推理模型性能纪录的同时,千问QwQ-32B还大幅降低部署使用成本,让全球先进的中国推理大模型首次在学术界、产业界广泛落地。目前,国家超算互联网平台、广州人工智能公共算力中心以及东南大学、天津大学、山东大学等国内多所985、211高校均接入千问QwQ-32B模型,壁仞科技、摩尔线程、硅基流动、CAMEL-AI、OpenRouter、SambaNova Cloud等海内外企业和平台均推出部署QwQ-32B的算力产品或API服务。
从2023年至今,阿里通义团队已开源200多款模型,囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等“全模态”,覆盖从0.5B到110B等参数“全尺寸”。截至目前,海内外AI开源社区中千问Qwen的衍生模型数量突破10万个,超越美国Meta公司的Llama系列模型,已成为全球第一开源模型。
来源:潮新闻