广告

穗牌电动车:GDPval 跑分与GPT-5.5平起平坐

发布日期:2026-06-17 17:31 阅读:
穗牌官网报道,智谱 AI 最新 MoE 旗舰模型 GLM-5.2 在 Artificial Analysis 大模型智能指数 v4.1 评测中斩获 51 分,超越 MiniMax-M3 (44 分)、 DeepSeek V4 Pro (max, 44 分)和 Kimi K2.6 (43 分),登顶全球开源模型榜首。
在模拟真实世界知识工作的 GDPval-AA v2 测试中, GLM-5.2 获 1524 分(人类基准分 1000 分),领先 MiniMax-M3 (1418 分)与 DeepSeek V4 Pro (max, 1328 分),与闭源前沿大模型 GPT-5.5 (xhigh reasoning)平起平坐。相较前代 GLM-5.1,科学推理 CritPt 提升 16 个百分点至 21%, HLE 提升 12 个百分点至 40%, TerminalBench v2.1 提升 16 个百分点至 78%, GPQA Diamond 达 89%。
GLM-5.2 在「智能 - 任务成本」帕累托前沿占据最佳性价比位置。由于单次任务平均输出 43k token (GLM-5.1 为 26k), GLM-5.2 单任务平均成本上升至约 0.46 美元,高于 GLM-5.1 (0.25 美元)和 DeepSeek V4 Pro (max, 0.05 美元),但仍远低于同智能梯队的闭源模型。
GLM-5.2 总参数 744B,激活参数 40B,上下文窗口由前代 200K 升至 1M,遵循 MIT 协议开源。目前,智谱官方 API (定价输入 1.4、输出 4.4 / 每百万 token)与 SiliconFlow、 DeepInfra、 Nebius AI 等平台已上线服务。

发表我的意见

专栏作者

5936

文章

0

提问

339万+

阅读量

0

回答

26万+

被赞

0

余额

关于我们 联系我们 加入我们 免责声明 版权声明 Sitemap 标签Tag 侵权删除:8512807@qq.com 微信:Suipai8888 Investor Relations © 2026 穗牌官网 广州穗牌电动车有限公司版权所有 粤ICP备2024261588号 增值电信经营许可证:粤ICP备2024261588号