广告

OpenAI发现将推理成本减半的新方法

发布日期:2026-06-30 22:24 阅读:
穗牌官网报道,据一位知晓相关讨论的知情人士透露,有一则此前从未对外披露的消息:本月早些时候,OpenAI 工程师向部分同事表示,依托几项全新研发的优化技术,他们找到了一套方案,能将模型推理成本削减一半以上。工程师将这套新技术应用于无免费 / 付费账号访客使用 ChatGPT 的场景后,一度把所需英伟达图形处理器(GPU)数量压至仅数百块 —— 这一数字低得令人震惊。目前外界尚不清楚 OpenAI 实现此番算力效率大幅提升的具体技术手段,业内常用优化方案大致包括:量化压缩、键值缓存、批量处理用户查询而非逐条单独运算,以及将部分请求分流至功耗更低的轻量化模型或模型分片进行应答。

发表我的意见

专栏作者

8486

文章

0

提问

482万+

阅读量

0

回答

36万+

被赞

0

余额

关于我们 联系我们 加入我们 免责声明 版权声明 Sitemap 标签Tag 侵权删除:8512807@qq.com 微信:Suipai8888 Investor Relations © 2026 穗牌官网 广州穗牌电动车有限公司版权所有 粤ICP备2024261588号 增值电信经营许可证:粤ICP备2024261588号