6月25日,OpenAI与博通(Broadcom)周三发布双方合作的首款定制AI芯片Jalapeño,定位是专门服务大语言模型“推理”的处理器,也就是用户向ChatGPT提问后,模型在服务器端生成答案的那一步。

据CNBC与路透社报道,这款芯片由OpenAI与博通共同设计和开发,TSMC负责制造,Celestica将建设服务器系统,是OpenAI第一次公开推出自有AI处理器。OpenAI总裁格雷格·布罗克曼(Greg Brockman)称,Jalapeño从初始设计到流片用了9个月,部分设计和优化过程还使用了OpenAI自己的AI模型。


它先解决的不是训练,而是每天的使用成本

Jalapeño不是用来训练下一代大模型的芯片,而是面向推理场景。它对应的是ChatGPT回答问题、整理材料、生成图片说明、处理办公任务时背后的计算过程。

这也是OpenAI最容易感到成本压力的地方。训练模型是阶段性的大工程,但推理是每天、每分钟都在发生的消耗。用户越多、调用越频繁,服务器、芯片和电力成本就越高。Jalapeño的意义不在于让OpenAI立刻摆脱英伟达,而是让它在最常用、最花钱的环节里多一种自有选择。

“成本低约50%”仍是早期测试口径

博通首席执行官陈福阳在发布中称,早期测试显示,Jalapeño的推理成本比当前主流AI图形处理器低约50%,性能与英伟达Blackwell芯片处于同一水平。

这个数字对市场很敏感,但目前仍应按“早期测试”和公司高管表述理解。Jalapeño还没有公布完整技术报告,也没有进入大规模商用验证。换句话说,它已经展示了OpenAI想降低推理成本的方向,但最终能否稳定做到同等性能、更低成本,还要看后续部署结果。

对用户和企业客户的影响,会先体现在速度和价格上

如果Jalapeño后续部署顺利,且性能兑现,用户可能会感受到一些更具体的变化:高峰期响应更稳、复杂任务等待时间更短、部分高级功能的使用门槛下降。

对企业客户和开发者来说,成本变化更直接。AI服务按调用量收费,底层推理成本如果下降,同样预算就能支撑更多请求、更长上下文和更复杂的工作流。OpenAI过去主要靠购买通用AI芯片扩张算力,现在开始把芯片按自己的模型需求定制,这会让它在产品定价和服务稳定性上多一点主动权。

年底开始部署,但不会立刻改写芯片格局

按CNBC报道,Jalapeño计划在今年年底开始部署,先服务OpenAI内部需求,再逐步扩展到微软等合作伙伴的数据中心。

对博通来说,这是一笔重要的AI定制芯片案例;对OpenAI来说,这是从“买算力”走向“设计算力”的一步。不过,英伟达在训练芯片、软件生态和大规模集群上的优势仍然很强。Jalapeño更现实的作用,是先在推理端替OpenAI分担成本和供应压力,而不是马上取代现有主力GPU。

这块芯片真正要回答的问题很简单:当AI从演示变成日常工具,谁能把每一次回答的成本降下来,谁就更有机会把高级功能做成用户也能频繁使用的服务。(易句)

(本文由AI翻译,网易编辑负责校对)