OpenAI联手博通发布首款自研AI芯片，称推理成本有望降低约50%

6月25日，OpenAI与博通（Broadcom）周三发布双方合作的首款定制AI芯片Jalapeño，定位是专门服务大语言模型“推理”的处理器，也就是用户向ChatGPT提问后，模型在服务器端生成答案的那一步。

据CNBC与路透社报道，这款芯片由OpenAI与博通共同设计和开发，TSMC负责制造，Celestica将建设服务器系统，是OpenAI第一次公开推出自有AI处理器。OpenAI总裁格雷格·布罗克曼（Greg Brockman）称，Jalapeño从初始设计到流片用了9个月，部分设计和优化过程还使用了OpenAI自己的AI模型。

它先解决的不是训练，而是每天的使用成本

Jalapeño不是用来训练下一代大模型的芯片，而是面向推理场景。它对应的是ChatGPT回答问题、整理材料、生成图片说明、处理办公任务时背后的计算过程。

这也是OpenAI最容易感到成本压力的地方。训练模型是阶段性的大工程，但推理是每天、每分钟都在发生的消耗。用户越多、调用越频繁，服务器、芯片和电力成本就越高。Jalapeño的意义不在于让OpenAI立刻摆脱英伟达，而是让它在最常用、最花钱的环节里多一种自有选择。

“成本低约50%”仍是早期测试口径

博通首席执行官陈福阳在发布中称，早期测试显示，Jalapeño的推理成本比当前主流AI图形处理器低约50%，性能与英伟达Blackwell芯片处于同一水平。

这个数字对市场很敏感，但目前仍应按“早期测试”和公司高管表述理解。Jalapeño还没有公布完整技术报告，也没有进入大规模商用验证。换句话说，它已经展示了OpenAI想降低推理成本的方向，但最终能否稳定做到同等性能、更低成本，还要看后续部署结果。

对用户和企业客户的影响，会先体现在速度和价格上

如果Jalapeño后续部署顺利，且性能兑现，用户可能会感受到一些更具体的变化：高峰期响应更稳、复杂任务等待时间更短、部分高级功能的使用门槛下降。

对企业客户和开发者来说，成本变化更直接。AI服务按调用量收费，底层推理成本如果下降，同样预算就能支撑更多请求、更长上下文和更复杂的工作流。OpenAI过去主要靠购买通用AI芯片扩张算力，现在开始把芯片按自己的模型需求定制，这会让它在产品定价和服务稳定性上多一点主动权。

年底开始部署，但不会立刻改写芯片格局

按CNBC报道，Jalapeño计划在今年年底开始部署，先服务OpenAI内部需求，再逐步扩展到微软等合作伙伴的数据中心。

对博通来说，这是一笔重要的AI定制芯片案例；对OpenAI来说，这是从“买算力”走向“设计算力”的一步。不过，英伟达在训练芯片、软件生态和大规模集群上的优势仍然很强。Jalapeño更现实的作用，是先在推理端替OpenAI分担成本和供应压力，而不是马上取代现有主力GPU。