OpenAI gör sitt första egna chip – och döper det till Jalapeño

Nio månader efter att OpenAI annonserade sina chip-ambitioner har de nu något konkret att visa upp: Jalapeño, ett ASIC utvecklat i samarbete med Broadcom och designat specifikt för AI-inferens.
Vad det innebär i praktiken: chipet är byggt för att köra modeller, inte träna dem. Det är den del av ekvationen som faktiskt skapar kostnader i realtid – varje ChatGPT-svar, varje Codex-körning, varje agent som snurrar. Inferens är den löpande räkningen, och det är precis den räkningen OpenAI vill kontrollera bättre själva.
ASIC-strategin är välbeprövad. Google har gjort det med TPU sedan 2016, Amazon med Inferentia, Meta med MTIA. Det gemensamma motivet är inte primärt prestanda – det är att slippa betala Nvidias marginaler på varje GPU-timme. OpenAI är idag förmodligen Nvidias enskilt störste kund i absoluta termer, vilket gör det hela lite ironiskt: de har byggt sin verksamhet på H100-kluster och finansierar nu aktivt sin egen exit ur det beroendet.
Broadcom-valet är intressant. De är inte den uppenbara partnern om man bara tänker på varumärkeskännedom, men de är en av få aktörer med faktisk kapacitet att co-designa avancerade ASICs i den här skalan – de gör liknande arbete för Google och Meta. Det handlar om tillgång till kompetens och tillverkarrelationer, inte om vem som har coolast logotyp.
För den som bygger AI-produkter ovanpå OpenAI förändrar det här ingenting på kort sikt. API-priser sätts inte om nästa kvartal bara för att de byter kisel i datacenter. Men på lite längre sikt är det ett strukturellt argument för att inferenskostnader kan fortsätta sjunka – och att OpenAI har incitament att optimera sin stack på ett sätt som Nvidia aldrig hade anledning att hjälpa dem med.

