OpenAI y Broadcom presentan Jalapeño: el primer chip de IA diseñado a medida por OpenAI (2026)

OpenAI y Broadcom han levantado el telón sobre "Jalapeño", el primer chip de silicio personalizado diseñado por la compañía de Sam Altman. Se trata de un ASIC especializado en inferencia de modelos de lenguaje que promete ejecutar GPT y sus derivados de forma más rápida, más barata y con una fracción del consumo energético de las GPUs NVIDIA H100 y B200. El despliegue inicial en centros de datos propios de OpenAI está previsto para el cuarto trimestre de 2026. Se trata del movimiento más importante en hardware de inteligencia artificial desde que Google presentó su primer TPU, y confirma que la era de la dependencia total de NVIDIA está tocando a su fin.

Chip de silicio personalizado OpenAI Broadcom Jalapeño para inferencia de modelos de lenguaje 2026 — Jalapeño es el primer chip de IA diseñado directamente por OpenAI y fabricado en colaboración con Broadcom, orientado a inferencia de modelos de lenguaje.

¿Qué es Jalapeño? Arquitectura y especialización

Jalapeño es un ASIC (Application-Specific Integrated Circuit), es decir, un chip diseñado para hacer una tarea concreta extremadamente bien: ejecutar la inferencia de grandes modelos de lenguaje como GPT-5.6, GPT-5.5, Codex, Sora 2 y el resto de la familia de modelos de OpenAI. A diferencia de una GPU de propósito general como la NVIDIA H100 o la nueva B200, que están pensadas para acelerar cargas gráficas, cálculo científico y también entrenamiento e inferencia de IA, Jalapeño renuncia a todo lo que no aporta valor en un servidor de inferencia y dedica cada milímetro cuadrado del silicio a lo único que importa: mover matrices grandes y activaciones a la máxima velocidad posible por vatio.

La arquitectura filtrada apunta a varias decisiones muy agresivas:

Núcleos tensoriales masivos: pilas de unidades de multiplicación de matrices optimizadas para los tipos de datos habituales en LLMs (BF16, FP8, y una variante propietaria de FP4 con rangos ajustados).
Memoria HBM3E integrada: se habla de configuraciones de 192 GB por chip, muy por encima de los 80 GB de la H100 y a la par de la B200, para servir modelos frontera sin fragmentación.
Interconexión propia estilo NVLink: Broadcom aporta su experiencia en redes de altísima velocidad para conectar cientos de Jalapeños en un solo dominio de baja latencia.
Consumo objetivo: alrededor del 60% del vatio de una H100 para el mismo throughput de tokens por segundo, según las estimaciones internas que se han filtrado.
Sin CUDA, sin OpenCL: el chip corre exclusivamente el stack de software propietario que OpenAI viene desarrollando desde 2023, cerrando por completo el ecosistema.

La comparativa directa con NVIDIA sitúa a Jalapeño en un terreno intermedio entre la H100 y la B200, pero con una eficiencia energética muy superior gracias a la especialización. La tabla siguiente resume las diferencias que se conocen a día de hoy:

Característica	NVIDIA H100	NVIDIA B200	OpenAI Jalapeño
Uso principal	Entrenamiento e inferencia	Entrenamiento e inferencia	Inferencia especializada
Memoria HBM	80 GB HBM3	192 GB HBM3E	192 GB HBM3E
Proceso litográfico	TSMC 4N (5 nm)	TSMC 4NP (4 nm)	TSMC 3 nm
Consumo típico	700 W	1000 W	~450 W estimado
Ecosistema	CUDA / cuDNN	CUDA / cuDNN	Stack cerrado OpenAI
Fabricante	NVIDIA	NVIDIA	OpenAI + Broadcom

La lectura es clara: Jalapeño no busca reemplazar a las GPUs de NVIDIA en entrenamiento, donde el ecosistema CUDA sigue siendo insuperable. Busca desplazarlas del terreno donde OpenAI gasta más dinero, la inferencia masiva de ChatGPT y de la API, que hoy consume más del 70% del presupuesto de cómputo de la compañía.

Arquitectura interna de chip ASIC de inteligencia artificial con núcleos tensoriales y memoria HBM — La arquitectura de Jalapeño se centra en la inferencia: núcleos tensoriales, memoria HBM3E y un stack de software cerrado sin CUDA.

La colaboración OpenAI-Broadcom: quién hace qué

Uno de los puntos más comentados por los analistas del sector es el reparto de responsabilidades entre las dos compañías. La colaboración funciona con un modelo similar al que Broadcom mantiene con Google desde hace años para los TPU. En la práctica:

OpenAI define la especificación: es quien decide qué operaciones acelerar, con qué formatos numéricos, qué tamaño de memoria y qué latencia son aceptables. También aporta el modelado de cargas reales (trazas anonimizadas de ChatGPT y de la API) que guían las decisiones arquitectónicas.
Broadcom ejecuta el diseño físico: traduce la especificación a un layout real, gestiona el tape-out con TSMC, resuelve la integridad de señal, la disipación térmica, los enlaces de altísima velocidad y la producción a escala.
TSMC fabrica el wafer: como en el resto de la industria de vanguardia, la fabricación real corre a cargo de la fundición taiwanesa, en este caso en el nodo N3E.
OpenAI mantiene la propiedad intelectual: Jalapeño es exclusivo para OpenAI. Ni Broadcom ni ningún otro cliente pueden comprar el chip, a diferencia de lo que ocurre con las GPU NVIDIA.

Este acuerdo confirma la estrategia de Broadcom como fábrica de silicio a medida para hiperescalares. La compañía ya diseña ASICs para Google (TPU), Meta (MTIA) y ByteDance, y con OpenAI añade a su cartera al que hoy es el mayor consumidor mundial de cómputo de IA. Es una posición estratégica que explica por qué Broadcom ha superado los tres billones de dólares de capitalización durante los últimos meses.

Por qué OpenAI necesita su propio chip

La decisión de diseñar silicio propio no es una moda, es una necesidad económica. Repasemos los cuatro grandes motivos que empujan a OpenAI a este movimiento.

1. Los costes de inferencia son insostenibles

Cada consulta a ChatGPT tiene un coste real en electricidad, amortización de GPUs y ancho de banda. Con 900 millones de usuarios activos semanales y suscripciones de pago que superan los 50 millones, el gasto en cómputo se ha convertido en el principal problema financiero de la compañía. Diseñar un chip propio orientado exclusivamente a inferencia permite reducir el coste por token generado de forma dramática, entre un 40% y un 60% según distintas estimaciones internas.

2. La dependencia de NVIDIA como riesgo estratégico

Depender de un único proveedor para el recurso más crítico de tu negocio nunca es cómodo, y menos cuando ese proveedor también vende a tus competidores. NVIDIA aloja a Microsoft, Google, Meta, Anthropic y decenas de startups en las mismas colas de suministro. Tener silicio propio le da a OpenAI capacidad garantizada, priorización interna de la producción y protección frente a subidas de precio.

3. Los márgenes de NVIDIA son gigantescos

NVIDIA vende sus H100 y B200 con márgenes brutos que rondan el 75%. Eso significa que aproximadamente tres de cada cuatro dólares que OpenAI paga por una GPU se van directos a la cuenta de resultados de NVIDIA. Al diseñar Jalapeño, OpenAI se queda esos márgenes en casa: paga a Broadcom por el diseño físico y a TSMC por la fabricación, pero el margen que iba a NVIDIA desaparece.

4. El camino a la rentabilidad pasa por el hardware

Si quieres profundizar en la situación financiera de OpenAI, en nuestro análisis de la valoración récord de 852.000 millones se ve claramente que la compañía no puede alcanzar rentabilidad sin abaratar el coste de servir cada token. Y no se puede abaratar el coste de servir tokens sin controlar el hardware que los sirve. Jalapeño es la palanca clave del plan de camino a la rentabilidad prevista para 2030.

Representación abstracta de costes de inferencia de IA en centros de datos con hardware personalizado — El coste por token generado es la métrica que hace inevitable la migración de OpenAI a un chip propio.

Competencia: Google TPU v7, Amazon Trainium 3, Meta MTIA

OpenAI llega tarde a la fiesta del silicio propio, pero llega con todo. Los principales hiperescalares llevan años apostando por ASICs de IA para reducir su dependencia de NVIDIA. Este es el panorama competitivo en el que aterriza Jalapeño.

Google TPU v7 ("Ironwood")

Google es el pionero absoluto del silicio custom para IA. La séptima generación de sus TPU está desplegada en producción desde principios de 2026 y sirve tanto los modelos Gemini como cargas externas de Google Cloud. Los TPU v7 son especialmente fuertes en inferencia gracias a su optimización para el formato de datos que Google desarrolló para sus propios modelos. La ventaja de Google es que lleva casi una década iterando sobre el mismo diseño, algo que ni OpenAI ni Amazon pueden todavía igualar.

Amazon Trainium 3 e Inferentia 3

AWS lleva dos generaciones de silicio propio en el mercado y ha lanzado Trainium 3 durante el primer trimestre de 2026. Su enfoque es dar a los clientes de AWS una alternativa más barata a las instancias con GPU NVIDIA. Trainium 3 se centra en el entrenamiento y Inferentia 3 en la inferencia, y los propios modelos de Anthropic corren en gran parte sobre este stack como parte del acuerdo estratégico con Amazon.

Meta MTIA v3

Meta ha desplegado la tercera generación de su chip MTIA (Meta Training and Inference Accelerator) en 2026. Se utiliza para servir los sistemas de recomendación de Instagram, Facebook y Threads, así como para acelerar los modelos Llama en producción. La colaboración con Broadcom es clave también aquí, lo que confirma la posición dominante de la compañía en este segmento.

Otros actores relevantes

Microsoft (con su chip Maia), ByteDance, Alibaba, Huawei (con Ascend) y Tesla (con Dojo) mantienen programas propios. Y no debemos olvidar a startups como Groq, Cerebras y SambaNova, que atacan el mismo problema con arquitecturas radicalmente distintas. Para un panorama más amplio del mercado hardware IA en 2026, revisa nuestro resumen del GTC 2026 de NVIDIA y las novedades del Computex 2026.

Dato clave: según las estimaciones de Morgan Stanley, en 2027 más del 40% de la inferencia global de IA correrá sobre silicio custom (TPU, Trainium, MTIA, Jalapeño), frente al 12% actual. Es la mayor rotación de infraestructura del sector en toda su historia.

Impacto en NVIDIA: la reacción del mercado

La noticia del anuncio de Jalapeño ha movido la cotización de NVIDIA en las horas posteriores, con caídas moderadas del 3-4%. Es menos de lo que muchos analistas esperaban, y la razón es sencilla: el mercado ya descontaba parcialmente esta noticia. Nadie con conocimiento del sector creía que OpenAI fuese a seguir siendo cliente exclusivo de NVIDIA para siempre.

Sin embargo, el mensaje estratégico es demoledor. Con Google, Amazon, Meta y ahora OpenAI produciendo silicio propio para inferencia, NVIDIA se queda con dos grandes segmentos de crecimiento:

Entrenamiento de modelos frontera: donde CUDA sigue siendo el ecosistema dominante. Aquí NVIDIA es probablemente insustituible durante al menos tres o cuatro años más.
Empresas medianas y pequeñas: las compañías que no pueden diseñar su propio ASIC seguirán comprando GPUs H100, B200 y las futuras Vera Rubin.

Lo interesante es cómo NVIDIA se está preparando para este escenario. La compañía ha lanzado recientemente DGX Spark, ha diversificado su cartera con productos gaming como las nuevas RTX 5060 Ti y ha relanzado incluso la RTX 3060 con producción ampliada para mercados emergentes, señal de que busca preservar ingresos en verticales fuera de los hiperescalares. Es una diversificación forzada por la nueva realidad del mercado.

Centro de datos moderno con racks de servidores de inteligencia artificial y hardware personalizado — El despliegue inicial de Jalapeño se hará en centros de datos propios de OpenAI dentro del proyecto Stargate.

Cuándo se despliega Jalapeño

El calendario público que han comunicado OpenAI y Broadcom es el siguiente:

Segundo trimestre 2026: tape-out final y validación en TSMC (ya completado según fuentes internas).
Tercer trimestre 2026: producción piloto y primeros bastidores en el laboratorio de OpenAI en San Francisco.
Cuarto trimestre 2026: primer despliegue productivo en el data center Stargate de Texas.
Primer semestre 2027: escalado a otros data centers de la red Stargate y de la infraestructura de AWS y Microsoft Azure adaptada.
2028: Jalapeño sirve más del 50% de la inferencia de ChatGPT según el objetivo interno declarado.

Es importante entender que Jalapeño no reemplaza inmediatamente a NVIDIA. OpenAI mantiene los compromisos ya firmados con NVIDIA por más de 10 gigavatios de sistemas y sigue comprando H100 y B200 para las cargas de entrenamiento. La migración se hará capa por capa, empezando por las cargas de inferencia más previsibles (autocompletado, embeddings, moderación) y avanzando hacia los modelos de razonamiento más complejos.

Qué significa para los usuarios de ChatGPT y la API

Aquí llega la pregunta que probablemente te hayas hecho al empezar el artículo: ¿esto me afecta como usuario? La respuesta es un sí rotundo, aunque los efectos tardarán un par de trimestres en notarse.

Menor coste por token en la API

Cuando OpenAI reduce su coste de inferencia, tiene margen para bajar los precios de la API sin sacrificar rentabilidad. Los desarrolladores que consumen tokens intensivamente (agentes, RAG, análisis de documentos) verán probablemente bajadas de precio del 30% al 50% en 2027 sobre los modelos actuales, o modelos aún más potentes al precio actual.

Menor latencia en las respuestas

Un chip especializado en inferencia genera tokens más rápido y con menos jitter que una GPU de propósito general. ChatGPT debería empezar a responder de forma perceptiblemente más ágil durante 2027 conforme Jalapeño sirva un porcentaje creciente del tráfico.

Ventanas de contexto más largas

Los 192 GB de HBM3E por chip abren la puerta a servir modelos con ventanas de contexto de varios millones de tokens sin degradación de rendimiento. Es la puerta a modelos que puedan analizar libros enteros, bases de código completas o historiales de conversación de meses.

Nuevos modelos exclusivos

OpenAI ya ha insinuado que ciertos modelos futuros correrán exclusivamente en Jalapeño porque su arquitectura estará co-diseñada con el hardware. Es probable que veamos capacidades multimodales avanzadas (generación de vídeo largo, razonamiento con imágenes en tiempo real) que solo funcionen sobre este stack.

Representación abstracta de mejoras de latencia y coste por token para usuarios de modelos de lenguaje — Los usuarios finales notarán menor latencia, precios más bajos en la API y ventanas de contexto significativamente más largas.

Contrapunto: depender de un stack tan cerrado también tiene costes. Si Jalapeño falla, si el software no está listo o si las estimaciones de rendimiento son demasiado optimistas, OpenAI podría verse en un escenario peor al que quería escapar. La ejecución de los próximos 12 meses es crítica.

Material recomendado para entender hardware IA

Si este movimiento de OpenAI te ha despertado el interés por el mundo del hardware para inteligencia artificial, aquí tienes una selección de productos disponibles en Amazon España para profundizar, ya sea con libros de referencia, tarjetas gráficas para experimentar en local o placas de desarrollo para hacer inferencia en el edge:

Python Deep Learning (Jordi Torres): introducción práctica con Keras y TensorFlow, ideal para entender cómo funcionan las cargas que corren sobre chips como Jalapeño.
Inteligencia Artificial con Python (Víctor Hernández): cubre redes neuronales, procesamiento de lenguaje natural y algoritmos genéticos con implementación en Python.
NVIDIA GeForce RTX 5090 Founders Edition: la GPU de referencia para experimentar con modelos de IA en local, con 32 GB de GDDR7 suficientes para modelos abiertos de gran tamaño.
NVIDIA GeForce RTX 5080 Founders Edition: alternativa más equilibrada para desarrollo con LLM medianos y ajuste fino de modelos abiertos.
ASUS Prime GeForce RTX 5070 OC 12 GB: opción de entrada para inferencia local de modelos de hasta 13B parámetros con cuantización.
Apple Mac Mini M4 (16 GB / 512 GB): gracias a la memoria unificada, es una opción excelente para correr modelos de IA en local con eficiencia energética.
Google Coral USB Accelerator: placa de inferencia especializada perfecta para experimentar con la idea de silicio custom en pequeño formato.
NVIDIA Jetson Nano Developer Kit: plataforma de referencia para IA en el edge, ideal para prototipar soluciones con visión artificial y modelos ligeros.

Conclusión: Jalapeño no es solo un chip. Es la confirmación de que la industria de la IA entra en su segunda gran fase, la del hardware especializado y la integración vertical. OpenAI deja de ser un cliente de NVIDIA y se convierte en un competidor de facto en un segmento clave. Los próximos 18 meses redefinirán quién manda en la infraestructura de la inteligencia artificial global, y por primera vez desde 2022, la respuesta no es automáticamente NVIDIA.

Preguntas frecuentes (FAQ)

¿Qué es Jalapeño y quién lo ha diseñado?

Jalapeño es el primer chip de silicio personalizado diseñado por OpenAI en colaboración con Broadcom. Es un ASIC especializado en inferencia de modelos de lenguaje que se fabricará en TSMC con el nodo de 3 nm.

¿Cuándo estará disponible Jalapeño?

El primer despliegue productivo está previsto para el cuarto trimestre de 2026 en el data center Stargate de Texas. La producción piloto ya se ha completado en el tercer trimestre de 2026.

¿Se puede comprar un chip Jalapeño para uso propio?

No. Jalapeño es un chip exclusivo para OpenAI. Ni Broadcom ni ningún otro fabricante lo comercializará. Solo se usará dentro de la infraestructura interna de OpenAI para servir ChatGPT, la API y sus futuros modelos.

¿Reemplazará Jalapeño a las GPU NVIDIA en OpenAI?

Solo parcialmente. Jalapeño está enfocado a inferencia de modelos ya entrenados. Para el entrenamiento de nuevos modelos frontera, OpenAI seguirá dependiendo de GPU NVIDIA H100, B200 y las próximas Vera Rubin durante varios años más.

¿Cómo se compara Jalapeño con las NVIDIA H100 y B200?

Jalapeño renuncia a la versatilidad de una GPU para ganar eficiencia. Tiene los mismos 192 GB de HBM3E que la B200 pero con un consumo estimado de 450 W, muy por debajo de los 700 W de la H100 y los 1000 W de la B200. A cambio, no se puede usar para entrenamiento ni para cargas fuera del stack de OpenAI.

¿Afectará Jalapeño a los precios de la API de OpenAI?

Sí, aunque no de inmediato. Los analistas prevén bajadas de entre el 30% y el 50% en el precio de la API a lo largo de 2027 conforme Jalapeño asuma un porcentaje creciente de la inferencia productiva. Los usuarios de ChatGPT deberían notar respuestas más rápidas y capacidad para ventanas de contexto mucho más largas.

¿Qué papel juega Broadcom exactamente?

Broadcom se encarga del diseño físico del chip, la gestión del tape-out con TSMC, la ingeniería de las interconexiones de alta velocidad y la producción a escala. OpenAI define la especificación arquitectónica y aporta las cargas reales que guían el diseño. La propiedad intelectual final se queda en OpenAI.

¿Qué impacto tendrá esto en NVIDIA a largo plazo?

NVIDIA mantendrá el dominio del entrenamiento y del mercado de empresas medianas y pequeñas, pero perderá cuota progresiva en la inferencia de los grandes hiperescalares. En 2027 se estima que más del 40% de la inferencia global correrá sobre silicio custom (TPU, Trainium, MTIA, Jalapeño), frente al 12% de 2025.

Los enlaces de esta página son enlaces de afiliado. Si compras a través de ellos, Arkaia recibe una pequeña comisión sin coste adicional para ti, lo que nos ayuda a seguir creando contenido. Gracias por tu apoyo.

Etiquetas: OpenAI Broadcom Jalapeño chip IA silicio custom NVIDIA inferencia IA hardware IA

Comentarios

Cargando comentarios...