¿Un superordenador con 1 petaFLOP de rendimiento en inteligencia artificial que cabe en la palma de tu mano? Eso es exactamente lo que NVIDIA ha conseguido con el DGX Spark, un dispositivo de apenas 1,1 litros que promete revolucionar el desarrollo de IA local. En esta guía completa analizamos a fondo sus especificaciones, rendimiento real, comparativas y si merece la pena su precio.
¿Qué es el NVIDIA DGX Spark?
El NVIDIA DGX Spark es un superordenador personal de escritorio diseñado para ejecutar cargas de trabajo de inteligencia artificial de forma local. Está alimentado por el chip GB10 Grace Blackwell, que combina una CPU ARM de 20 núcleos con una GPU Blackwell en un único paquete de silicio.
A diferencia de los servidores DGX tradicionales de NVIDIA, que cuestan cientos de miles de euros y ocupan racks completos, el Spark comprime esa potencia en un formato ultracompacto de apenas 150 × 150 × 50,5 mm. Su objetivo principal es permitir a desarrolladores, investigadores y empresas trabajar con modelos de IA de hasta 200.000 millones de parámetros sin depender de la nube.
De Project DIGITS a DGX Spark
El DGX Spark no apareció de la nada. Su historia comienza en el CES 2025, cuando Jensen Huang lo presentó bajo el nombre de Project DIGITS con un precio estimado de 3.000 dólares. La idea era clara: democratizar el acceso a hardware de IA de alto rendimiento.
Sin embargo, durante el desarrollo el proyecto sufrió varios cambios. NVIDIA rebautizó el dispositivo como DGX Spark para alinearlo con su marca DGX, tradicionalmente asociada a sus sistemas de computación más potentes. Con el cambio de nombre llegó también una subida de precio: de los 3.000 dólares iniciales a 3.999 dólares en su lanzamiento en octubre de 2025.
En el CES 2026, NVIDIA anunció una actualización de software que mejoró el rendimiento del Spark en un 2,5× respecto al lanzamiento, demostrando que el chip GB10 tenía mucho potencial sin explotar. Sin embargo, la crisis de stock y precios en el hardware provocó otra subida de precio del 18%, situándolo en los 4.699 dólares actuales (aproximadamente 4.180 euros).
Especificaciones técnicas completas
| Componente | Especificación |
|---|---|
| Chip | NVIDIA GB10 Grace Blackwell Superchip |
| CPU | ARM 20 núcleos (10× Cortex X925 + 10× Cortex A725) |
| GPU | Blackwell — 6.144 CUDA Cores |
| RT Cores | 4.ª generación |
| Tensor Cores | 5.ª generación |
| Memoria | 128 GB LPDDR5X unificada (CPU + GPU coherente) |
| Ancho de banda | 273 GB/s |
| Almacenamiento | Hasta 4 TB NVMe |
| Rendimiento IA | 1 petaFLOP (FP4) |
| FP16 | ~100 TFLOPS |
| Conectividad | USB 4, USB-C, Ethernet 10GbE, Wi-Fi 7, Bluetooth 5.4 |
| Sistema operativo | DGX OS (Ubuntu 24.04 LTS) |
| Dimensiones | 150 × 150 × 50,5 mm (1,1 litros) |
| Precio | 4.699 $ (~4.180 €) |
Diseño y factor de forma
Lo primero que impresiona del DGX Spark es su tamaño ridículamente pequeño. Con apenas 150 mm de lado y 50 mm de alto, ocupa menos espacio que muchos routers Wi-Fi. Su volumen total de 1,1 litros lo convierte en uno de los ordenadores más potentes por centímetro cúbico jamás fabricado.
El chasis es de aluminio con un acabado premium en negro mate, con el logo de NVIDIA grabado en la parte superior. La ventilación es discreta y, según los análisis, el dispositivo se mantiene sorprendentemente silencioso incluso bajo carga, gracias a un diseño térmico optimizado para disipar el calor del GB10.
En cuanto a conectividad, ofrece todo lo necesario para un entorno de desarrollo profesional:
- USB 4 y USB-C: Para conexión de periféricos y pantallas
- Ethernet 10 GbE: Para conexiones de red de alta velocidad
- Wi-Fi 7 y Bluetooth 5.4: Conectividad inalámbrica de última generación
- DisplayPort: Para conectar monitores directamente
Además, se pueden conectar dos DGX Spark entre sí mediante ConnectX-8 para duplicar la memoria disponible a 256 GB y escalar el rendimiento. NVIDIA también ofrece el DGX Station, una versión más potente tipo torre con GPU Blackwell Ultra completa.
Rendimiento y benchmarks
El rendimiento del DGX Spark se divide en dos escenarios muy distintos: procesamiento de prompts (prefill) e inferencia de tokens (generación). Y aquí es donde las cosas se ponen interesantes.
Procesamiento de prompts (Prefill)
En procesamiento de prompts, el Spark es una bestia absoluta. Gracias a los 100 TFLOPS de FP16 y los Tensor Cores de 5.ª generación, alcanza hasta 2.817 tokens por segundo en tareas de prefill, casi el triple que sistemas comparables. Esto lo hace ideal para cargas de trabajo como RAG (Retrieval Augmented Generation), donde el sistema debe procesar documentos enormes antes de responder.
Generación de tokens
En generación de tokens, el cuello de botella es el ancho de banda de memoria (273 GB/s). Aquí el Spark rinde bien con modelos pequeños y medianos (hasta ~70B parámetros), pero se queda atrás frente a sistemas con mayor bandwidth como el Mac Studio con chip M4 Ultra.
Modelos soportados
Con sus 128 GB de memoria unificada, el DGX Spark puede ejecutar localmente:
- Modelos de hasta 200B parámetros en cuantización INT4/FP4
- Llama 3.1 70B sin problemas
- Mixtral 8x22B completo
- DeepSeek V4 en versiones cuantizadas
- Múltiples modelos simultáneos de menor tamaño
DGX OS y ecosistema de software
El DGX Spark viene preinstalado con DGX OS, una versión personalizada de Ubuntu 24.04 LTS optimizada por NVIDIA para cargas de trabajo de IA. Incluye de serie todo el stack de software de NVIDIA:
- CUDA 13: El SDK de computación paralela de NVIDIA
- TensorRT-LLM: Motor optimizado para inferencia de modelos de lenguaje
- NVIDIA NIM: Microservicios para desplegar modelos de IA
- NGC Catalog: Acceso al catálogo de modelos y contenedores preoptimizados
- Ollama: Compatible de forma nativa para ejecutar LLMs locales
- PyTorch y TensorFlow: Frameworks de deep learning optimizados para GB10
Una de las ventajas clave del ecosistema NVIDIA es la compatibilidad total con CUDA. Cualquier código desarrollado en el Spark funcionará sin modificaciones en GPUs NVIDIA más potentes, desde una RTX 5090 hasta un clúster DGX completo. Esto lo convierte en una estación de prototipado ideal.
La actualización de software del CES 2026, que mejoró el rendimiento en 2,5×, demostró que NVIDIA sigue optimizando activamente los kernels de TensorRT-LLM para el GB10. Los usuarios pueden esperar mejoras continuas sin cambiar de hardware.
DGX Spark vs Mac Studio M4 Ultra
La comparación inevitable. El Mac Studio con chip M4 Ultra es el rival más directo del DGX Spark en el segmento de estaciones de trabajo compactas para IA. Veamos cómo se comparan:
| Característica | DGX Spark | Mac Studio M4 Ultra |
|---|---|---|
| Precio base | 4.699 $ | 3.999 $ (M4 Ultra) |
| Memoria máxima | 128 GB (fija) | Hasta 512 GB |
| Ancho de banda | 273 GB/s | >800 GB/s (Ultra) |
| FP16 TFLOPS | ~100 TFLOPS | ~26 TFLOPS |
| Prefill (tokens/s) | ~2.817 | ~1.200 |
| Generación tokens | Buena (limitada por bandwidth) | Excelente (mayor bandwidth) |
| Ecosistema IA | CUDA, TensorRT, NIM | Core ML, MLX |
| SO | DGX OS (Linux) | macOS |
| Tamaño | 1,1 litros | ~5,6 litros |
¿Cuándo elegir el DGX Spark?
- Si trabajas con CUDA: El ecosistema de NVIDIA es el estándar de la industria. El código que escribas en el Spark se ejecutará en cualquier GPU NVIDIA
- Para RAG y procesamiento masivo: Su rendimiento en prefill es casi 3× superior al Mac Studio
- Prototipado para producción: Si tu modelo acabará en una GPU NVIDIA en la nube, desarrollar en el Spark garantiza compatibilidad total
¿Cuándo elegir el Mac Studio?
- Si necesitas más memoria: Hasta 512 GB frente a los 128 GB del Spark
- Para generación de tokens rápida: Su mayor ancho de banda lo hace más fluido en chat/inferencia
- Si ya estás en el ecosistema Apple: macOS, Final Cut, Xcode, etc.
¿Para quién es el DGX Spark?
El DGX Spark no es para todo el mundo. Con un precio cercano a los 5.000 dólares, es importante saber si realmente lo necesitas:
Ideal para:
- Desarrolladores de IA: Que necesitan prototipar y probar modelos localmente antes de desplegarlos en la nube
- Investigadores: Que trabajan con modelos grandes y necesitan iterar rápido sin costes cloud recurrentes
- Startups de IA: Que quieren reducir costes de infraestructura cloud durante las fases iniciales
- Empresas con datos sensibles: Que no pueden enviar datos a la nube por regulaciones de privacidad
NO es para:
- Gamers: El DGX Spark no está diseñado para gaming. Para eso, una tarjeta gráfica RTX 5000 es mucho mejor opción
- Usuarios casuales de IA: Si solo usas ChatGPT o Gemini, no necesitas este hardware
- Creadores de contenido: Para edición de vídeo o diseño 3D hay opciones más versátiles y económicas
Precio y disponibilidad
El DGX Spark ha tenido una historia de precios turbulenta:
- CES 2025 (Project DIGITS): Anunciado a 3.000 $
- Lanzamiento (octubre 2025): Renombrado a DGX Spark, precio subido a 3.999 $
- Principios de 2026: Subida del 18% hasta 4.699 $ (~4.180 €) por la crisis de memoria
El DGX Spark está disponible a través del NVIDIA Marketplace y distribuidores autorizados como HPE y Dell. También puedes encontrar el NVIDIA DGX Spark con arquitectura GB10 Grace Blackwell, 128 GB LPDDR5X y SSD de 4 TB en Amazon. Además, hay versiones de socios como la Lenovo ThinkStation con GB10 y la HP Z2 AI Spark Edition.
Para quienes necesitan más potencia, NVIDIA ofrece el DGX Station, una versión de torre con GPU Blackwell Ultra completa y hasta 784 GB de memoria, por un precio considerablemente superior.
Veredicto final
El NVIDIA DGX Spark es un producto sin competencia real en su nicho específico. Ningún otro dispositivo de su tamaño ofrece 1 PFLOP de rendimiento en IA con el ecosistema completo de CUDA y las herramientas de NVIDIA.
Sus puntos fuertes son innegables: rendimiento brutal en procesamiento de prompts, factor de forma miniaturizado, 128 GB de memoria unificada y compatibilidad total con el stack de software más usado en IA. La mejora de 2,5× mediante software demuestra que NVIDIA sigue apostando fuerte por esta plataforma.
Sus puntos débiles también son claros: el ancho de banda de memoria de 273 GB/s limita la generación de tokens frente a soluciones con mayor bandwidth, el precio ha subido significativamente desde su anuncio, y el DGX OS basado en Linux puede ser una barrera para usuarios menos técnicos.
Si eres un profesional de IA que trabaja con CUDA y necesitas potencia local sin depender de la nube, el DGX Spark es probablemente la mejor inversión que puedes hacer en 2026. Si solo necesitas ejecutar modelos pequeños ocasionalmente, hay alternativas más asequibles. Para los entusiastas que deseen profundizar en el ecosistema de NVIDIA, no te pierdas nuestro resumen de los anuncios de NVIDIA en la GTC 2026.
Preguntas Frecuentes
¿Se puede usar el NVIDIA DGX Spark para gaming?
No está diseñado para gaming. Aunque tiene una GPU Blackwell con RT Cores, su enfoque es la computación de IA. Para jugar, una tarjeta gráfica dedicada como la RTX 5070 o RTX 5080 ofrece mucho mejor experiencia por menos dinero.
¿Qué modelos de IA puedo ejecutar en el DGX Spark?
Gracias a sus 128 GB de memoria unificada, puede ejecutar modelos de hasta 200.000 millones de parámetros en cuantización FP4/INT4. Esto incluye Llama 3.1 70B, Mixtral 8x22B, versiones cuantizadas de DeepSeek V4 y prácticamente cualquier modelo open source actual.
¿Puedo instalar Windows en el DGX Spark?
No oficialmente. El DGX Spark viene con DGX OS (Ubuntu 24.04 LTS) y todo el stack de software de NVIDIA está optimizado para Linux. Técnicamente podrías instalar otra distribución de Linux, pero perderías las optimizaciones de DGX OS.
¿Merece la pena el DGX Spark frente a alquilar GPUs en la nube?
Depende del uso. Si trabajas con IA a diario, el Spark se amortiza en pocos meses frente al coste recurrente de instancias cloud con GPU A100 o H100. Si solo necesitas GPU ocasionalmente, el cloud sigue siendo más económico.
¿Se pueden conectar dos DGX Spark entre sí?
Sí. Mediante ConnectX-8 puedes conectar dos unidades para duplicar la memoria a 256 GB y escalar el rendimiento. EXO Labs demostró incluso la posibilidad de combinar DGX Spark con un Mac Studio para inferencia distribuida heterogénea.
Comentarios
Inicia sesion para dejar un comentario
Acceder