El panorama de la inteligencia artificial está cambiando cada día. Empezamos hablando de ChatGPT 5 y ahora nos vamos a Oriente. DeepSeek, una startup china que ya sorprendió a principios de año con su modelo V3, ha presentado de forma discreta la versión V3.1, un modelo de IA de código abierto que combina razonamiento, diálogo y programación con un rendimiento que rivaliza con los gigantes de Silicon Valley.
El anuncio llegó el 19 de agosto a través de su grupo oficial de WeChat, y rápidamente se convirtió en tendencia en Hugging Face, donde los desarrolladores comenzaron a analizar y probar sus capacidades.
DeepSeek V3.1: Un modelo masivo con eficiencia sorprendente
DeepSeek V3.1 se basa en una arquitectura de mezcla de expertos con 685.000 millones de parámetros, de los cuales solo 37.000 millones se activan por token, lo que permite reducir costes de forma drástica. Este es el principal punto de ventaja frente a OpenAI y otros. Entre sus características clave:
-
Ventana de contexto de 128.000 tokens (unas 96.000 palabras, equivalente a dos novelas).
-
Rendimiento de 71,6 % en Ader Coding Test, al nivel de OpenAI y Anthropic.
-
Coste radicalmente inferior: una tarea de programación cuesta ~1 dólar frente a los casi 70 de sus competidores.
-
Mejoras del 43 % en razonamiento de varios pasos respecto a V3.
El modelo funciona en formatos BF16 y FP8, y según el análisis comunitario, integra tokens especiales de búsqueda web en tiempo real y tokens de pensamiento para procesos internos de razonamiento. Una auténtica revolución en su modelo que vuelve a sorprender a todo el mundo tecnológico.
Una apuesta clara por el código abierto
Mientras que empresas como OpenAI o Anthropic mantienen sus modelos más potentes tras muros de pago, DeepSeek ha optado por publicar V3.1 bajo licencia MIT, disponible gratuitamente y para uso comercial.
Este enfoque busca adopción global más que beneficios inmediatos, reflejando la estrategia china de impulsar sus tecnologías a gran escala. De hecho, en enero la compañía ya sorprendió al afirmar que entrenar V3 apenas costó 5,6 millones de dólares usando ~2000 chips Nvidia menos potentes.
La llegada de V3.1 es significativa: demuestra que el rendimiento avanzado en IA ya no depende exclusivamente de recursos masivos ni de arquitecturas propietarias. Para investigadores y startups, supone una oportunidad de acceso a un modelo potente sin los costes prohibitivos de sus rivales.
Para las grandes tecnológicas, sin embargo, plantea una amenaza: si la comunidad abraza masivamente este tipo de modelos abiertos, el negocio de suscripciones premium a modelos cerrados podría perder atractivo.



