DEEPSEEK-R1 – EL CONTENDIENTE CHINO EN LA CARRERA DE LA IA QUE QUIERE DESAFIAR A OPENAI – MDNEWS
En los últimos años, los avances de vanguardia en inteligencia artificial (IA) han sido impulsados principalmente por empresas con sede en Estados Unidos como OpenAI, Google, Meta y Anthropic, todas ellas compitiendo ferozmente para crear los modelos más potentes y eficientes. Sin embargo, ha surgido un nuevo actor de China, DeepSeek, que ha logrado avances significativos con su modelo DeepSeek-R1 ( https://www.deepseek.com/ ). Este nuevo modelo se ha posicionado rápidamente como una alternativa competitiva a los sistemas de IA estadounidenses establecidos, en particular el famoso modelo o1 de OpenAI.
El recorrido y los antecedentes de DeepSeek
DeepSeek, un laboratorio de investigación de IA fundado en 2023 por el fondo de cobertura High-Flyer, ha desarrollado el modelo DeepSeek-R1 como parte de sus esfuerzos de investigación en IA en curso. High-Flyer, fundada en 2015 por tres ingenieros de la Universidad de Zhejiang, comenzó inicialmente como un fondo de cobertura que utilizaba el aprendizaje automático para la negociación de acciones. En 2021, todas las estrategias de High-Flyer se habían basado en IA, y la empresa creó entonces DeepSeek como su rama de investigación dedicada a la IA. A pesar de ser un actor relativamente joven, DeepSeek se ha convertido rápidamente en un competidor serio en el espacio de la IA.
Características principales de DeepSeek-R1
El modelo DeepSeek-R1 está construido con una impresionante cantidad de 671 mil millones de parámetros, lo que lo coloca en competencia directa con algunos de los modelos de IA más poderosos del mundo. En pruebas como AIME, Codeforces, Math-500 y SWE-Bench Verified, DeepSeek-R1 ha demostrado un rendimiento comparable al de o1 de OpenAI y, en algunos casos, incluso mejor. Esto incluye superar a o1 en pruebas comparativas de resolución de problemas matemáticos y codificación de alto nivel. Estos resultados indican que DeepSeek-R1 es un fuerte contendiente, en particular para tareas técnicas como la codificación.

Una de las características clave que diferencia a DeepSeek-R1 de o1 de OpenAI es su naturaleza de código abierto. A diferencia de OpenAI, que restringe el acceso a sus modelos, DeepSeek-R1 se publica bajo una licencia MIT, lo que permite a los usuarios modificar libremente el modelo para diversas aplicaciones. Este enfoque de código abierto le otorga a DeepSeek una ventaja única, ya que hace que sus modelos sean más accesibles para los desarrolladores e investigadores que buscan crear soluciones personalizadas basadas en la arquitectura del modelo.
Ventaja de costo
Además de sus impresionantes capacidades técnicas, DeepSeek-R1 ofrece una importante ventaja de costo sobre los modelos de OpenAI. OpenAI cobra 60 dólares por millón de tokens de salida para su modelo o1, mientras que DeepSeek-R1 ofrece sus servicios a tan solo 2,1 dólares por millón de tokens de salida. Para los tokens de entrada, OpenAI cobra 7,5 dólares por millón por cada acceso a la memoria caché, mientras que DeepSeek-R1 cobra solo 0,14 dólares por millón de tokens. Esta diferencia de precio sustancial hace que DeepSeek-R1 sea una opción atractiva para las empresas y los desarrolladores que buscan aprovechar la IA sin los altos costos asociados con otros modelos.
Rendimiento en indicadores clave
DeepSeek-R1 ha demostrado un rendimiento notable en varios puntos de referencia de IA populares. En particular, tuvo un mejor rendimiento que el modelo o1 de OpenAI en las pruebas AIME 2024, Codeforces y SWE-Bench Verified, lo que demuestra sus sólidas capacidades en tareas de codificación y resolución de problemas. Estos puntos de referencia se utilizan ampliamente para evaluar la eficacia de los modelos de IA en la codificación, el razonamiento matemático y la resolución de problemas en general. El hecho de que DeepSeek-R1 se destaque en estas pruebas dice mucho sobre su potencial para manejar tareas complejas y técnicas.
DeepSeek-R1-Zero y la evolución de los modelos de DeepSeek
Antes de lanzar DeepSeek-R1, la empresa también presentó el modelo DeepSeek-R1-Zero, que empleaba el aprendizaje por refuerzo (RL) a gran escala como su principal método de entrenamiento. Este modelo marcó un paso significativo en los esfuerzos de DeepSeek por desarrollar una IA de razonamiento, ya que el modelo mostraba autoverificación, reflexión y la capacidad de generar extensas cadenas de pensamiento (CoT). DeepSeek-R1-Zero demostró que las capacidades de razonamiento podían incentivarse únicamente a través del RL, sin depender del ajuste fino supervisado (SFT), una técnica que suelen utilizar otros modelos de IA.
Si bien DeepSeek-R1-Zero demostró ser prometedor, tenía algunas limitaciones, incluidos problemas con la repetición, la legibilidad y la mezcla de idiomas. Para abordar estos desafíos, DeepSeek desarrolló DeepSeek-R1, que incorporó datos de inicio en frío antes del entrenamiento de aprendizaje de refuerzo. Este paso adicional previo al entrenamiento mejoró significativamente las capacidades de razonamiento del modelo, superando las deficiencias observadas en el modelo R1-Zero y brindando una solución más refinada y práctica para aplicaciones del mundo real.
Innovación de código abierto y rentable
El DeepSeek-R1 y sus modelos predecesores se han lanzado como software de código abierto, y DeepSeek también ofrece seis versiones simplificadas más pequeñas del modelo. Entre ellas, DeepSeek-R1-Distill-Qwen-32B ha mostrado resultados excepcionales, superando incluso al o1-mini de OpenAI en múltiples pruebas comparativas. Es probable que este enfoque de código abierto, combinado con el precio rentable del modelo, atraiga a una amplia gama de usuarios, desde investigadores hasta desarrolladores, ya que permite una mayor personalización y accesibilidad.
El contexto político y las limitaciones
Como modelo de IA desarrollado en China, DeepSeek-R1 enfrenta algunas limitaciones inherentes debido al panorama político y regulatorio de ese país. El modelo debe cumplir con estrictos controles gubernamentales, lo que garantiza que sus respuestas se alineen con los valores y las prioridades políticas de China. Por ejemplo, DeepSeek-R1 no puede participar en debates sobre temas como la Plaza de Tiananmen o la autonomía de Taiwán, lo que refleja las políticas del gobierno chino sobre el uso de la IA. Estas regulaciones pueden limitar el uso del modelo en ciertos contextos internacionales o en países con diferentes puntos de vista políticos.
Un serio competidor de los gigantes estadounidenses de la inteligencia artificial
Con el lanzamiento de DeepSeek-R1, China se perfila como un formidable competidor de los EE. UU. en el campo de la investigación y el desarrollo de la IA. El rendimiento del modelo, su relación coste-beneficio y su naturaleza de código abierto desafían el dominio de las empresas de IA estadounidenses como OpenAI. Además, la decisión de DeepSeek de anunciar públicamente sus logros con la frase “¡Superando los límites de la IA abierta !” refleja la confianza del laboratorio en su capacidad para competir con OpenAI, que ha sido criticado por no abrir el código fuente de sus modelos. Esta audaz decisión es una declaración de intenciones: DeepSeek está listo para enfrentarse a los actores establecidos y redefinir el futuro de la IA.