Fundado en 1910
App de asistente de IA DeepSeek

App de asistente de IA DeepSeekEuropa Press

Por qué DeepSeek ha puesto patas arriba el mercado de la inteligencia artificial en solo dos semanas

Esta aplicación está por delante de ChatGPT de OpenAI incluso en los Estados Unidos

El asistente DeepSeek llegó a App Store el pasado 11 de enero y, desde entonces, ha escalado hasta ocupar la primera posición en la tienda de Apple en Estados Unidos, por delante de ChatGPT, de OpenAI; un hito para una aplicación que apenas acaba de llegar al mercado y que compite con el 'chatbot' más popular desde hace más de dos años.

Deepseek es un asistente de inteligencia artificial (IA) generativa que la firma china del mismo nombre lanzó el pasado 11 de enero en la App Store, donde se ofrece bajo una modalidad de uso gratuito. Además de responder preguntas con un formato conversacional, puede navegar por la web para ofrecer respuestas actualizadas, resumir documentos de texto de manera rápida y utilizar el razonamiento para resolver problemas complejos.

En su base se encuentra el modelo DeepSeek V3, que se lanzó en diciembre. Este ha sido entrenado con 671.000 millones de parámetros con arquitectura Mixture of Experts (Moe), que divide un modelo de IA en pequeñas redes neuronales para que actúen de forma separada como si fueran distintos expertos.

Dispone también de 37.000 millones de parámetros activadas para cada token, como explican sus responsables en el repositorio de GitHub. Y sus responsables han recurrido han recurrido al mecanismos de atención latente multicabezal (MLA) para «lograr una inferencia eficiente y una capacitación rentable».

La compañía tecnológica ha empleado 14,8 billones de tokens «diversos y de alta calidad» junto con un ajuste supervisado y aprendizaje de refuerzo por fases. Aseguran que, además, cada token ha requerido para su entrenamiento 3,7 días con 2.048 GPU Nvidia H800, lo que hace que el entrenamiento total alcance los 2,788 millones de horas de GPU y un coste total de 5,576 millones de dólares. Este coste está lejos de los 78 millones de dólares de GPT-4 y de los 191 millones de dólares de Gemini Ultra de Google, como se recoge en Artificial Intelligence Index Report 2024.

¿Cómo reaccionó la bolsa?

Los mercados están reaccionando a la incursión de DeepSeek vendiendo acciones de grandes empresas tecnológicas estadounidenses. Muchos pasaron la semana pasada alardeando de cuánto dinero iban a gastar en la construcción de enormes centros de datos para entrenar y servir a la IA. Ahora los inversores están empezando a cuestionar eso. DeepSeek afirma que entrenar su modelo costó alrededor de 5,6 millones de dólares, una pequeña fracción de lo que cuestan sus competidores estadounidenses. Dario Amodei, director ejecutivo de Anthropic, ha dicho que entrenar un modelo cuesta entre 100 millones y mil millones de dólares.

¿Qué significa esto para los controles de exportación de chips de EE.UU.?

Marc Andreessen, un destacado inversor tecnológico y que ahora es asesor del presidente Donald Trump, también calificó a DeepSeek como un «momento Sputnik», similar a cuando Rusia sorprendió a Estados Unidos al poner el primer satélite en órbita. Sí plantea interrogantes sobre la eficacia de que Estados Unidos restrinja las exportaciones de chips a China. Muchos habían argumentado que los controles simplemente obligarían a los chinos a innovar de otras maneras. Así lo recoge The Times.

Alexandr Wang, fundador y director ejecutivo de Scale AI, le escribió a Trump la semana pasada bajo el título «Estados Unidos debe ganar la guerra de la IA». Instó al presidente a invertir, capacitar, regular y asignar mejor la energía. «Si Estados Unidos continúa en nuestra trayectoria actual, corremos el riesgo de caer y quedarnos atrás», advirtió.

Sin embargo, Nathan Benaich, socio general de Air Street Capital, dijo que «el panorama es más complicado de lo que sugieren los últimos días de tomas sin aliento», ya que «las principales empresas estadounidenses mantienen sus mejores capacidades en privado, mientras que los propios líderes de DeepSeek citan un acceso restringido a el hardware más potente como una seria desventaja».

comentarios
tracking

Compartir

Herramientas