Noticias

¿Qué es DeepSeek, la empresa china de IA que está trastocando el mercado bursátil?

El frenesí por un chatbot de inteligencia artificial creado por la startup tecnológica china DeepSeek ha estado trastornando los mercados bursátiles y alimentando debates sobre la competencia económica y geopolítica entre Estados Unidos y China en el desarrollo de tecnología de IA.

DeepSeek se convirtió en la aplicación gratuita más descargada en la tienda de Apple el lunes, impulsado por la curiosidad sobre el competidor de ChatGPT. Parte de lo que preocupa es la idea de que la startup china ha alcanzado a las empresas estadounidenses que están a la vanguardia de la IA generativa a una fracción del costo.

Si eso es cierto, pone en duda las enormes cantidades de dinero que las empresas tecnológicas de Estados Unidos dicen que planean gastar en los centros de datos y los chips informáticos necesarios para impulsar avances adicionales en IA.

Pero las exageraciones y los conceptos erróneos sobre los avances tecnológicos de DeepSeek también sembraron confusión.

“Los modelos que construyeron son fantásticos, pero tampoco son milagros”, aclaró Stacy Rasgon, analista de Bernstein que sigue la industria de semiconductores y fue uno de varios analistas de bolsa que describieron la reacción de Wall Street como exagerada.

“No están usando ninguna innovación que sea desconocida o secreta o algo por el estilo”, dijo Rasgon. “Son cosas con las que todos están experimentando”.

¿Qué es DeepSeek?

Es una startup que fue fundada en 2023 en Hangzhou, China y lanzó su primer modelo de lenguaje de IA a gran escala ese mismo año. Su CEO, Liang Wenfeng, anteriormente cofundó uno de los principales fondos de riesgo de China, High-Flyer, que se centra en el comercio cuantitativo impulsado por IA. El fondo, para 2022, había acumulado un clúster de 10.000 chips A100 de Nvidia que se utilizan para construir y ejecutar sistemas de IA, según una publicación en la plataforma de redes sociales china WeChat. Poco después, Estados Unidos restringió la venta de esos chips a China.

DeepSeek ha dicho que sus modelos recientes fueron construidos con chips H800 Nvidia, que son de menos rendimiento y que no están prohibidos en China, sugiriendo que el hardware más sofisticado podría no ser necesario para la investigación de IA de vanguardia.

DeepSeek comenzó a atraer más atención en la industria de la IA el mes pasado cuando lanzó un nuevo modelo que presumía estar a la par con modelos similares de empresas estadounidenses como el fabricante de ChatGPT, OpenAI, y era más rentable en cuanto a entrenar el sistema en grandes cantidades de datos. El chatbot se hizo más accesible cuando apareció en las tiendas de aplicaciones de Apple y Google a principios de este año.

Pero fue un artículo de seguimiento publicado la semana pasada, el mismo día de la investidura del presidente Donald Trump, lo que desencadenó el pánico. Ese artículo trataba sobre otro modelo de DeepSeek llamado R1 que mostraba habilidades avanzadas de “razonamiento”, como la capacidad de repensar su enfoque de un problema matemático, y era significativamente más barato que un modelo similar vendido por OpenAI llamado o1.

“No tengo idea de si son más económicos o no”, dijo Rasgon, "pero creo que los precios asustaron a la gente”.

El antecedente histórico del Sputnik

Detrás del drama sobre las capacidades técnicas de DeepSeek hay un debate dentro de Estados Unidos sobre cómo competir mejor con China en IA.

“DeepSeek R1 es el momento Sputnik de la IA”, opinó el capitalista de riesgo Marc Andreessen en una publicación del domingo en la plataforma social X, haciendo referencia al lanzamiento del satélite de 1957 que desató la carrera espacial entre la Unión Soviética y Estados Unidos.

Andreessen, quien ha asesorado a Trump sobre política tecnológica, ha advertido que la sobrerregulación de la industria de la IA por parte del gobierno de Estados Unidos obstaculizará a las empresas estadounidenses y permitirá que China tome la delantera.

Pero la atención en DeepSeek también amenaza con socavar una estrategia clave de la política exterior de Estados Unidos en los últimos años para restringir la venta de semiconductores de IA diseñados en Estados Unidos a China. Algunos expertos en relaciones entre Estados Unidos y China no creen que eso sea una casualidad.

“La innovación tecnológica es real, pero el momento del lanzamiento es político por naturaleza”, sostuvo Gregory Allen, director del Centro Wadhwani para Estudios de la Inteligencia Artificial en el Centro de Estudios Estratégicos e Internacionales. Allen comparó el anuncio de DeepSeek la semana pasada con el lanzamiento de un nuevo teléfono por parte de la empresa china Huawei durante las discusiones diplomáticas sobre los controles de exportación de la administración Biden en 2023.

“Tratar de mostrar que los controles de exportación son inútiles o contraproducentes es un objetivo realmente importante de la política exterior china en este momento”, sostuvo Allen.

El lunes, Trump dijo que el avance de DeepSeek era “bueno porque no tienes que gastar tanto dinero”.

Hablando el lunes a congresistas republicanos en Miami, Trump calificó la noticia de DeepSeek como “positiva” si es precisa porque “no gastarás tanto y obtendrás el mismo resultado”. Llamó al desarrollo una “llamada de atención para nuestras industrias de que necesitamos estar enfocados en competir para ganar”.

Trump firmó una orden en su primer día en el cargo la semana pasada para “identificar y eliminar lagunas en los controles de exportación existentes”, señalando que podría endurecer el enfoque del presidente anterior, Joe Biden.

El progreso de DeepSeek en IA sin tanto gasto podría socavar la inversión potencial de 500.000 millones de dólares en IA por parte de OpenAI, Oracle y SoftBank que Trump promocionó en la Casa Blanca.

Las acciones de Nvidia cayeron un 17% el lunes, pero la compañía en un comunicado elogió el trabajo de DeepSeek como “un excelente avance” que aprovechó “modelos ampliamente disponibles que se ajustan completamente al control de exportaciones”.

¿Qué hace diferente a DeepSeek?

Una cosa que distingue a DeepSeek de competidores como OpenAI es que sus modelos son “de código abierto”, lo que significa que sus componentes están disponibles gratuitamente para que cualquiera pueda acceder y modificarlos, aunque la compañía no ha revelado los datos que utilizó para el entrenamiento.

Pero lo que ha atraído la mayor admiración sobre el modelo R1 de DeepSeek es lo que Nvidia llama un “ejemplo perfecto de Tiempos de Prueba”, es decir, la manera en que los modelos de IA muestran su tren de pensamiento y luego usan eso para un entrenamiento adicional sin tener que alimentarlos con nuevas fuentes de datos.

“Es básicamente pensar en voz alta”, señaló Lennart Heim, investigador de Rand Corp.

Los modelos de razonamiento de OpenAI, comenzando con o1, hacen lo mismo, y es probable que otros competidores con sede en Estados Unidos como Anthropic y Google tengan capacidades similares que no han sido lanzadas, indicó Heim.

“Pero es la primera vez que vemos a una empresa china alcanzar esos resultados en un período de tiempo relativamente corto. Creo que es por eso que mucha gente presta atención”, sostuvo Heim. “Solía ​​creer que OpenAI era el líder, el rey de la colina, y que nadie podría alcanzarlo. Resulta que esto no es completamente cierto”.

___

Esta historia fue traducida del inglés por un editor de AP con la ayuda de una herramienta de inteligencia artificial generativa.

Lo Último