
Lo que hace especial a DeepSeek es que es, aparentemente, mucho más barato. Mientras que se informa que el líder de la industria, OpenAI, gastó más de 100 millones de dólares en el desarrollo de GPT-4, DeepSeek desarrolló su modelo a partir de 6 millones de dólares. Esta ventaja de costo se logró mediante el uso de chips Nvidia A100 de gama alta en combinación con otros procesadores relativamente más baratos.
Los expertos argumentan que esta cifra es engañosa porque no tiene en cuenta los costos más amplios de investigación y desarrollo, la adquisición de datos, los gastos de personal, los costos de infraestructura y las inversiones en hardware.
Rendimiento y características
Al igual que ChatGPT, DeepSeek funciona proporcionando respuestas a preguntas, y es comparable al modelo o1 de OpenAI en matemáticas y codificación. Es un modelo de «razonamiento» que piensa y responde como lo hacen los seres humanos, lo que lo hace particularmente útil para fines comerciales y de servicio al cliente.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
El sistema es particularmente bueno para demostrar su proceso de razonamiento en la resolución de un problema al dividir su proceso de razonamiento en pasos. También puede, como un humano que resuelve un rompecabezas, rastrear su lógica y corregir los pasos anteriores si es necesario.
Este enfoque transparente permite a los usuarios saber cómo se le ocurren sus recomendaciones.
DeepSeek plantea preocupaciones éticas
El ascenso de DeepSeek en el panorama de la IA está planteando preguntas importantes sobre las consecuencias de su tecnología, especialmente dado que fue entrenada sobre la columna vertebral de hardware costoso que puede haber sido desarrollado para romper los controles de exportación de EE. UU.
Si bien el rendimiento de su modelo R1, que es capaz de replicar la funcionalidad del o1 de OpenAI pero a una fracción del costo, es impresionante, también revela la posibilidad de prácticas no supervisadas o poco éticas en el desarrollo de la IA en el resto del mundo.
La capacidad de la compañía para incorporar con éxito chips Nvidia A100, que anteriormente estaban restringidos por las regulaciones estadounidenses, es una señal de alerta sobre la autenticidad de la compañía y cómo tales tecnologías pueden usarse para subvertir el orden internacional.
Además, la conformidad de las respuestas de DeepSeek a eventos históricos sensibles con la censura del gobierno chino es preocupante, ya que muestra que el modelo podría usarse para respaldar narrativas controladas por el estado, lo que podría limitar la utilidad y credibilidad del modelo a nivel mundial.
Por lo tanto, a medida que los mercados responden a esta amenaza percibida a la supremacía tecnológica estadounidense, las implicaciones más amplias de la estrategia de DeepSeek, innovadora pero moralmente sólida, deben analizarse a fondo.