China demuestra que la Inteligencia Artificial puede ser barata y no exclusiva de los EE.UU.


Por Jesús Saínz

    El 27 de enero de 2025, la compañía china DeepSeek hizo público un sistema de inteligencia artificial (IA) mucho más eficiente que el de las compañías de EE.UU. y con un coste muy inferior tanto en tiempo como en procesadores…

…y electricidad. Este anuncio provocó el pánico financiero en Wall Street y asustó a las empresas de Silicon Valley. En un solo día, borró un billón de dólares de valor en el mercado de acciones estadounidenses

https://laderechadiario.com/politica/wall-street-perdio-1-billon-dolares-mayor-caida-historia-del-mercado

     Representantes de DeepSeek dijeron la semana pasada que el rendimiento de su último modelo R1 estaba a la par con el modelo o1-mini de OpenAI (también creador de ChatGPT). El anuncio se produjo después de que DeepSeek dijera, en un informe de finales de diciembre, que utilizó solo unos 2.000 chips Nvidia en lugar de las decenas de miles de chips que normalmente utilizan las empresas de EE.UU. para entrenar modelos de un tamaño similar. Según la empresa china, entrenar uno de sus últimos modelos costó 5,6 millones de dólares, cifra minúscula si se compara con los 100 a 1.000 millones de dólares usados por las empresas tecnológicas estadounidenses (estimaciones de Dario Amodei, director ejecutivo de la empresa de IA Anthropic).

https://www.wsj.com/tech/chip-stocks-tumble-after-chinas-deepseek-ai-models-raise-doubts-over-u-s-tech-dominance-9799591b

     Nvidia, la compañía que fabrica los procesadores utilizados en IA, perdió en un solo día 592.700 millones de dólares. La mayor caída de precio de mercado en la historia de EE.UU. Esta cantidad es superior al valor total de compañías como Exxon Mobil, AT&T, Pfizer, UPS, Caterpillar o Boeing

https://www.wsj.com/tech/ai/deepseek-ai-china-nvidia-stock-76072072

    Aparte de las compañías que fabrican procesadores, también perdieron hasta un 20% de valor las compañías que intentan comercializar IA como Microsoft, Amazon, Meta, Alphabet (Google) y las compañías eléctricas que suministran la energía para el desarrollo de la AI. Se estima que las pérdidas causadas por DeepSeek en el mercado estadounidense superan el billón de dólares.

https://www.wsj.com/podcasts/the-journal/how-deepseek-sank-the-stock-market/a2568bb5-3a01-4982-aca4-b6946fddaf5e?mod=Searchresults_pos8&page=1

     El terremoto financiero causado por la empresa China se debe que demuestra que el enorme gasto de las empresas tecnológicas de EE.UU. en IA no es necesario y sugiere que dichas empresas se han beneficiado de una burbuja creada por los medios de comunicación, burbuja que podría explotar en cualquier momento. DeepSeek “podría alterar toda la narrativa de la IA que ha ayudado a impulsar los mercados en los últimos dos años» (Brian Jacobsen, economista jefe de Annex Wealth Management, Wisconsin).

https://www.reuters.com/technology/chinas-deepseek-sets-off-ai-market-rout-2025-01-27/

    Además, la revolución científica de DeepSeek pone en tela de juicio el supuesto de las compañías estadounidenses de que la IA solo puede funcionar con los costosos procesadores que ellas fabrican y con los enormes gastos de electricidad que requieren sus modelos, lo cual implicaría que solo países muy ricos podrían producir sistemas de IA.

    Sorprendentemente, el origen del modelo de IA de DeepSeek se halla en la prohibición de la administración Biden de exportar los procesadores utilizados para IA a China a partir de 2022. China hizo de la necesidad virtud y los científicos e ingenieros chinos de DeepSeek, en lugar de la fuerza bruta del dinero, utilizaron la inteligencia (natural) para desarrollar un sistema que utiliza una fracción mínima del poder de computación que necesitan los modelos de las compañías de EE.UU, como el o1 de OpenAI, empresa dominante en el sector hasta la llegada de DeepSeek, o el Llama-3 de Meta, ahorrando tiempo y dinero.

     Los sistemas de inteligencia artificial funcionan utilizando modelos matemáticos y datos. Primero, se recopila una gran cantidad de datos y se procesan con modelos matemáticos, o algoritmos, que utilizan la información para reconocer patrones y hacer predicciones en un proceso conocido como “entrenamiento”. Una vez que se han entrenado los algoritmos, se implementan en varias aplicaciones, donde aprenden continuamente y se adaptan a los nuevos datos. Esto permite que los sistemas de IA realicen tareas complejas como el reconocimiento de imágenes, el procesamiento del lenguaje y el análisis de datos con mayor precisión y eficiencia a lo largo del tiempo.
https://builtin.com/artificial-intelligence

     La IA de DeepSeek funciona con un modelo que utiliza un programa informático de código abierto –open source– (público y de uso libre) muy eficiente que alcanza niveles de rendimiento similares al modelo o1 de OpenAI pero con un costo de entrenamiento muchísimo menor. El entrenamiento del modelo tuvo un presupuesto de $6 millones. Utilizaron 2,000 GPUs (unidades de procesamiento gráfico) durante 2 meses o aproximadamente 3 millones de horas de GPU), muy inferior a los 30 millones de horas de GPU utilizadas por el sistema de IA Llama-3 de la compañía Meta. Además, el modelo de DeepSeek hizo el entrenamiento utilizando ordenadores con procesadores menos potentes ahorrando cantidades enormes de electricidad. Esto hace que los precios de uso de DeepSeek-R1, para los consumidores de los servicios que ofrecen al público, sean significativamente más bajos que los de las empresas estadounidenses (hasta 107 veces menores).

     Es curioso que los micro procesadores (GPUs) usados en IA sean los utilizados para los video juegos. Una GPU, acrónimo de “Graphics Processing Unit”, es un circuito electrónico especializado que se diseñó para agilizar la creación de imágenes y vídeos. Su capacidad para realizar un gran número de cálculos rápidamente ha hecho que se adopten para la inteligencia artificial y la computación científica, donde tienen que gestionar tareas que requieren muchos datos y un gran poder de computación. Las GPUs funcionan realizando un gran número de operaciones al mismo tiempo. Para ello, cuentan con un muchos núcleos de procesamiento que pueden trabajar en diferentes partes de una tarea simultáneamente. Esta arquitectura de procesamiento paralelo permite que las GPUs gestionen tareas rápidamente.

    La importancia de la aportación de DeepSeek, cuyo algoritmo es libre, se debe a que si el coste de la IA es demasiado elevado, solo países muy ricos, como EE.UU., podrían desarrollarla. El país o países que posean los mejores sistemas de IA dominarán la economía mundial y el poder militar transformando profundamente la producción y el balance geopolítico actual.

    La inteligencia artificial tiene como objetivos el construir máquinas capaces de realizar tareas que requieren inteligencia humana y máquinas que trabajen mejor y más rápido que la inteligencia humana. La IA permite que las máquinas repliquen capacidades humanas, como el aprendizaje, la resolución de problemas, la toma de decisiones y la comprensión.

    Los sistemas de IA se crean mediante el aprendizaje automático. Los algoritmos aprenden de grandes conjuntos de datos identificando patrones y relaciones dentro de los datos. Un algoritmo de aprendizaje automático utiliza técnicas estadísticas para “aprender” cómo mejorar progresivamente en una tarea, sin haber sido necesariamente programado para esa tarea en particular. Utiliza datos históricos como entrada para predecir nuevos valores de salida.

    El aprendizaje automático se realiza utilizando conexiones como las “redes neuronales”, una serie de algoritmos que procesan datos imitando el funcionamiento del cerebro humano. Estas redes consisten en capas de nodos interconectados, o “neuronas”, que procesan información y la pasan entre sí. La intensidad de las conexiones entre estos nodos, le permite a la red identificar patrones complejos dentro de los datos, hacer predicciones y aprender de los errores. Esto hace que las redes de nodos puedan reconocer imágenes, comprender el habla humana y traducir palabras entre idiomas. Estos procesos se realizan con programas especializados en ordenadores con procesadores diseñados para ello y utilizan información proveniente de grandes bases de datos.

    En un ensayo de 2024 sobre las promesas de la tecnología, el director ejecutivo de Anthropic (empresa estadounidense de IA), Dario Amodei, especula que una IA potente podría acelerar la innovación en las ciencias biológicas hasta diez veces al permitir que se realice un mayor número de experimentos en un momento dado y acortar la brecha entre los nuevos descubrimientos y la investigación posterior basada en esos descubrimientos.

    La IA podría revolucionar la industria de las armas, desarrollar nuevos medicamentos, optimizar las cadenas de suministro globales, generar robots que hagan cualquier tipo de trabajo, transformar la arquitectura, la agricultura, la ingeniería, la medicina y todo tipo de industrias cambiando la forma de vivir y trabajar. Quien controle la IA, controlará el mundo.

Nota.

“El Mundo Today” publica que Murcia presenta la inteligencia artificial española: dos palos y una cuerda.
https://www.elmundotoday.com/2025/01/tras-deepseek-ahora-es-murcia-quien-humilla-a-usa-presentando-una-inteligencia-artificial-hecha-con-dos-palos-y-una-cuerda/

Artículos relacionados :