Los datos no abandonan tu dispositivo, no se van a la nube
En un momento en que los centros de datos que sostienen la inteligencia artificial ya consumen el 1,5% de la electricidad mundial —cifra que podría duplicarse antes de 2030—, una corriente silenciosa de innovación propone una respuesta distinta: modelos de IA lo suficientemente pequeños para vivir dentro del propio dispositivo del usuario, sin necesidad de atravesar la nube. No es una revolución, sino una reorientación: la pregunta de cuánta energía debe costar pensar comienza a responderse también desde abajo.
- La demanda energética de la IA crece a un ritmo que supera cualquier precedente industrial, con proyecciones que sitúan el consumo de centros de datos por encima de las necesidades eléctricas de Japón para 2030.
- Gigantes tecnológicos como Amazon, Google, Microsoft y OpenAI están comprometiendo cientos de miles de millones de dólares en infraestructura, acelerando una carrera que profundiza la dependencia energética.
- Los modelos pequeños de IA —SLM— irrumpen como alternativa viable: se ejecutan directamente en laptops y smartphones, eliminando el ciclo de transmisión de datos y reduciendo drásticamente el gasto energético.
- Fabricantes de chips como Qualcomm ya rediseñan su hardware con unidades de procesamiento neuronal que permiten tareas de IA generativa en segundos, sin agotar la batería ni comprometer la privacidad del usuario.
- La limitación es real: los SLM son menos precisos, incapaces de razonamiento profundo o de integrar múltiples tipos de datos, lo que los confina a tareas relativamente simples.
- El horizonte apunta a un modelo híbrido donde el dispositivo resuelve lo cotidiano y la nube interviene solo cuando la complejidad lo exige, buscando un equilibrio entre potencia y sostenibilidad.
La inteligencia artificial ya representa el 1,5% del consumo eléctrico mundial, y todo indica que ese porcentaje se duplicará antes de 2030. Mientras las grandes empresas tecnológicas invierten sumas sin precedente —más de 320.000 millones de dólares solo en 2025— para construir centros de datos cada vez más colosales, una alternativa más discreta gana terreno: modelos de IA tan compactos que funcionan directamente en el teléfono o la computadora del usuario, sin conectarse a ningún servidor remoto.
Estos modelos, conocidos como SLM, representan una filosofía radicalmente distinta a la de sistemas como ChatGPT o Gemini. Proyectos como Mistral Small 3.1, TinyLlama 1.1B o el reciente Gemma 3 1B de Google demuestran que es posible integrar capacidades de IA en dispositivos cotidianos sin necesidad de internet. La investigadora Verónica Bolón-Canedo, de la Universidad de A Coruña, explica que su eficiencia proviene de redes neuronales más compactas y, sobre todo, de eliminar el costoso ciclo de enviar datos a un centro de datos remoto, procesarlos y devolver la respuesta. Como beneficio adicional, los datos del usuario nunca abandonan su dispositivo.
La industria del hardware ya se adapta a esta realidad. Qualcomm ha integrado unidades de procesamiento neuronal en su plataforma Snapdragon X, logrando que tareas que antes tardaban 15 segundos se completen en menos de uno. Sin embargo, los SLM tienen límites claros: son menos precisos que los grandes modelos, no pueden realizar razonamiento complejo ni combinar texto, imagen y audio de forma simultánea, y resultan más útiles para tareas sencillas como resúmenes, traducciones o transcripciones.
Los expertos no anticipan una sustitución, sino una convivencia: las aplicaciones recurrirán a la nube para operaciones exigentes y resolverán las tareas simples de forma local. En un contexto donde la Agencia Internacional de la Energía proyecta que los centros de datos consumirán 945 teravatios-hora anuales en 2030, los pequeños modelos no son la solución definitiva, pero podrían ser una pieza esencial en la construcción de una IA más sostenible.
La inteligencia artificial ha llegado a consumir tanta energía que los centros de datos que la alimentan ya representan el 1,5% de toda la electricidad mundial. Para 2030, ese porcentaje se duplicará. Pero mientras las grandes empresas invierten cientos de miles de millones de dólares en construir infraestructuras cada vez más masivas para sostener sistemas de IA cada vez más hambrientos, una alternativa silenciosa está ganando terreno: modelos de inteligencia artificial tan pequeños que caben en un teléfono móvil.
Estos pequeños modelos, conocidos como SLM por sus siglas en inglés, funcionan de manera radicalmente distinta a los grandes sistemas que impulsan ChatGPT o Google Gemini. Mientras que esos gigantes requieren conectarse constantemente a centros de datos para procesar cada consulta, los SLM están diseñados para ejecutarse directamente en el dispositivo del usuario: una computadora portátil, una tableta, incluso un smartphone. Mistral Small 3.1, desarrollado por la startup francesa Mistral, funciona en una Mac con 32 gigabytes de memoria. TinyLlama 1.1B, un proyecto de código abierto, se ejecuta en ordenadores con apenas 8 gigabytes de RAM. Google acaba de lanzar Gemma 3 1B, específicamente preparado para dispositivos móviles, permitiendo que los desarrolladores integren capacidades de IA en sus aplicaciones sin necesidad de conexión a internet.
La razón por la que esto importa es fundamentalmente energética. Goldman Sachs calcula que la demanda de energía de los centros de datos aumentará un 165% para 2030, impulsada principalmente por la IA. En 2025 solamente, Amazon, Microsoft, Google y Meta planean invertir más de 320.000 millones de dólares en infraestructura de centros de datos. OpenAI, junto a varios socios, tiene previsto desembolsar hasta 500.000 millones de dólares. La Comisión Europea anunció un programa de 200.000 millones de euros para construir sus propios centros de datos de IA. Es una carrera de acumulación de poder computacional sin precedentes.
Verónica Bolón-Canedo, investigadora de inteligencia artificial en la Universidad de A Coruña, explica el mecanismo detrás de la eficiencia de estos modelos pequeños. Los SLM están optimizados para tener un número mucho menor de parámetros, lo que significa que la red neuronal es más compacta. Cuanto más pequeño es el modelo, menos operaciones necesita realizar y menos espacio de almacenamiento requiere. Pero hay un beneficio aún mayor: al ejecutarse localmente en el dispositivo del usuario, se evita completamente el costo energético de transmitir datos hacia un centro de datos remoto, procesarlos en máquinas enormemente potentes que consumen cantidades masivas de energía, y luego devolver la respuesta. Ese ciclo de ida y vuelta desaparece. Además, ejecutar la IA localmente significa que los datos del usuario nunca abandonan su dispositivo, mejorando la privacidad, y que la respuesta llega instantáneamente sin la latencia de la comunicación de red.
Los fabricantes de chips ya están adaptando su hardware para hacer posible esto. Qualcomm ha desarrollado las NPU, unidades de procesamiento neuronal diseñadas específicamente para manejar la inferencia de IA de manera eficiente. Hace dos años, Qualcomm probó el modelo Stable Diffusion en un smartphone para generar una imagen, una tarea que tardaba 15 segundos. Hoy, gracias a procesadores diseñados específicamente para IA, esa misma tarea ocupa menos de un segundo. La compañía ha integrado estas NPU en su plataforma Snapdragon X, creando lo que la industria ahora llama AI PC: computadoras portátiles capaces de ejecutar tareas complejas de IA generativa mientras protegen la duración de la batería.
Pero los pequeños modelos tienen limitaciones claras. Son menos precisos que sus contrapartes gigantes y no sirven para todas las tareas. La generación de imágenes es particularmente complicada. No pueden realizar razonamiento profundo ni integrar múltiples tipos de información como texto, imágenes y audio simultáneamente. Aunque el desarrollo avanza rápidamente, estos modelos pequeños probablemente serán útiles para tareas relativamente simples: redacción de textos básicos, generación de resúmenes, lectura de escritura a mano en imágenes, traducción de textos, transcripción de audio.
El futuro, según los expertos, no será una elección entre uno u otro enfoque, sino un equilibrio híbrido. Las aplicaciones de IA llamarán a centros de datos en la nube cuando sea necesario para tareas que requieran poder computacional masivo, pero resolverán otras operaciones directamente en el dispositivo del usuario. Es una forma de avanzar hacia un equilibrio entre rendimiento y eficiencia energética. Mientras tanto, la Agencia Internacional de la Energía estima que los centros de datos pasarán de representar el 1,5% del consumo energético global actual a alcanzar el 3% en 2030, consumiendo 945 teravatios-hora anuales, una cifra superior a las necesidades energéticas de todo Japón. Las cargas de trabajo vinculadas a inteligencia artificial consumirían un 30% más de electricidad cada año. En ese contexto, los pequeños modelos que se ejecutan localmente no son una solución completa, pero podrían ser una pieza crucial en la construcción de un futuro de IA más sostenible.
Notable Quotes
Cuanto más pequeño es el modelo más eficiente es en consumo de energía, porque necesita hacer menos operaciones y necesita menos espacio de almacenamiento— Verónica Bolón-Canedo, investigadora de IA en la Universidad de A Coruña
El futuro pasa por adoptar un enfoque híbrido donde las aplicaciones de IA llamarán a la nube cuando sea necesario y resolverán otras tareas en el propio dispositivo— George Tsirtsis, director de tecnología de Qualcomm en Europa
The Hearth Conversation Another angle on the story
¿Por qué las grandes empresas siguen invirtiendo cientos de miles de millones en centros de datos si estos modelos pequeños ya funcionan en teléfonos?
Porque los pequeños modelos no pueden hacer lo que hacen los grandes. Un modelo pequeño puede resumir un texto o traducir, pero no puede razonar profundamente ni entender múltiples tipos de información a la vez. Para eso necesitas la potencia bruta de un centro de datos.
Entonces esto no es un reemplazo, sino una división del trabajo.
Exactamente. Una aplicación podría usar un modelo pequeño para tareas rápidas y locales, y luego conectarse a la nube cuando necesite hacer algo más complejo. Es como tener un asistente en casa para cosas sencillas y un experto en la ciudad para lo difícil.
¿Cuál es el verdadero beneficio ambiental si al final seguimos usando los centros de datos?
El ahorro es real pero parcial. Si reduces el número de consultas que van a la nube, reduces el consumo total. Un teléfono procesando localmente no consume casi nada comparado con un centro de datos. Pero tienes razón: mientras haya tareas que requieran centros de datos, el problema energético no desaparece.
¿Qué impide que estos modelos pequeños sean más precisos?
El tamaño. Un modelo grande tiene miles de millones de parámetros. Uno pequeño tiene millones. Menos parámetros significa menos capacidad para capturar la complejidad del lenguaje y el razonamiento. Es como la diferencia entre una enciclopedia y un folleto.
¿Entonces estamos viendo el comienzo de algo o solo un parche temporal?
Probablemente ambas cosas. Es un parche que reduce el daño hoy, pero también es el comienzo de una arquitectura diferente para la IA. Si los dispositivos pueden hacer más localmente, el futuro de la IA podría ser menos centralizado.