Microsoft ha actualizado Windows 11 para permitir que tarjetas gráficas NVIDIA RTX serie 30 o superiores, con al menos 6 GB de memoria, ejecuten modelos de lenguaje local sin necesidad de un chip NPU. Esto abre la puerta a millones de usuarios que poseen equipos potentes pero carecen del hardware dedicado para inteligencia artificial. La medida democratiza el acceso a herramientas de IA sin requerir una inversión adicional en hardware nuevo.
Cómo funciona la ejecución local de modelos sin NPU 🖥️
El sistema aprovecha la arquitectura Tensor Core de las RTX para realizar inferencias de modelos de lenguaje mediante DirectML. Con 6 GB de VRAM es posible cargar modelos pequeños como Phi-3 o Llama 2 de 7B parámetros en cuantización 4 bits. El rendimiento depende de la generación de la GPU: una RTX 3060 ofrece fluidez básica, mientras que una RTX 4090 alcanza velocidades cercanas a las de una NPU dedicada. La función está disponible en la actualización 24H2 de Windows 11.
El NPU se queda en la nevera, pero no para siempre 😅
Así que resulta que esa NPU que prometía ser el futuro de la informática ahora puede esperar en el cajón junto al cargador de un Nokia 3310. Microsoft nos dice que los PCs viejos (con RTX) ya no son basura para IA, aunque funciones Copilot+ como Recall siguen exigiendo el chip secreto. Es como tener un coche con turbo pero que no puedes usar el aire acondicionado sin un permiso especial. Al menos, el resto de la IA local ya no requiere vender un riñón por un portátil nuevo.