Meta ha presentado la segunda generación de su acelerador de inferencia, el MTIA v2, cuyo nombre en clave es Artemis. Este chip no está diseñado para juegos ni para IA generativa de texto, sino para una tarea muy concreta: hacer que los algoritmos de recomendación de Facebook e Instagram funcionen más rápido y con mayor eficiencia energética.
Un chip específico para el motor de recomendaciones 🚀
El MTIA v2 es un acelerador de inferencia que se centra en modelos de Deep Learning de baja precisión, como los que usan los sistemas de ranking y recomendación de Meta. Con 256 núcleos y una memoria SRAM de 128 MB, Artemis ofrece un rendimiento de hasta 102,4 TOPS (INT8). Su diseño en 5nm de TSMC permite un consumo de 90W, optimizando el balance entre velocidad y calor para servidores. La clave está en su arquitectura de datos, que reduce la latencia en tareas de embeddings y búsqueda de productos.
Artemis: porque tu feed de Reels no se va a recomendar solo 🔥
Vamos, que Meta ha fabricado un procesador específico para que el algoritmo decida si ese vídeo de un gato tocando el piano merece estar en tu feed antes que la receta de tu tía. Ahora, en lugar de esperar a que un servidor genérico lo calcule, Artemis lo hace en un santiamén y gastando menos luz. Todo para que te quedes pegado al scroll viendo cosas que ni sabías que querías ver. La eficiencia energética es una excusa; el objetivo real es que no puedas soltar el móvil.