El procesamiento de inferencia en IA tiene un cuello de botella clásico: mover datos desde la memoria hasta el procesador. Untether AI presenta Boqueria, un acelerador que rompe esa dinámica. Su arquitectura masivamente paralela opera at-memory, es decir, justo donde se almacenan los datos, reduciendo el consumo energético y aumentando el rendimiento por vatio. No es magia, es ingeniería bien pensada.
Cómo funciona la arquitectura at-memory de Boqueria 🚀
Boqueria integra miles de núcleos de computación directamente en la memoria SRAM, eliminando la necesidad de mover datos a través de buses externos. Cada núcleo ejecuta operaciones simples pero en paralelo, lo que permite procesar modelos de redes neuronales con alta eficiencia. Al minimizar la latencia y el gasto energético del movimiento de datos, este chip logra un rendimiento sostenido en tareas de inferencia sin depender de memorias HBM caras o refrigeración extrema.
El primo listo que no necesita mudarse para trabajar 🏠
Mientras otros aceleradores montan un circo logístico para acercar los datos al procesador, Boqueria es ese compañero que trabaja desde casa. Literalmente, procesa la información donde vive. Así que si tu GPU parece una aspiradora ruidosa y caliente, quizá deberías plantearte un cambio. Al fin y al cabo, para hacer cuentas no hace falta viajar al otro lado del chip.