L'elaborazione di inferenza nell'IA ha un collo di bottiglia classico: spostare i dati dalla memoria al processore. Untether AI presenta Boqueria, un acceleratore che rompe questa dinamica. La sua architettura massivamente parallela opera at-memory, cioè proprio dove vengono memorizzati i dati, riducendo il consumo energetico e aumentando le prestazioni per watt. Non è magia, è ingegneria ben pensata.
Come funziona l'architettura at-memory di Boqueria 🚀
Boqueria integra migliaia di core di calcolo direttamente nella memoria SRAM, eliminando la necessità di spostare i dati attraverso bus esterni. Ogni core esegue operazioni semplici ma in parallelo, consentendo di elaborare modelli di reti neurali con elevata efficienza. Minimizzando la latenza e il dispendio energetico dello spostamento dei dati, questo chip raggiunge prestazioni sostenute in compiti di inferenza senza dipendere da costose memorie HBM o raffreddamento estremo.
Il cugino intelligente che non ha bisogno di traslocare per lavorare 🏠
Mentre altri acceleratori organizzano un circo logistico per avvicinare i dati al processore, Boqueria è quel compagno che lavora da casa. Letteralmente, elabora le informazioni dove vive. Quindi, se la tua GPU sembra un aspirapolvere rumoroso e caldo, forse dovresti considerare un cambio. Dopotutto, per fare i conti non serve viaggiare dall'altra parte del chip.