O processamento de inferência em IA tem um gargalo clássico: mover dados da memória para o processador. A Untether AI apresenta o Boqueria, um acelerador que quebra essa dinâmica. Sua arquitetura massivamente paralela opera at-memory, ou seja, exatamente onde os dados são armazenados, reduzindo o consumo de energia e aumentando o desempenho por watt. Não é mágica, é engenharia bem pensada.
Como funciona a arquitetura at-memory do Boqueria 🚀
O Boqueria integra milhares de núcleos de computação diretamente na memória SRAM, eliminando a necessidade de mover dados através de barramentos externos. Cada núcleo executa operações simples, mas em paralelo, permitindo processar modelos de redes neurais com alta eficiência. Ao minimizar a latência e o gasto energético do movimento de dados, este chip alcança um desempenho sustentado em tarefas de inferência sem depender de memórias HBM caras ou refrigeração extrema.
O primo esperto que não precisa se mudar para trabalhar 🏠
Enquanto outros aceleradores montam um circo logístico para aproximar os dados do processador, o Boqueria é aquele colega que trabalha de casa. Literalmente, ele processa a informação onde ela mora. Então, se sua GPU parece um aspirador de pó barulhento e quente, talvez seja hora de considerar uma mudança. Afinal, para fazer contas, não é preciso viajar para o outro lado do chip.