Khronos lançou o Vulkan 1.4.352, uma atualização menor que traz como grande novidade a extensão VK_NV_cooperative_matrix_decode_vector. Esta extensão, assinada pela NVIDIA, permite decodificar múltiplos elementos de matriz por invocação, ampliando as capacidades do VK_NV_cooperative_matrix2. Também são incluídas correções e esclarecimentos para a API.
Decodificação vetorial para matrizes cooperativas 🚀
A extensão VK_NV_cooperative_matrix_decode_vector otimiza o trabalho com matrizes em shaders. Enquanto a extensão anterior permitia decodificar um único elemento por invocação, esta nova versão processa vetores completos, reduzindo a quantidade de chamadas necessárias. Isso beneficia cargas de trabalho como inferência de redes neurais ou compressão de dados, onde o acesso a blocos de dados é frequente. A implementação é específica do hardware NVIDIA e requer suporte de drivers recentes.
NVIDIA e sua obsessão por decodificar até o último byte 🔥
A NVIDIA não descansa: se antes você decodificava um elemento de cada vez, agora pode fazer em rajadas. Em breve veremos uma extensão para decodificar a matriz inteira de uma só vez, e depois outra para que a GPU prepare seu café enquanto espera. Enquanto isso, os desenvolvedores da AMD e Intel observam de soslaio, perguntando-se se isso é mágica ou simplesmente outra forma de vender mais placas de vídeo.