Khronos ha lanzado Vulkan 1.4.352, una actualización menor que trae como gran novedad la extensión VK_NV_cooperative_matrix_decode_vector. Esta extensión, firmada por NVIDIA, permite decodificar múltiples elementos de matriz por invocación, ampliando las capacidades de VK_NV_cooperative_matrix2. Se incluyen además correcciones y aclaraciones para la API.
Decodificación vectorial para matrices cooperativas 🚀
La extensión VK_NV_cooperative_matrix_decode_vector optimiza el trabajo con matrices en shaders. Mientras que la extensión anterior permitía decodificar un solo elemento por invocación, esta nueva versión procesa vectores completos, reduciendo la cantidad de llamadas necesarias. Esto beneficia cargas de trabajo como la inferencia de redes neuronales o la compresión de datos, donde el acceso a bloques de datos es frecuente. La implementación es específica de hardware NVIDIA y requiere soporte de controladores recientes.
NVIDIA y su obsesión por decodificar hasta el último byte 🔥
NVIDIA no descansa: si antes decodificabas un elemento a la vez, ahora puedes hacerlo en ráfagas. Pronto veremos una extensión para decodificar la matriz entera de un solo golpe, y luego otra para que la GPU te prepare el café mientras esperas. Mientras tanto, los desarrolladores de AMD e Intel miran de reojo, preguntándose si esto es magia o simplemente otra forma de vender más tarjetas gráficas.