Khronos выпустила Vulkan 1.4.352 — незначительное обновление, главной новинкой которого стало расширение VK_NV_cooperative_matrix_decode_vector. Это расширение, подписанное NVIDIA, позволяет декодировать несколько элементов матрицы за один вызов, расширяя возможности VK_NV_cooperative_matrix2. Также включены исправления и уточнения для API.
Векторное декодирование для кооперативных матриц 🚀
Расширение VK_NV_cooperative_matrix_decode_vector оптимизирует работу с матрицами в шейдерах. В то время как предыдущее расширение позволяло декодировать только один элемент за вызов, эта новая версия обрабатывает целые векторы, сокращая количество необходимых вызовов. Это приносит пользу таким рабочим нагрузкам, как вывод нейронных сетей или сжатие данных, где часто требуется доступ к блокам данных. Реализация специфична для аппаратного обеспечения NVIDIA и требует поддержки последних драйверов.
NVIDIA и её одержимость декодированием каждого последнего байта 🔥
NVIDIA не отдыхает: если раньше вы декодировали по одному элементу за раз, теперь вы можете делать это пакетами. Скоро мы увидим расширение для декодирования всей матрицы одним махом, а затем ещё одно, чтобы GPU приготовил вам кофе, пока вы ждёте. А пока разработчики AMD и Intel поглядывают искоса, задаваясь вопросом, магия ли это или просто очередной способ продать больше видеокарт.