Khronos hat Vulkan 1.4.352 veröffentlicht, ein kleineres Update, das als große Neuerung die Erweiterung VK_NV_cooperative_matrix_decode_vector mit sich bringt. Diese von NVIDIA signierte Erweiterung ermöglicht die Dekodierung mehrerer Matrixelemente pro Aufruf und erweitert damit die Fähigkeiten von VK_NV_cooperative_matrix2. Darüber hinaus sind Korrekturen und Klarstellungen für die API enthalten.
Vektorielle Dekodierung für kooperative Matrizen 🚀
Die Erweiterung VK_NV_cooperative_matrix_decode_vector optimiert die Arbeit mit Matrizen in Shadern. Während die vorherige Erweiterung die Dekodierung eines einzelnen Elements pro Aufruf erlaubte, verarbeitet diese neue Version vollständige Vektoren, wodurch die Anzahl der erforderlichen Aufrufe reduziert wird. Dies kommt Arbeitslasten wie der Inferenz neuronaler Netze oder der Datenkomprimierung zugute, bei denen der Zugriff auf Datenblöcke häufig ist. Die Implementierung ist NVIDIA-Hardware-spezifisch und erfordert Unterstützung durch aktuelle Treiber.
NVIDIA und seine Besessenheit, jedes letzte Byte zu dekodieren 🔥
NVIDIA macht keine Pause: Wenn du früher ein Element nach dem anderen dekodiert hast, kannst du es jetzt in Schüben tun. Bald werden wir eine Erweiterung sehen, um die gesamte Matrix auf einen Schlag zu dekodieren, und dann eine weitere, damit die GPU dir einen Kaffee kocht, während du wartest. In der Zwischenzeit schielen die Entwickler von AMD und Intel herüber und fragen sich, ob das Magie ist oder einfach nur eine weitere Möglichkeit, mehr Grafikkarten zu verkaufen.