KhronosはVulkan 1.4.352をリリースしました。これはマイナーアップデートですが、最大の新機能はVK_NV_cooperative_matrix_decode_vector拡張機能です。NVIDIAによって署名されたこの拡張機能は、1回の呼び出しで複数の行列要素をデコードすることを可能にし、VK_NV_cooperative_matrix2の機能を拡張します。さらに、APIの修正と明確化も含まれています。
協調行列のためのベクトルデコード 🚀
VK_NV_cooperative_matrix_decode_vector拡張機能は、シェーダーでの行列処理を最適化します。以前の拡張機能では1回の呼び出しで1つの要素のみをデコードできましたが、この新しいバージョンでは完全なベクトルを処理し、必要な呼び出し回数を削減します。これにより、データブロックへのアクセスが頻繁なニューラルネットワーク推論やデータ圧縮などのワークロードが恩恵を受けます。この実装はNVIDIAハードウェア固有であり、最近のドライバーのサポートが必要です。
NVIDIAと最後のバイトまでデコードする執念 🔥
NVIDIAは休むことを知りません。以前は一度に1つの要素をデコードしていたのが、今ではバーストで行えるようになりました。間もなく、行列全体を一気にデコードする拡張機能が登場し、さらにその次には、待っている間にGPUがコーヒーを入れてくれる拡張機能が登場するでしょう。その間、AMDとIntelの開発者は横目で見ながら、これが魔法なのか、それとも単にグラフィックカードをもっと売るための別の方法なのか、疑問に思っています。