Khronos가 Vulkan 1.4.352를 출시했습니다. 이번 마이너 업데이트의 가장 큰 특징은 VK_NV_cooperative_matrix_decode_vector 확장 기능입니다. NVIDIA가 서명한 이 확장 기능은 호출당 여러 행렬 요소를 디코딩할 수 있게 하여 VK_NV_cooperative_matrix2의 기능을 확장합니다. 또한 API에 대한 수정 및 설명이 포함되어 있습니다.
협력 행렬을 위한 벡터 디코딩 🚀
VK_NV_cooperative_matrix_decode_vector 확장 기능은 셰이더에서 행렬 작업을 최적화합니다. 이전 확장 기능이 호출당 단일 요소만 디코딩할 수 있었던 반면, 이 새로운 버전은 전체 벡터를 처리하여 필요한 호출 수를 줄입니다. 이는 신경망 추론이나 데이터 압축과 같이 데이터 블록에 대한 접근이 빈번한 작업 부하에 유용합니다. 구현은 NVIDIA 하드웨어에 특화되어 있으며 최신 드라이버 지원이 필요합니다.
NVIDIA와 마지막 바이트까지 디코딩하려는 집착 🔥
NVIDIA는 쉬지 않습니다: 이전에는 한 번에 하나의 요소를 디코딩했다면, 이제는 버스트 방식으로 처리할 수 있습니다. 곧 행렬 전체를 한 번에 디코딩하는 확장 기능이 등장할 것이고, 그 다음에는 GPU가 기다리는 동안 커피를 준비해주는 확장 기능도 나올 것입니다. 그동안 AMD와 Intel 개발자들은 이게 마법인지, 아니면 단지 그래픽 카드를 더 많이 판매하기 위한 또 다른 방법인지 궁금해하며 지켜보고 있습니다.