A NVIDIA lançou o CUDA 13.3, uma atualização que marca um marco com a chegada do CUDA Python 1.0. Esta versão oferece suporte estável para executar código GPU a partir do Python, voltado para inteligência artificial, ciência de dados e computação científica. A plataforma unificada de programação GPU se torna mais acessível para desenvolvedores que buscam desempenho sem sair de seu ecossistema favorito.
Python 1.0 estável: menos voltas, mais núcleos 🚀
O CUDA Python 1.0 elimina a necessidade de wrappers externos ou bibliotecas intermediárias como PyCUDA. Os desenvolvedores agora podem invocar kernels CUDA diretamente de scripts Python, com tipagem nativa e gerenciamento de memória otimizado. A API expõe funções de controle de threads, blocos e streams, permitindo um ajuste fino do paralelismo. Além disso, integra-se com bibliotecas como NumPy e cuDF, facilitando a migração de protótipos para produção sem perder desempenho em relação ao C++.
E pensar que antes usávamos loops for como cavernícolas 😅
Agora qualquer cientista de dados pode se sentir um engenheiro de GPUs sem mudar de editor. Basta importar cuda e lançar kernels como se fossem funções normais. Claro, depois chega a hora de depurar e você percebe que seu script Python continua sendo Python: lento para iniciar, mas rápido quando o CUDA entra em ação. Pelo menos você não precisa mais se desculpar dizendo que Python é lento; agora pode culpar sua placa gráfica por não ter núcleos suficientes.