CUDA 十三点三版本发布 伴随 Python 一点零稳定版 面向 GPU

发布于 2026年05月29日 | 从西班牙语翻译

NVIDIA 已发布 CUDA 13.3,这是一次里程碑式的更新,带来了 CUDA Python 1.0 的正式亮相。该版本为从 Python 运行 GPU 代码提供了稳定支持,面向人工智能、数据科学和科学计算领域。统一的 GPU 编程平台对于希望在喜爱的生态系统中追求高性能的开发者来说变得更加易用。

CUDA 13.3 执行期间的 GPU 架构横截面,Python 代码块转化为并行处理流,多个 CUDA 核心以蓝色和橙色点亮,数据流经内存层级,AI 张量核心正在积极处理,发光的电路路径连接 Python 解释器与 GPU 硬件,技术插图风格,照片级工程可视化,戏剧性的体积光照,复杂芯片裸片图案与可见晶体管结构,超精细半导体纹理,干净工业美学,高对比度金属表面

Python 1.0 稳定版:更少绕路,更多核心 🚀

CUDA Python 1.0 消除了对外部包装器或 PyCUDA 等中间库的需求。开发者现在可以直接从 Python 脚本调用 CUDA 内核,并享受原生类型和优化的内存管理。该 API 暴露了线程、块和流的控制函数,允许对并行性进行精细调整。此外,它与 NumPy 和 cuDF 等库集成,便于将原型迁移到生产环境,同时保持与 C++ 相当的性能。

想想以前我们像穴居人一样用 for 循环 😅

现在任何数据科学家都可以在不更换编辑器的情况下感觉自己像 GPU 工程师。只需导入 cuda 并像普通函数一样启动内核即可。当然,到了调试的时候,你会意识到你的 Python 脚本仍然是 Python:启动慢,但一旦 CUDA 发力就飞快。至少你不再需要为 Python 慢而找借口了;现在你可以责怪你的显卡核心不够多。