多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python 提供原生支持并全面与之集成。也就是说,开发人员能够使用 Python 直接在 GPU 上执行算法式计算。 据悉,2025 年被英伟达视为“CUDA Python ...
作者:紫晗编辑:李宝珠转载请联系本公众号获得授权,并标明来源2025 年 12 月,在 CUDA 发布近二十年后,NVIDIA 推出新的 GPU 编程入口「cuTile」,通过 Tile-based 编程模型重构 GPU 内核,使开发者无需深入 ...
编译 | 核子可乐、Tina 今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达 ...
在 GPU 计算领域,CUDA 曾是无可替代的 "武林秘籍"—— 掌握它,就意味着手握 GPU 加速计算的钥匙。但 2025 年末,英伟达用 CUDA Toolkit 13.1 掀起了一场颠覆性变革,Tile 编程模型横空出世,让 GPU 编程从专业开发者的 "专属特权",变成了普通开发者触手可及的工具,堪称自 2006 年 CUDA 诞生以来最彻底的范式升级。
然而,“全能布局”的背后,潜藏着业务重心取舍的难题。9999元的定价策略,也凸显出芯片厂商跨界进入终端领域的生态位风险。这种看似“战线过长”的布局,实则折射出国产GPU厂商在国际霸权生态下的集体困境。
其核心逻辑简单而直接:通过自动化移植工具,将原本绑定在国际主流平台上的C++源代码,转化为MUSA架构的C++源代码,让开发者以最小成本将国际主流GPU平台应用移植至MUSA GPU,最终运行在全功能GPU上。
现在,到了 2025 年, FlashAttention-4 准时到来,增加了对 Blackwell GPU 的原生支持——之前,想要在 Blackwell 上跑 FlashAttention,如果直接用开源仓库,常常会遇到编译错误、kernel ...
12月20日,摩尔线程首届“MUSA开发者大会”的舞台,几乎被一连串充满东方意蕴的命名所占据:全新全功能GPU架构“花港”、AI训推一体芯片“华山”、图形渲染芯片“庐山”、算力集群“夸娥万卡”,以及指向未来的MTX中间语言。
硅谷人工智能公司Nexa AI发布端侧AI部署新思路,安卓,端侧,sdk,工具包,nexa,python ...
NVIDIA近日宣布推出CUDA 13.1版本,这一更新被官方誉为自2006年CUDA平台问世以来最具突破性的升级。其核心亮点在于引入了名为CUDA Tile的全新编程模型,将GPU编程的抽象层级提升至全新高度,为开发者开辟了更高效的并行计算路径。