技术博客

Cognition AI开源新动作:Kevin-32B助力CUDA编程突破

本周,Cognition AI开源了名为Kevin-32B的大模型,该模型基于强化学习技术开发,专注于辅助编写CUDA内核代码。这一工具的推出,为那些在CUDA编程方面遇到困难的开发者提供了有力支持,有望降低相关技术门槛,推动AI与高性能计算领域的进一步融合与发展。

Cognition AIKevin-32B开源模型CUDA编程强化学习
2025-05-07
Kevin-32B:开源工具的突破与创新

Devin公司推出了一款名为Kevin的开源工具,专为解决CUDA编程难题而设计。该工具的核心版本Kevin-32B基于QwQ-32B模型开发,并通过在KernelBench数据集上的多轮强化学习训练,采用GRPO算法进行优化,最终实现了超越o3和o4-mini的卓越推理性能。这一成果为CUDA编程用户提供了更高效、易用的解决方案。

开源工具CUDA编程Kevin-32BGRPO算法推理性能
2025-05-07
深入浅出:GPU调度策略与CUDA运行机制解析

本文旨在探讨GPU的调度策略架构与CUDA运行机制。尽管GPU技术广为人知,但其底层架构和硬件层调度策略却鲜为人知,这主要归因于NVIDIA GPU生态系统的闭源特性。作者在过去半年中参与了GPU相关项目,并深入研究了GPU的相关知识。本文将从CUDA编程模型、GPU底层硬件架构以及硬件层调度策略三个层面进行详细介绍,以期激发读者对GPU更深入的探索和学习。

GPU调度CUDA编程硬件架构底层技术NVIDIA
2024-11-06
深入浅出CUDA编程:从基础到优化

本文旨在介绍CUDA®,一种由NVIDIA公司开发的用于图形处理单元(GPU)的并行计算平台及编程模型。通过利用GPU的强大并行处理能力,CUDA能够极大地加速计算密集型任务的执行效率。文中提供了多个代码示例,以帮助读者更好地理解和掌握CUDA编程技巧,同时探讨了程序优化的方法。

CUDA编程NVIDIA GPU并行计算代码示例程序优化
2024-10-11