绕开英伟达护城河CUDA!消息称DeepSeek准备适配国产GPU

内容摘要科技媒体报道,DeepSeek绕过了英伟达的CUDA技术,为研发大模型开辟了新途径,引起了业内巨头的关注。北京航空航天大学的黄雷副教授解释说,绕过CUDA意味着DeepSeek能够直接操作GPU驱动函数,实现更精细化的操作,例如通过使用PT

科技媒体报道,DeepSeek绕过了英伟达的CUDA技术,为研发大模型开辟了新途径,引起了业内巨头的关注。

北京航空航天大学的黄雷副教授解释说,绕过CUDA意味着DeepSeek能够直接操作GPU驱动函数,实现更精细化的操作,例如通过使用PTX(并行线程执行)来提升多节点通信效率。

这种优化显著提高了训练速度。假设竞争对手需要训练模型十天,而DeepSeek只需五天。这意味着DeepSeek可以在相同时间内为模型提供更多数据,从而间接提升模型性能。

据悉,DeepSeek内部拥有精通PTX语言的开发者。如果未来DeepSeek使用国产GPU,其在硬件适配方面将更加得心应手。通过了解硬件驱动提供的基本函数接口,DeepSeek可以参照英伟达GPU的编程接口编写相关代码,从而让大模型更轻松地适配国产硬件。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1