科技媒体报道,DeepSeek绕过了英伟达的CUDA技术,为研发大模型开辟了新途径,引起了业内巨头的关注。
北京航空航天大学的黄雷副教授解释说,绕过CUDA意味着DeepSeek能够直接操作GPU驱动函数,实现更精细化的操作,例如通过使用PTX(并行线程执行)来提升多节点通信效率。
这种优化显著提高了训练速度。假设竞争对手需要训练模型十天,而DeepSeek只需五天。这意味着DeepSeek可以在相同时间内为模型提供更多数据,从而间接提升模型性能。
据悉,DeepSeek内部拥有精通PTX语言的开发者。如果未来DeepSeek使用国产GPU,其在硬件适配方面将更加得心应手。通过了解硬件驱动提供的基本函数接口,DeepSeek可以参照英伟达GPU的编程接口编写相关代码,从而让大模型更轻松地适配国产硬件。
0 条