Tomshardware:DeepSeek可能没有宣传那么神 没什么奇迹

   2025-02-03 1

快科技2月3日消息,近一周以来,DeepSeek不仅引发了美国硅谷的恐慌,也让很多原本不关心AI的人感受到了中国AI大模型的震撼。

不过,国外老牌硬件网站Tomshardware发文称,DeepSeek可能没有宣传的那么具有颠覆性,在AI领域不存在奇迹。

以下为文章节选(仅供参考,不代表本站观点):

中国初创公司DeepSeek最近因其先进的AI模型R1的计算资源使用量惊人地低,而成为科技界的焦点。

该公司声称DeepSeek的训练成本仅为600万美元以及2048个GPU,其最新的R1模型可以与Open AI的o1相媲美。

然而,行业分析公司SemiAnalysis报告称,DeepSeek背后的公司花费了16 亿美元的服务器成本,并拥有50,000 个NVIDIA Hopper GPU。 

报告称,DeepSeek运营着一个拥有约50,000个Hopper GPU的庞大计算基础设施。根据 SemiAnalysis 的数据,其中包括10,000个H800和10,000个H100,另外还购买了H20芯片。

这些资源分布在多个位置,用于AI训练、研究和财务建模等。SemiAnalysis的数据显示,该公司在服务器上的总资本投资约为16亿美元,估计运营成本为9.44亿美元。

DeepSeek 起源于High-Flyer(幻方),这是一家中国对冲基金,很早就采用了人工智能,并在GPU上投入了大量资金。

2023 年,High-Flyer成立了 DeepSeek,作为一家专注于人工智能的独立企业。与许多竞争对手不同,DeepSeek 仍是自筹资金,这使其在决策方面具有速度和灵活性。

DeepSeek的一个主要优势在于它能够运行自己的数据中心,而大多数其他AI初创公司则依赖外部云提供商。这种独立性允许其完全控制测试和AI模型优化。

此外,它能够快速迭代而不受外部瓶颈的影响,这使得DeepSeek与业内传统参与者相比效率极高。

根据SemiAnalysis的数据,DeepSeek只在中国境内招聘,注重员工的技能和解决问题的能力,而非资历。

DeepSeek面向北京大学、浙江大学等知名高校招聘人才,并提供极具竞争力的薪水。根据研究,DeepSeek的一些人工智能研究人员的薪酬超过130万美元(约合942.7万元人民币),超过了 Moonshot(月之暗面)等其他领先的中国人工智能公司的薪酬。

SemiAnalysis报告称,由于人才的涌入,DeepSeek率先推出了MLA等创新技术。DeepSeek 强调效率和算法改进,而不是蛮力扩展,重塑了人们对AI模型开发的期望。

出于多种原因,这也让大家相信,技术的快速进步可能会减少对高端GPU的需求,从而对NVIDIA等公司产生利空应影响。

最近有消息称,DeepSeek 仅花费600万美元训练其最新模型,但这个数字仅指总训练成本的一部分 不包括研究、模型改进、数据处理或整体基础设施费用。

事实上,自成立以来,DeepSeek在人工智能开发上花费了超过5亿美元。SemiAnalysis认为,与受官僚主义困扰的大型公司不同,DeepSeek 的精益结构使其能够积极推动人工智能创新。

DeepSeek的崛起凸显了一家资金雄厚的独立AI公司如何挑战行业领导者。但现实情况要复杂得多:SemiAnalysis 认为DeepSeek的成功建立在数十亿美元的战略投资、技术突破和有竞争力的员工队伍之上。

这意味着没有什么奇迹。正如埃隆 马斯克一年前指出的那样,如果你想在AI领域具有竞争力,你就必须每年投入数十亿美元。

Tomshardware:DeepSeek可能没有宣传那么神 没什么奇迹


特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。
举报 收藏 评论 0
相关行情
推荐行情
点击排行
浙ICP备19001410号-1