OpenAI将重新开源?

OpenAI首席执行官Sam Altman在社交平台上发文,对下一个开源项目的方向征询公众意见:一种是“相当小但仍需在GPU上运行的o3-mini级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着OpenAI即将开源新的大模型。

本文引用地址:

上一次开源大语言模型,已经是2019年的事情了:11月6日,OpenAI正式发布了GPT-2最后一个部分的完整代码,其中包括含有15亿参数的最大版本。然而,自OpenAI于2022年年底推出ChatGPT以来,从GPT-3再到最新的OpenAI o3-mini都再也没有开源过。但OpenAI成立时表示是为了推动AI的安全性和有益发展,确保AI的发展能够被广泛共享,并且对全人类都是有益的。因此很多人调侃让OpenAI改名为“CloseAI”。

DeepSeek横空出世后,Sam Altman在被问及OpenAI是否会公开部分AI模型技术并展示更多系统工作原理的研究时,他表示公司内部正在讨论这种可能性,承认OpenAI此前在开源策略上可能“站在了历史的错误一边”,称正在讨论公开AI模型权重。不过他也指出,公司内部并非所有人都认同这一观点,而且这也不是当前的首要任务,最重要的是继续按研究规划推进工作。

DeepSeek为何能成为爆款?

DeepSeek日前发布的大模型DeepSeek-R1,各项性能与OpenAI的GPT-4o持平‌,仅用时两个月就完成了训练,同时过程中仅用了2000个英伟达H800 GPU,其他主流AI实验室通常需要部署的芯片数量估计超过10000个 —— 展现出算法创新和架构优化可能比算力更重要,对建立在海量计算资源独占之上的整体商业模式形成了威胁。值得注意的是,其大幅降低了AI计算成本,约为550万美元左右,相比之下OpenAI等公司的同类项目成本要高出非常多。暂且不论DeepSeek的说法是否准确,其取得的突破都突显了AI开发领域的动态变化。

DeepSeek-R1最大的优势还在于它是开源模型,其开源仓库采用标准化、宽松的MIT License,完全开源、不限制商用、无需申请。因此,理论上所有的小参数模型均能够直接利用R1蒸馏出的标签数据,来增强推理性能,通过更改底层代码来改变其工作方式。

DeepSeek最新发布的一篇技术论文,主要内容是提出一种名为NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力机制,核心是通过对硬件的友好与端到端训练,取得推理、训练速度和任务表现的综合平衡:让大模型在长上下文中兼具高效与高保真度。用DeepSeek-R1彻底揭开了OpenAI无论如何都想藏起来的算法秘密,使让所有开发者都能看到推理是如何发生的,让AI的“思考过程”成为透明,给出更多复制和超越o1的可能。

此外,DeepSeek-R1有望提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”加速迭代,促进AI技术在各个领域的应用和普及,这就是开源的力量。

再次拥抱开源生态

反观OpenAI在ChatGPT问世后,则选择使用闭源模型的基础上通过「API+订阅制」构建起强大的商业护城河,通过API形式提供AI服务,而不开放底层权重,防止竞品复制其技术。更重要的是OpenAI能够掌控用户交互数据,持续迭代GPT模型和ChatGPT,并维持市场领先地位。

就在短短几个月前,企业几乎只能依赖GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)等大模型厂商提供的封闭API,现在,DeepSeek几乎以一举之力扭转了市场的注意力。随着高效的开源技术兴起,部分开发者和客户可能会转向更具性价比的开源解决方案。面对这一挑战,OpenAI的战略可能会发生重大转变,反映了AI领导者如何在日益多极化的AI世界中平衡创新、安全和商业化之间的关系。

不仅仅是OpenAI,整个AI生态都在拥抱开源:百度宣布下一代文心大模型4.5系列将在六月底开源;昆仑万维宣布开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,以及基于视频基座模型的表情动作可控算法SkyReels-A1;刚刚发布Grok 3系列模型的马斯克旗下xAI也宣布上一代大模型Grok 2将照例在几个月后开源。

虽然闭源AI依然能赚到钱,但随着DeepSeek带来的冲击,市场已经开始倾向于开源大模型的路线。开源不仅让整个行业面临的壁垒大幅削减,也给所有开发者和企业带来了更多自由度 —— API 接入、云端调用、本地部署,甚至是基于不同需求和数据进行重新训练。这也是为什么我们会看到,所有厂商似乎都在接入DeepSeek。当然,出于营销目的的接入以及简单粗暴的接入方式,也是这种变化中不可避免的一个过程。

这场AI竞赛,已经远远超出了最初的语言模型之争,开源路径带来的变化正在撬动整个AI生态,在一定程度上意味着大模型迭代的范式转变,而一场AI产业的「开源革命」也已然开始。在封闭体系下,企业只能被动接受巨头定价,这种逻辑一度被认为是不可逆的,毕竟打造大模型的成本极高,只有确保收益最大化才能维持技术优势。但DeepSeek彻底改变了这种假设,未来的AI可能也不会是少数巨头的垄断,而是由大量参与者共同推进的技术体系。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1