OpenAI将重新开源？

更新时间：2025-02-22 17:19:27 发布时间：2天前浏览：9404 评论：0

OpenAI首席执行官Sam Altman在社交平台上发文，对下一个开源项目的方向征询公众意见：一种是“相当小但仍需在GPU上运行的o3-mini级模型”，另一种则是“尽可能优化的手机大小模型”。这或许意味着OpenAI即将开源新的大模型。

本文引用地址：

上一次开源大语言模型，已经是2019年的事情了：11月6日，OpenAI正式发布了GPT-2最后一个部分的完整代码，其中包括含有15亿参数的最大版本。然而，自OpenAI于2022年年底推出ChatGPT以来，从GPT-3再到最新的OpenAI o3-mini都再也没有开源过。但OpenAI成立时表示是为了推动AI的安全性和有益发展，确保AI的发展能够被广泛共享，并且对全人类都是有益的。因此很多人调侃让OpenAI改名为“CloseAI”。

DeepSeek横空出世后，Sam Altman在被问及OpenAI是否会公开部分AI模型技术并展示更多系统工作原理的研究时，他表示公司内部正在讨论这种可能性，承认OpenAI此前在开源策略上可能“站在了历史的错误一边”，称正在讨论公开AI模型权重。不过他也指出，公司内部并非所有人都认同这一观点，而且这也不是当前的首要任务，最重要的是继续按研究规划推进工作。

DeepSeek为何能成为爆款？

DeepSeek日前发布的大模型DeepSeek-R1，各项性能与OpenAI的GPT-4o持平‌，仅用时两个月就完成了训练，同时过程中仅用了2000个英伟达H800 GPU，其他主流AI实验室通常需要部署的芯片数量估计超过10000个 —— 展现出算法创新和架构优化可能比算力更重要，对建立在海量计算资源独占之上的整体商业模式形成了威胁。值得注意的是，其大幅降低了AI计算成本，约为550万美元左右，相比之下OpenAI等公司的同类项目成本要高出非常多。暂且不论DeepSeek的说法是否准确，其取得的突破都突显了AI开发领域的动态变化。

DeepSeek-R1最大的优势还在于它是开源模型，其开源仓库采用标准化、宽松的MIT License，完全开源、不限制商用、无需申请。因此，理论上所有的小参数模型均能够直接利用R1蒸馏出的标签数据，来增强推理性能，通过更改底层代码来改变其工作方式。

DeepSeek最新发布的一篇技术论文，主要内容是提出一种名为NSA（Natively Sparse Attention，原生稀疏注意力）的新型注意力机制，核心是通过对硬件的友好与端到端训练，取得推理、训练速度和任务表现的综合平衡：让大模型在长上下文中兼具高效与高保真度。用DeepSeek-R1彻底揭开了OpenAI无论如何都想藏起来的算法秘密，使让所有开发者都能看到推理是如何发生的，让AI的“思考过程”成为透明，给出更多复制和超越o1的可能。

此外，DeepSeek-R1有望提振整个开源社区的共建氛围，使得更多开源模型能够“站在巨人肩膀上”加速迭代，促进AI技术在各个领域的应用和普及，这就是开源的力量。

再次拥抱开源生态

反观OpenAI在ChatGPT问世后，则选择使用闭源模型的基础上通过「API+订阅制」构建起强大的商业护城河，通过API形式提供AI服务，而不开放底层权重，防止竞品复制其技术。更重要的是OpenAI能够掌控用户交互数据，持续迭代GPT模型和ChatGPT，并维持市场领先地位。

就在短短几个月前，企业几乎只能依赖GPT（OpenAI）、Claude（Anthropic）和 Gemini（Google）等大模型厂商提供的封闭API，现在，DeepSeek几乎以一举之力扭转了市场的注意力。随着高效的开源技术兴起，部分开发者和客户可能会转向更具性价比的开源解决方案。面对这一挑战，OpenAI的战略可能会发生重大转变，反映了AI领导者如何在日益多极化的AI世界中平衡创新、安全和商业化之间的关系。

不仅仅是OpenAI，整个AI生态都在拥抱开源：百度宣布下一代文心大模型4.5系列将在六月底开源；昆仑万维宣布开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1，以及基于视频基座模型的表情动作可控算法SkyReels-A1；刚刚发布Grok 3系列模型的马斯克旗下xAI也宣布上一代大模型Grok 2将照例在几个月后开源。

虽然闭源AI依然能赚到钱，但随着DeepSeek带来的冲击，市场已经开始倾向于开源大模型的路线。开源不仅让整个行业面临的壁垒大幅削减，也给所有开发者和企业带来了更多自由度 —— API 接入、云端调用、本地部署，甚至是基于不同需求和数据进行重新训练。这也是为什么我们会看到，所有厂商似乎都在接入DeepSeek。当然，出于营销目的的接入以及简单粗暴的接入方式，也是这种变化中不可避免的一个过程。

这场AI竞赛，已经远远超出了最初的语言模型之争，开源路径带来的变化正在撬动整个AI生态，在一定程度上意味着大模型迭代的范式转变，而一场AI产业的「开源革命」也已然开始。在封闭体系下，企业只能被动接受巨头定价，这种逻辑一度被认为是不可逆的，毕竟打造大模型的成本极高，只有确保收益最大化才能维持技术优势。但DeepSeek彻底改变了这种假设，未来的AI可能也不会是少数巨头的垄断，而是由大量参与者共同推进的技术体系。

举报收藏打赏 评论 0