中新社北京2月6日电 (记者 夏宾)乙巳蛇年,中国大模型密集“上新”,引发各方关注。
一边是阿里云旗下大模型全新版本升级发布。1月29日凌晨,阿里云通义团队发布的Qwen2.5-Max,该模型是阿里云通义团队对MoE(混合专家模式)模型的最新探索成果,预训练数据超过20万亿tokens。该新模型展现强劲的综合性能,在多项公开主流模型评测基准上录得高分。
另一边是DeepSeek(深度求索)大模型迎来大量新平台的接入上架。2月5日,华为表示,DeepSeek系列新模型正式上线昇腾社区。
此前,国家超算互联网平台也已上线DeepSeek系列模型。用户目前也可在百度智能云、腾讯云、360数字安全等平台上调用DeepSeek模型。
版权声明 本文仅代表作者观点,不代表本站立场。
如遇本文系为网络转载到本站发表,图片或文章有版权问题的请联系客服确认后会立即删除文章。 如遇本文系作者授权本站发表,未经许可,不得转载。 |