How China’s LLM “Open-Source Boom” Masks a Historical Lag

发表于 2026/01/29

作者 siluy

次浏览 9 分钟阅读

DeepSeek，Qwen，GLM，Kimi是开源最强的四个模型，全是中国，没有一个是美国的。中国这些大模型公司是远远被低估而不是高估。最主要的原因是市场不同，融资环境不同。这些公司如果在美国，就是第二个OpenAI。

这句话在当下极具煽动性，尤其是在 Llama 4 崩盘、Mark Zuckerberg 问责 Yann LeCun 和田渊栋、GLM-4.7 与 Kimi k2.5 接连发布、OpenAI 被不断指责为 ClosedAI 的 2026 年初，这种论调似乎成了公理。

然而，我却想说：中国模型确实因为地缘与市场因素在商业估值上被低估，但恰恰又因为“开源”这一标签，在技术统治力上被高估了。简单的地理置换无法复制 OpenAI，因为历史的奇点无法重演。

一、开源的虚假繁荣与情绪红利

中国开源模型的崛起，首先是一场情绪上的成功。

DeepSeek V3 和 R1 的成功，首先在于它们挑起了以中国人为首、世界开发者加入的对 OpenAI 闭源霸权的不满。这种逆反者的叙事红利，掩盖了技术和迭代速度上的落后，而这种落后甚至在随着时间推移慢慢拉大。GLM 和 Kimi 敏锐地捕捉到了这种趋势，先后推出了 GLM-4.x 系列和 Kimi k2。

但这带来了实质的繁荣吗？Kimi k2 作为第一个开源的 1T 模型，在消费级平台上根本跑不起来，反而一些企业可以通过它的本地部署，省下原本该支付给 kimi 的订阅费用；GLM 的后续版本更是陷入了“闭转开容易，开转闭难”的路径依赖。这种开源更像是一种 “防御性炫技”——借开源的名声赚取支持，而非真正滋养了下游生态。在 Llama 4 倒塌的真空期，唯一能真正做到接力的只有坚持全尺寸开源的 qwen 家族。这种策略让中国模型显得比实际上更强，但并没有解决算力受限下智力天花板的问题。

二、头部玩家的收敛：双寡头与基础设施

如果我们剥离掉宣发噪音，中国 LLM 的头部格局正在不可避免地收敛。

掉队的 GLM（智谱）：浮躁的资本博弈我对 GLM 持极度悲观态度，不光是因为之前在尊贵的 THU KEG 体验不算很好，也因为我真的试用过它们的一些产品。作为港股上市公司，资本化跑赢了工程化。具体表现为产品体验的崩坏——发给它的文件连上下文都理不清，推理模式开启后甚至出现 </think> token 后不输出任何内容的“交白卷”现象。更致命的是其商业模式：在海外顶着汇率赔本售卖 Coding Plan。这本质上是用现金流换程序员的数据，试图以此训练迭代。但在国内外各路好手的夹击下，这种由二流数据喂养的模型很难跑赢时间。在资金链断裂或技术掉队之间，它面临的是生存危机。另一条生存路径是借着清华的名声多接来自政府国企的业务单，这显然不算什么健康的发展方式。
守成的 Qwen（阿里）：大厂的基座宿命 Qwen 选择了极其聪明的策略：全尺寸开源。这让它在腰部以下的业界和整个学界赚足了好评，成为了一种类似 Android 的基础设施。但阿里的大公司病是其阿喀琉斯之踵。尽管 Junyang Lin 等技术高管有心，但权力结构限制了激进创新的可能。Qwen 用战术上的勤奋（覆盖所有尺寸）掩盖了模型智力上的硬缺陷。只要能解决智力问题，Qwen 就能赢，但解决智力问题恰恰需要小团队的反共识突围，这在阿里体系内极难实现。
真正的双雄：DeepSeek 与 Kimi 未来的前沿开源格局将收敛于 DeepSeek 和 Kimi。
DeepSeek 是纯粹的技术控。梁文峰背靠幻方资金，招募极高质量的人才，专注深耕数学、代码等“硬智力”项目，对多模态不感兴趣。他们走的是“不鸣则已，一鸣惊人”的路线，负责指明技术方向（如 R1 的强化学习路线）。
Kimi (Moonshot) 则是最懂技术的产品经理。杨植麟作为全中国最懂 LLM 的人之一直接执掌公司全体，再加上苏剑林等优秀科学家的辅助，让这家公司拥有极强的技术消化能力。Kimi 的策略是将 DeepSeek 指明的方向“吃干抹净”，用一年的时间将产品体验优化到极致。这两家公司，一个像 Research Lab，一个像 Product Company，代表了中国大模型的最高水平。

三、为什么它们成不了“第二个 OpenAI”？

回到最初的问题：如果把 DeepSeek 或 Kimi 搬到硅谷，它们会是 OpenAI 吗？不会。因为 OpenAI 的诞生不是地理位置的产物，而是历史概率的奇迹。

世界就是充满了巧合： Ilya Sutskever 觉得需要一个 AlexNet，而 Alex Krizhevsky 做到了；他们恰好是 Hinton 的学生，在前深度学习时代的寒冬里花着最后一笔 funding。从此 Ilya 坚持 Scaling Law，将这种思想带到了 OpenAI，并在 ChatGPT 上得到首次足够规模的探索。与此同时，唐杰（GLM）还在坚持知识图谱+GNN 的雕花工艺；杨植麟还在 CMU 读博；梁文峰刚刚准备押注 AI，忙着组建 DeepSeek，但他们还没有产品，比起当时已经在 RL 上做出足够多惊艳工作的 OpenAI 又少了吸引力。

这不是任何单一的置换能实现的。LLM 时代发轫自疫情前的繁荣平和，它是 “最后一个有 funding 花的实验室，恰好遇到这些英雄，和恰好遇到英雄的世界” 共同产生的化学反应。

OpenAI 刚刚好做上了先知，它无中生有地定义了道路。 DeepSeek 和 Kimi 是极致的工匠，它们在先知指明的道路上，走得比谁都快、比谁都省、比谁都稳。

中国大模型公司确实被低估了，但它们被低估的是在恶劣环境下生存与追赶的商业韧性，而不是定义人类科技未来的能力。

随笔, 中文

中文随笔

本文由作者按照 CC BY 4.0 进行授权

一、 开源的虚假繁荣与情绪红利

二、 头部玩家的收敛：双寡头与基础设施

三、 为什么它们成不了“第二个 OpenAI”？

热门标签

一、开源的虚假繁荣与情绪红利

二、头部玩家的收敛：双寡头与基础设施

三、为什么它们成不了“第二个 OpenAI”？