文章

How China’s LLM “Open-Source Boom” Masks a Historical Lag

How China’s LLM “Open-Source Boom” Masks a Historical Lag

DeepSeek,Qwen,GLM,Kimi是开源最强的四个模型,全是中国,没有一个是美国的。中国这些大模型公司是远远被低估而不是高估。最主要的原因是市场不同,融资环境不同。这些公司如果在美国,就是第二个OpenAI。

这句话在当下极具煽动性,尤其是在 Llama 4 崩盘、Mark Zuckerberg 问责 Yann LeCun 和田渊栋、GLM-4.7 与 Kimi k2.5 接连发布、OpenAI 被不断指责为 ClosedAI 的 2026 年初,这种论调似乎成了公理。

然而,我却想说:中国模型确实因为地缘与市场因素在商业估值上被低估,但恰恰又因为“开源”这一标签,在技术统治力上被高估了。 简单的地理置换无法复制 OpenAI,因为历史的奇点无法重演。

一、 开源的虚假繁荣与情绪红利

中国开源模型的崛起,首先是一场情绪上的成功。

DeepSeek V3 和 R1 的成功,首先在于它们挑起了以中国人为首、世界开发者加入的对 OpenAI 闭源霸权的不满。这种逆反者的叙事红利,掩盖了技术和迭代速度上的落后,而这种落后甚至在随着时间推移慢慢拉大。GLM 和 Kimi 敏锐地捕捉到了这种趋势,先后推出了 GLM-4.x 系列和 Kimi k2。

但这带来了实质的繁荣吗?Kimi k2 作为第一个开源的 1T 模型,在消费级平台上根本跑不起来,反而一些企业可以通过它的本地部署,省下原本该支付给 kimi 的订阅费用;GLM 的后续版本更是陷入了“闭转开容易,开转闭难”的路径依赖。这种开源更像是一种 “防御性炫技”——借开源的名声赚取支持,而非真正滋养了下游生态。在 Llama 4 倒塌的真空期,唯一能真正做到接力的只有坚持全尺寸开源的 qwen 家族。这种策略让中国模型显得比实际上更强,但并没有解决算力受限下智力天花板的问题。

二、 头部玩家的收敛:双寡头与基础设施

如果我们剥离掉宣发噪音,中国 LLM 的头部格局正在不可避免地收敛。

  1. 掉队的 GLM(智谱):浮躁的资本博弈 我对 GLM 持极度悲观态度,不光是因为之前在尊贵的 THU KEG 体验不算很好,也因为我真的试用过它们的一些产品。作为港股上市公司,资本化跑赢了工程化。具体表现为产品体验的崩坏——发给它的文件连上下文都理不清,推理模式开启后甚至出现 </think> token 后不输出任何内容的“交白卷”现象。 更致命的是其商业模式:在海外顶着汇率赔本售卖 Coding Plan。这本质上是用现金流换程序员的数据,试图以此训练迭代。但在国内外各路好手的夹击下,这种由二流数据喂养的模型很难跑赢时间。在资金链断裂或技术掉队之间,它面临的是生存危机。另一条生存路径是借着清华的名声多接来自政府国企的业务单,这显然不算什么健康的发展方式。

  2. 守成的 Qwen(阿里):大厂的基座宿命 Qwen 选择了极其聪明的策略:全尺寸开源。这让它在腰部以下的业界和整个学界赚足了好评,成为了一种类似 Android 的基础设施。 但阿里的大公司病是其阿喀琉斯之踵。尽管 Junyang Lin 等技术高管有心,但权力结构限制了激进创新的可能。Qwen 用战术上的勤奋(覆盖所有尺寸)掩盖了模型智力上的硬缺陷。只要能解决智力问题,Qwen 就能赢,但解决智力问题恰恰需要小团队的反共识突围,这在阿里体系内极难实现。

  3. 真正的双雄:DeepSeek 与 Kimi 未来的前沿开源格局将收敛于 DeepSeek 和 Kimi。

    DeepSeek 是纯粹的技术控。梁文峰背靠幻方资金,招募极高质量的人才,专注深耕数学、代码等“硬智力”项目,对多模态不感兴趣。他们走的是“不鸣则已,一鸣惊人”的路线,负责指明技术方向(如 R1 的强化学习路线)。

    Kimi (Moonshot) 则是最懂技术的产品经理。杨植麟作为全中国最懂 LLM 的人之一直接执掌公司全体,再加上苏剑林等优秀科学家的辅助,让这家公司拥有极强的技术消化能力。Kimi 的策略是将 DeepSeek 指明的方向“吃干抹净”,用一年的时间将产品体验优化到极致。 这两家公司,一个像 Research Lab,一个像 Product Company,代表了中国大模型的最高水平。

三、 为什么它们成不了“第二个 OpenAI”?

回到最初的问题:如果把 DeepSeek 或 Kimi 搬到硅谷,它们会是 OpenAI 吗? 不会。因为 OpenAI 的诞生不是地理位置的产物,而是历史概率的奇迹。

世界就是充满了巧合: Ilya Sutskever 觉得需要一个 AlexNet,而 Alex Krizhevsky 做到了;他们恰好是 Hinton 的学生,在前深度学习时代的寒冬里花着最后一笔 funding。从此 Ilya 坚持 Scaling Law,将这种思想带到了 OpenAI,并在 ChatGPT 上得到首次足够规模的探索。与此同时,唐杰(GLM)还在坚持知识图谱+GNN 的雕花工艺;杨植麟还在 CMU 读博;梁文峰刚刚准备押注 AI,忙着组建 DeepSeek,但他们还没有产品,比起当时已经在 RL 上做出足够多惊艳工作的 OpenAI 又少了吸引力。

这不是任何单一的置换能实现的。LLM 时代发轫自疫情前的繁荣平和,它是 “最后一个有 funding 花的实验室,恰好遇到这些英雄,和恰好遇到英雄的世界” 共同产生的化学反应。

OpenAI 刚刚好做上了先知,它无中生有地定义了道路。 DeepSeek 和 Kimi 是极致的工匠,它们在先知指明的道路上,走得比谁都快、比谁都省、比谁都稳。

中国大模型公司确实被低估了,但它们被低估的是在恶劣环境下生存与追赶的商业韧性,而不是定义人类科技未来的能力。

本文由作者按照 CC BY 4.0 进行授权