DeepSeek 的成功秘诀它如何打破中国科技模式JORDAN SCHNEIDER 2025年1月30日特邀文章作者:JS Tan,MIT国际发展项目博士候选人,研究美国和中国创新的政治经济学,重点关注云计算他 之前是一名软件工程师,在substack 上写作截至2024年12月,DeepSeek 还相对默默无闻然后,它的基础模型DeepSeek V3超越了领先的开源模型,引爆了互联网在比西方实验室使用更少算力的情况下做到这一点并非易事他们的突破引发了两个关键问题:1.DeepSeek 是如何在投入了更多资金和人力来构建前沿模型的中国AI巨头中脱颖而出的?2.DeepSeek 的成功对中国更广泛的科技创新模式说明了什么?DeepSeek 的成功不仅仅是技术创新的产物,也深深植根于其独特的劳动关系处理方式中国科技公司以其繁重的 工作时间表、严格的等级制度和无情的内部竞争而闻名相比之下,DeepSeek 的扁平化管理结构注重赋予员工自 主权并创造协作环境DeepSeek 很难说是中国创新体系的产物该公司既不是国家主导的项目,也不是中国Al产业政策的直接受益者 相反,它是由一位前对冲基金经理自筹资金创立,从中国科技版图的边缘崛起。
虽然DeepSeek 看起来似乎证明中 国在Al未来已经站稳了脚跟,但现在就说DeepSeek 的成功验证了中国的整个创新体系还为时过早DeepSeek 如何打破了令人疲惫的996模式要理解为什么DeepSeek 的劳动关系处理方式如此独特,我们必须首先了解中国科技行业的常态也许中国科技行业最显著的特点是其长期实行的"996工作制"——早上9点到晚上9点, 一周工作六天这种职场 文化出现于2000年代中期中国数字经济崛起时期,并在随后的高度竞争年代中得到巩固员工被严格管控,需要 遵守严格的报告要求(通常需要提交周报甚至日报),并要求在办公室打卡上下班,以防止他们从雇主那里"偷时 间"雇主设定苛刻的关键绩效指标 (KPls), 并实行"末位淘汰制",这是一种将员工相互排名的绩效管理系统自2010年代中期以来,这些令人疲惫的工作时间和严厉的管理制度成为中国科技行业的标配长时间工作被认为 是追赶美国的基本要求,而行业的惩罚性管理制度被视为从员工身上榨取最大价值的必要手段确实,在中国数字增长年代,速度和快速迭代能力至关重要,当时公司都专注于激进的用户增长和市场扩张主 要目标是快速持续推出新功能和产品,以超越竞争对手并抢占市场份额。
这种对扩张的无情追求需要一个运转如 机器般的劳动力因此,员工被视为机器中的齿轮而不是创新者,每个人都执行严格定义的角色,为公司的整体 增长目标做贡献这种劳动关系可以在拼多多身上看到,这是阿里巴巴电商统治地位的一个崛起的挑战者该公司因要求更极端版 本的996工作文化而臭名昭著,有报道称员工工作时间更长,有时每月高达380小时管理层使用数字监控工具——包括位置追踪系统——来衡量员工生产力甚至上厕所时间也受到审查,员工报告说,长时间离开可能会触 发纪律处分那些未能达到绩效基准的人可能面临降职、失去奖金,甚至被解雇的风险,导致了一种恐惧文化和 无休止的相互竞争压力然而,自2010年代后期以来,中国的互联网用户增长已经趋于平缓,关键数字服务——如外卖配送、电子商务、 社交媒体和游戏——已达到饱和这些发展使得这种模式的有效性受到压力但是,大多数科技行业公司不是专注于开发新的增值数字创新,即使在公众对996工作制度的强烈反对之后,反而 加倍压榨劳动力,削减成本,依赖于价格竞争驱动的商业模式这种方法是有代价的:扼杀创造力,阻碍独立解 决问题的能力,最终妨碍中国参与长期创新型竞争的能力新的人才方式DeepSeek 对劳动关系的处理方式代表了对中国科技行业常规的根本性背离。
自2023年成立以来,公司摒弃了中 国科技行业标准的等级制度和重度控制的管理实践相反,它建立了一种以扁平化管理、学术式协作和年轻人才 自主权为中心的职场文化团队规模被刻意控制在约150名员工,管理角色被淡化研究小组基于特定目标而形成,没有固定的等级制度或严 格的角色团队成员专注于他们擅长的任务,自由协作,在遇到挑战时可以跨组咨询专家这种方法确保每个有 潜力的想法都能获得所需的资源来发展公司创始人梁文锋指出:"每个人都有独特的经历,带着自己的想法他 们不需要推动…当一个想法显示出潜力时,我们从上到下分配资源"为此,DeepSeek 积极避免传统科技工作场所 的形式主义没有周报,没有让员工相互对抗的内部竞争,最著名的是,没有KPI在人力资本方面:DeepSeek 将招聘重点放在年轻但具有高潜力的个人身上,而不是经验丰富的Al研究人员或高管许多DeepSeek 的研究人员,包括那些为突破性V3 模型做出贡献的人,都是刚从顶尖大学毕业,通常几乎没有 或完全没有prior工作经验 一位与DeepSeek 合作的猎头对中国媒体表示:"他们最多只看重3-5年的工作经验超 过8年的话,对他们来说就是'pass'。
"梁解释了偏好年轻人的原因:“我们需要对技术极度热情的人,而不是习惯 于用经验寻找答案的人真正的创新往往来自没有包袱的人"虽然其他中国科技公司也偏好年轻候选人,但那更多是因为他们没有家庭,可以工作更长时间,而不是为了他们 的横向思维能力公司高度重视教育背景和竞赛成就该公司以拒绝在编程或数学竞赛中获得金牌以外成绩的候选人而闻名除了 对开源的文化承诺外,DeepSeek 通过资金和算力来吸引人才,提供超过字节跳动的薪资,并承诺将算力分配给最 好的想法,而不是最有经验的研究人员这种招聘做法与像智谱这样的国有支持企业形成鲜明对比,后者的招聘策略是挖走像前微软和阿里巴巴资深人士 胡云华这样的高知名度行业资深人才,以增强其可信度并从现有企业进行技术转移[Jordan 评注:这种策略在中国半导体产业政策中效果显著从台积电和三星挖走有经验的人才对中芯国际、华为 和长鑫存储的成功至关重要但AI工程正处于一个独特时刻,年轻的横向思维往往胜过在pre-transformer 时代培 养的人才]DeepSeek 的成功突显了支撑技术发展的劳动关系对创新至关重要虽然许多中国科技巨头专注于从过度劳累的员 工中榨取最大产出,但DeepSeek 展示了支持性和赋权职场文化的变革潜力。
通过摆脱过去等级制度和控制驱动的 规范,公司释放了员工的创造潜力,使其能够取得超越资金更充足的竞争对手的成果中国创新格局中的异类与其劳动关系一样,DeepSeek 的资金和公司治理结构也同样非常规与许多同行不同,该公司并不依赖国家支持 的计划或科技巨头的投资相反,其前对冲基金创始人基本上为公司提供了资金支持公司起源于金融领域,从 高瓴 (High-Flyer) 这家中国对冲基金发展而来,该基金也是由梁文锋共同创立的 DeepSeek 本身是在2021年对 投机交易的监管打击后,高瓴转向Al而产生的由于这种设置, DeepSeek 的研究资金完全来自其对冲基金母公司 的研发预算这种独特的资金安排意味着公司可以独立于通常与国家或企业资金相关的约束运营从这个角度来 看 ,DeepSeek 是完全的异类让我们再次拿智谱这家中国Al创业公司来对比智谱不仅得到国家支持(来自北京中关村科学城创新发展这个国有 投资工具),还获得了包括腾讯和阿里巴巴在内的风投和中国科技巨头的大量资金支持——这两家公司都被中国 国务院指定为"国家Al队"的关键成员从这个角度来看,智谱代表了中国创新生态系统的主流:它与国家机构和行 业巨头都有密切联系。
相比之下, DeepSeek- 直处于边缘位置,开辟了一条不受主流审视常常伴随的制度期望和僵化框架影响的道路 其资金模式——由创始人自筹资金而不是依赖国家或企业支持——使公司能够以中国科技行业罕见的自主程度 运 营 技术转移vs本土创新这就引出了一个更大的问题:DeepSeek 的成功如何融入关于中国创新的持续辩论?我们又该如何更新我们对中国 创新的看法来解释DeepSeek?关于中国创新的辩论经常在两个截然相反的观点之间摇摆:中国注定失败vs 中国是下一个技术超级大国在我看 来,这种分歧源于对中国增长源泉的根本分歧——它是依赖于从发达经济体转移技术,还是依靠其本土创新能力 蓬勃发展那些认为中国的成功依赖于获取外国技术的人会认为,在当今分裂的、民族主义的经济环境下(特别是在愿意打 断全球价值链的特朗普政府下),中国面临着被切断关键现代技术的存在性风险从这个角度来看,与西方的隔 离将对该国的创新能力造成毁灭性打击另一方面,那些相信中国增长源于该国培养本土能力的人会认为,美国的技术禁令、关税和其他障碍是中国增长 的加速器,而不是障碍在这种观点看来,这些限制迫使中国企业创新、升级和开发本土技术解决方案,最终加 强中国的自力更生和长期竞争力。
到目前为止,这场辩论主要在先进制造业领域展开,从太阳能光伏到电池,最近还包括电动汽车在早期阶段——从特朗普第一任期的美中贸易战开始——技术转移的观点占主导地位:普遍的理论认为,中国企业首先需要 从西方获取基础技术,利用这些技术诀窍来扩大生产规模并在全球竞争中胜出因此,最初对中国企业施加的限制不出意外地被视为对中国发展轨迹的重大打击然而,中国在太阳能光伏、电池和电动汽车生产领域的主导地 位已经将叙事转向了本土创新的观点,现在本地研发和本土技术进步被视为中国竞争力的主要驱动力说到中国的科技行业,其成功被描述为技术转移而非本土创新的结果部分原因是Al高度技术性,需要完全不同类 型的投入:人力资本,这是中国历来较弱且因此依赖外国网络来弥补不足的领域像MIT教授黄亚生这样的学者将 中国科技行业的崛起归功于其与其他国家的诸多合作甚至中国的Al专家也认为人才是追赶的主要瓶颈确实,中国2000年代后的ICT行业建立在海外技术知识的基础之上许多中国早期科技创始人要么在美国接受教育,要么在美国度过了相当长的时间中国科技公司优先考虑有海外经验的员工,特别是那些在美国科技公司工作过的人在生成式Al时代,这种趋势只是加速:阿里巴巴、字节跳动和腾讯都在硅谷设立研发办公室,以增加他 们获取美国人才的机会。
这种对国际网络的依赖在生成式AI时代尤为明显,中国科技巨头落后于西方竞争对手,并 依赖外国人才来追赶DeepSeek 是例外还是新规则?这就是DeepSeek 与长期定义中国科技行业的传统技术转移模式的分歧之处 DeepSeek 不是依赖外国培训的专家 和国际研发网络,而是完全使用本地人才梁本人也从未在中国大陆以外学习或工作过 DeepSeek 的故事表明, 中国一直具有推动大语言模型前沿发展的本土能力,只是需要正确的组织结构来茁壮成长就像中国在太阳能制 造、电池和电动汽车领域的进步一样,DeepSeek 象征着科技/Al领域的关键转折点:中国不再仅仅是在追赶,而 是现在正在与西方领先创新者平等竞争虽然我希望"技术转移vs本土创新"的视角有助于思考中国的创新体系,但我必须承认这在某种程度上是一个虚假的 二分法正如发展经济学家会提醒我们的,所有技术必须首先转移给后来者并被其吸收;只有这样,他们才能创 新并创造自己的突破因此,技术转移和本土创新并不是互相排斥的——它们是同一个连续过程的一部分首先,技术必须转移给后来者并被其吸收;只有这样,他们才能创新并创造自己的突破如果我们要说中国具有开发前沿AI模型的本土能力,那么中国的创新模式必须能够复制DeepSeek 成功的条件。
但 这不太可能:DeepS。