中国大模型行业迎来一笔标志性融资。

据The Information援引知情人士报道,DeepSeek近期已完成成立以来首轮外部融资,募资总额超过500亿元人民币,约合74亿美元;融资后估值超过500亿美元,约合人民币3380亿元。这可能是中国AI行业迄今规模最大的单轮融资。

但这轮融资真正值得关注的,不只是金额,而是以下三个问题:DeepSeek以什么方式融资?为什么一个长期强调“不融资”的公司最终走向资本?这轮融资会如何改变中国大模型格局?





资本入场前,梁文锋先“立规矩”

据报道,本轮融资主要出资方包括:DeepSeek创始人兼CEO梁文锋个人出资200亿元,是最大出资方;腾讯出资100亿元;宁德时代出资50亿元;京东、网易、IDG资本各出资30亿元;国家人工智能产业投资基金出资10亿元。

投资方组合颇具代表性,腾讯、京东、网易对应互联网、云、内容、游戏和企业服务场景;宁德时代代表制造业、新能源和能源基础设施;IDG是财务投资人;国家人工智能产业投资基金则带有战略产业资本色彩。

但更特殊的是交易结构。

据披露,除国家人工智能产业投资基金外,其他投资者并不直接投资DeepSeek主体,而是将资金注入由梁文锋管理的有限合伙企业。外部投资方不享有DeepSeek投票权,但可获得优先财务信息和未来融资优先投资权。所有投资者股权设有五年锁定期,期间不得转让。梁文锋团队还要求穿透核查出资基金背后LP的真实身份。

唯一例外是国家人工智能产业投资基金。该基金直接投资DeepSeek,不受锁定期限制,并享有公司投票权。

这是一套非常反常规的融资安排。通常,高估值创业公司融资时,投资人会要求董事席位、投票权、退出安排和保护性条款。但DeepSeek此轮融资更像是“选择性开放”,资本可以进来,但不能干预路线;可以分享成长收益,但不能短期套利;可以成为股东,但不能改变控制权结构。

梁文锋本人出资200亿元,也是用真金白银告诉外界,DeepSeek需要钱,但不准备把公司方向盘交出去。

这延续了DeepSeek一贯的气质。成立以来,DeepSeek长期依靠幻方量化的自有资金支持,不融资、不路演、不急于商业化,更像一家研究型实验室。R1模型爆火后,外界普遍认为,它之所以能做出高性价比模型,部分原因正是没有外部资本压力。

现在,梁文锋打开了资本之门,但同时也用有限合伙架构、无投票权设计、五年锁定期和LP穿透核查,把资本约束在一个边界内。



DeepSeek为什么这会融资?

DeepSeek融资,并不意味着它简单地“缺钱”。更准确地说,是公司发展阶段变了。

过去,DeepSeek靠算法创新和工程效率,在相对低成本条件下做出全球有竞争力的开源模型。但当它进入前沿模型长期竞争区,面对的就不再是单次技术突破,而是持续训练、持续推理、持续留人、持续商业化。

第一,是算力账。

大模型竞争越往后,算力越像基础设施,而不是一次性采购。训练需要大规模GPU集群、网络、存储、冷却和运维;模型被广泛调用后,推理成本也会持续攀升。

近期DeepSeek招聘IDC设计规划工程师、数据中心高级运维工程师、高级交付经理等岗位,表明这家公司可能不再满足于租用算力,而是要更深地介入智算中心建设和运维。对于前沿模型公司来说,自建或深度参与算力基础设施,本质上是为了控制成本曲线和迭代节奏。

第二,是人才账。

DeepSeek过去能吸引顶尖年轻研究员,依靠的是技术理想、自由氛围和前沿问题。但在AI人才争夺进入白热化后,这些还不够。

据报道,DeepSeek部分核心研究人员已被字节、腾讯等大厂吸纳,行业对顶尖模型人才的薪酬报价已达到数千万元甚至更高。对DeepSeek来说,如果不融资、不定价、不建立更成熟的股权和期权激励,就很难长期留住核心人才。

融资的重要意义之一,是给人才激励建立一个可计算、可兑现的价值锚。

第三,是商业化账。

DeepSeek此前商业化相对克制,主要收入来自API调用。但模型能力本身不会自动变成收入。企业客户真正付费的,是稳定性、安全性、私有化部署、工具链集成、行业know-how和持续服务。

近期DeepSeek开始招聘模型策略产品经理、Agent相关产品与研发岗位,并被曝推进Code Harness等开发者工具方向。这意味着它正在从基础模型供应商,走向“模型+工具+智能体+企业交付”的商业化阶段。

腾讯、京东、网易、宁德时代等产业资本的进入,也不只是给钱。它们可能提供云资源、应用场景、产业客户和生态入口。

所以,DeepSeek融资的本质,是从“研究驱动的模型实验室”转向“研究驱动的平台型AI公司”。



这500亿弹药,将彻底改写大模型牌局

这轮融资后,DeepSeek最直接的变化是弹药充足,但更深层的影响,是中国大模型竞争逻辑将被重写。

首先,头部集中度会进一步提高。

500亿元融资、超过500亿美元估值,把DeepSeek推入中国AI企业第一梯队。未来通用大模型竞争不再只是模型参数和榜单排名,而是持续训练能力、低成本推理能力、算力基建、人才密度、产品化、行业场景和生态构建等综合能力。

这会抬高通用基础模型赛道的入场门槛。中小模型公司将更难与头部玩家正面竞争,未来更可能转向垂直行业、应用层、工具层或企业服务。

其次,大厂与AI创业公司的关系会被重新定义。

DeepSeek引入腾讯、京东、网易、宁德时代等产业资本,但并未让它们获得投票权,也避免了单一大厂主导。这说明DeepSeek希望获得大厂资源,但不成为任何一家大厂的附庸。

通过多方产业资本获得场景和生态协同,同时用治理结构维持技术路线独立,DeepSeek和它背后的梁文锋当真是“深藏功与名”。

第三,行业估值逻辑会被DeepSeek重新定价。

DeepSeek此前多次以低价API冲击市场。它证明了一件事:模型能力提升不一定意味着涨价,也可能意味着更大幅度降价。

这对其他大模型公司的商业预期影响很大。资本市场原本期待部分模型公司通过调用量增长和价格提升实现“量价齐升”,但DeepSeek的低价策略会压缩行业提价空间,迫使同行从“讲模型故事”转向真正证明收入、客户留存和利润效率。

如果DeepSeek融资后继续坚持开源和普惠路线,它的商业化未必会先抢走谁的客户,但很可能先压低整个行业的估值泡沫。

第四,国产算力和开源生态将获得更强牵引。

DeepSeek一直是中国开源大模型路线的重要代表。融资后,如果它继续推动模型在国产算力上的训练、推理和工程适配,将对国产AI芯片、智算中心、开源框架和应用生态产生带动作用。

宁德时代入股也值得关注。AI竞争越往后,能源、电力、储能和数据中心能效越重要。未来大模型公司竞争的底层变量,可能不仅是算法和芯片,还包括电力成本与能源调度能力。



梁文锋变了吗?

表面看,梁文锋变了。DeepSeek从不融资走向融资,从实验室气质走向基建、产品和商业化。

但从交易结构看,他又没有变。他依然通过个人大额出资、有限合伙架构、无投票权安排、五年锁定期和LP核查,尽可能隔离短期资本对公司路线的干扰。

因此,这轮融资不是梁文锋放弃理想主义,而是为理想主义寻找更坚硬的外壳。

真正的考验才刚开始。超过500亿美元估值意味着DeepSeek不能只证明自己会做模型,还要证明能够形成稳定收入和可持续商业模式;但过度商业化又可能稀释开源、低价、技术理想主义和独立性,这些宝贵资产。

DeepSeek要走的路,是在开源普惠与商业闭环之间找到平衡。

如果它能做到,中国大模型行业将不只是多一家高估值AI公司,而是多出一种新的AI发展范式:以开源形成生态,以低价扩大普及,以基础设施降低成本,以产业资本支持长期研发,同时由创始团队牢牢掌握技术路线。

500亿元融资只是表层数字,真正重要的是,它标志着中国大模型竞争进入了一个既比拼技术领先性,又强调长期组织能力的全新阶段。