宏观研究

中国 AI 大厂,被 Deepseek 掀了牌桌之后

字号+ 作者:白头相守网 来源:财经专题 2025-05-25 07:55:41 我要评论(0)

当技术范式重构,强者也不得不重新起跑。作者:连然过去几个月,尤其是2025年一季度,国内大厂在AI大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少了许多。对比去年同期,大厂几乎是轮番上阵

当技术范式重构,强者也不得不重新起跑。

作者:连然

过去几个月,尤其是2025年一季度,国内大厂在AI大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少了许多。对比去年同期,大厂几乎是轮番上阵、接连发布新成果,而今年则低调了不少,声音变得谨慎,动作也更克制。

这种转变,多少跟DeepSeek-R1在春节期间的发布有关,这个模型以开源、低价、高性能的组合,打破了“大模型=高投入、高门槛”的行业共识,也撬动了模型产业的权力结构。

它不仅刷新了开发者对开源模型的认知,也动摇了此前被大厂视为护城河的“重资产”范式。一时间,硅谷科技股应声回调,千亿美元研发投入的必要性也被重新审视。

而在国内,这场“技术地震”最先震动的,其实正是那些原本被认为应该在AI战役中冲在最前的大厂们。一边是像 DeepSeek、Manus 这样的新玩家用“小而强”“快而灵”的策略不断迭代突破,另一边却是大厂在产品落地、组织架构、技术方向上的多次调整与迟疑。

新玩家冲击的,不只是模型性能或训练成本,更是许多建立在历史经验基础上的路径依赖——比如“只有闭环才有护城河”“只有高预算才能出好模型”“只有通用大一统才是正确方向”。

越来越多的事实正在指向同一个结论:在 AI 快速演进的浪潮中,任何僵化的范式认知,都可能成为创新的绊脚石。

今天的大厂,正在面临一次理念上的转向:不再追求“我的模型服务我的应用”的闭环逻辑,而是回到“用最合适的模型,构建最好的产品”这一产品主义原点。

一系列深层次的战略重构,正在中国互联网大厂里悄然发生。

1 Deepseek-R1出现前,大厂鏖战大模型赛道,各自押注不同

回头看 2023 年,国产大模型赛道迅速升温,几乎所有有技术储备或生态优势的公司都在投入资源,试图在百模大战中找到自己的突破口。

彼时,百度、字节、腾讯等大厂纷纷亮出自研模型,“自研闭环”几乎成为主流打法(阿里则探索开源较早),强调的是“模型要自主可控,生态要自给自足”,从底层模型到应用产品都要打通。

在这样的背景下,百度主打“模型+搜索”路径,字节力推豆包,阿里对通义千问团队进行拆分以优化资源配置,腾讯则相对谨慎地投入“混元”大模型,整体更强调“应用场景驱动”,小厂中也出现了面壁、智谱、百川、月之暗面等一批专注通用大模型训练的“AI 六小龙”,试图在技术路线或创新方向上突围。

图片来源:视觉中国

彼时大家的竞争逻辑还建立在几个假设之上:1)自研能力越强越有护城河;2)参数量和能力相关,性能靠堆大模型赢;3)需要构建一个“自我可控”的模型+应用闭环。

但这些共识在 DeepSeek-R1发布之后被彻底打破。2025 年 1 月 DeepSeek-R1 的亮相,被行业视为一个“临界点”事件——一方面,它以极低的成本训练出了对标 GPT-4 的能力,公开技术细节并放出权重;另一方面,它代表着一种更彻底的“开源范式”:不是简单开放一个模型,而是直接让下游开发者“拿来即用”,训练思路、数据比例、推理效率都一目了然。

这直接打在了原来那种“闭环型自研”的路线要害上。很多大厂花大钱训练的模型,在DeepSeek-R1 面前变得毫无优势——不是能力不行,而是“性价比不行”:你没法再说“自研比别人更强”,因为别人把过程全开了,而且你追上也要几个月;你也没法说“闭环护城河更高”,因为别人三两天就能基于 DeepSeek-R1 搭个 demo,甚至用它打磨出产品。

这种“开源即能力平权”的冲击,不只打到了大厂,也打乱了 AI 小龙们的节奏。以面壁、百川为代表的“小模型派”,原本还希望在训练效率和推理速度上做文章,现在发现DeepSeek直接掀了桌子,把效率和能力统统平衡好了,而且是白送的——这让“闭源商业化”变得更加困难。

行业由此进入了一段显著的“战略迷茫期”:

  • 大厂开始重新评估自研的价值:是否还值得烧钱去追一个很可能被开源赶超的模型?是否应该把精力转向“拼装模型能力+打造 AI 原生应用”的组合打法?

  • AI 小龙们则面临最直接的生存压力:原来讲闭源、讲技术栈的优势正在消失;大厂又开始加速从开源模型中“拿货”,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找“差异化垂直场景”。

  • 投资人也在重新审视项目价值:一个大模型初创公司如果没有特别的创新机制或生态合作资源,其估值逻辑就会受到挑战。

总之,DeepSeek 不是推出了一个强模型这么简单,它更像是一次“范式洗牌”:用极致透明和开源方式打破旧有路径依赖,把“自研大模型闭环”从主流选项变成了一个“代价极高”的冒险。这个时刻之后,谁能快速认清现实,找到新生态位,谁才有可能留在下一轮的牌桌上。

2 震荡之后,大厂摸索新方向

DeepSeek带来的冲击在持续发酵时,整个行业一开始是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但具体要怎么应对、往哪儿走,其实那时候没有明确答案。

但从2月下旬开始,情况慢慢变了。大厂开始陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调“应用先行”“超级App”的落地路线,重新回到了“AGI优先”的轨道上。

这轮转向有几个关键的变化。

第一个变化是目标清晰了。过去讲AI应用的时候,很多公司都停留在“做一个超级 App”的层面,比如搞一个AI助手、一个AI搜索或者AI办公工具。

但现在,在字节与阿里最新的对外表达中,都明确把“冲刺AGI”作为最核心的目标。

在2月的全员会上,字节CEO梁汝波曾表示:「智能水平是最重要的,要把提高智能本身当成最重要的目标,而不是某个产品的DAU。」

3 月 ,豆包大模型部门召开全员会,明确部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。

“Seed Edge”是字节豆包大模型团队在年初组建的AGI长期研究团队,鼓励探索更长周期的AGI研究课题,如推理能力、感知能力、软硬一体化等。

这个项目强调“宽松的研究环境”和“长周期考核”,为入选课题提供独立算力支持,体现了字节对AGI的长期布局。

Seed Edge的目标是探索AGI的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。

可以看出,字节正在为通向AGI的下一阶段做技术储备。

2025财年财报后的电话会上,阿里 CEO 吴泳铭首次明确提出AGI是阿里AI战略的核心目标,甚至用了“AI将影响全球50% GDP结构”这样激进的表述。

这也意味着,阿里正在从强调“云+模型”服务能力,逐步走向更高层次的通用智能探索。

第二个变化,是对“开源”和“模型选择”的态度发生了实质变化。过去讲模型、做应用时,往往强调“全链路自主可控”,什么都要自己来。但现在,尤其是腾讯和百度,看起来越来越强调实用主义导向:谁的模型能力强就接谁的模型,应用产品的目标是用户满意、场景落地,而不是一定要套用自家大模型。

这背后,其实是每家公司在重新厘清自己的生态位——它在AI时代扮演什么角色,它的核心竞争力到底在哪里。

阿里的反应看起来“稳”一些,或者可以说是延续之前的节奏。

因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问(Qwen)系列在海外和开源社区持续表现强劲,Qwen2.5-Max一度号称性能超越DeepSeek-V3,而4月底刚开源的Qwen3,不仅成本显著降低,性能更是反超DeepSeek-R1和OpenAI-o1,登上开源模型榜首。阿里的打法很明确:先用模型性能证明自己,再用开源吸引全球开发者,把生态“引进来”。

不过,阿里的路径也并非一帆风顺。过去一段时间,由于组织架构频繁调整,大模型和AI业务一度陷入“各自为战”的割裂状态。但随着2024年阿里云重新整合、AI团队在马云回归后重新聚拢,阿里开始回到“集中力量办大事”的主模式。阿里云的回暖也证明了整合效果:在最新一个季度重新恢复双位数增长,再次稳坐国内市场头把交椅。

可以说,相比强调C端产品或Agent体验的打法,阿里正在重新确认自己在AI时代的角色——不是冲在最前的应用先锋,而是一个全球级的模型平台和技术基础设施提供者。

百度的选择,是比较务实的。一方面它有自己的文心模型体系,但另一方面它也明白,真正能打动用户的,是像百度文库、百度网盘这样的具体应用能不能变得更智能。所以在实际落地中,百度强调“谁好用就用谁”,哪怕不是自家的模型也没关系,只要能让文库变得更好用,就可以接入。

这种态度其实是经历过一次反思的。之前极客公园就曾经了解到,2024年百度内部其实是为了推动模型在各应用场景落地,分散了大量精力,导致文心团队反而没能集中精力把模型本身推上一个更高的台阶。新的调整,就是不再强求“模型服务所有应用”,而是让每个业务线根据场景灵活选择,把用户体验拉起来才是第一位。

而关于开源闭源之争,此前作为大模型闭源路线的坚定支持者,李彦宏此前曾多次公开表示,"闭源才能保证技术可控性、才有商业模式,开源其实是一种智商税"。

李彦宏在Create2025百度AI开发者大会|图片来源:百度

直到今年2月,百度选择了顺应开源的大趋势,宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。

腾讯的路径更清晰,也更符合它一贯的产品哲学。无论是微信、QQ还是游戏体系,腾讯最核心的资源就是这些连接用户的高频产品。对它来说,自研大模型不是必须的,关键是能不能把AI能力快速嵌入到这些产品里,提升效率和体验。

所以,当DeepSeek-R1新模型出现之后,腾讯是第一时间接入的公司之一,没有太多顾虑。毕竟据晚点报道,腾讯董事局主席兼 CEO 马化腾跟一些 AI 团队说过,“要好好与外部合作,不要想着什么都自己做”,以及“要清醒地认识到实际情况,不要过高估计自己的能力。”

2月13日,腾讯率先官宣接入“满血版”DeepSeek-R1,并迅速在全平台展开推广攻势。从微信、小红书到B站、知乎,元宝产品的广告铺天盖地,引发了用户对腾讯AI助手的集中关注。与此同时,腾讯内部也紧急协调,加速推动微信与DeepSeek的融合。

「元宝」入驻微信|图片来源:极客公园

相应地,腾讯也在组织架构上进行了一系列调整。继腾讯元宝从 TEG(技术工程事业群)并入 CSIG(腾讯云与产业事业群)之后,QQ 浏览器、搜狗输入法、ima 等更多产品也陆续划归 CSIG,组成腾讯在大模型时代面向 C 端的新产品阵列。同时,这些产品原本隶属的团队和组织也将从 PCG(平台与内容事业群)整体调整至 CSIG,以更集中地推进 AI 战略下的产品布局与升级。

这一系列快速动作,其实体现了腾讯对“AI是能力,不是目的”的判断。更强的模型、更开放的生态,只要能赋能微信和游戏,那就应该立刻用起来。这一波,它反而成了最快适应变局的一家公司——甚至可以说,这次AI开放生态的发展节奏,刚好踩中了腾讯最擅长的能力嵌套逻辑。

字节跳动则是四家里最复杂、或许也可以说是最纠结的那个。它一方面拥有豆包大模型体系,另一方面又掌握了抖音、今日头条、番茄小说等超大规模应用场景。既想做AGI技术的引领者,又不愿放弃在应用层面的优势闭环。

但这就带来了两头要抓的压力——模型要领先,产品也要突出,生态既要自洽又要开放。在DeepSeek-R1爆火之后,字节一方面开始重申“AGI是核心目标”,加强对豆包的投入,也在开源方面更多动作;另一方面在应用层也出现了新的挑战:到底是坚持“豆包+字节应用”的闭环路线,还是打破内外壁垒,接入更强的外部模型去赛马?

据晚点报道,字节跳动最初对是否将DeepSeek接入旗下产品持观望态度,内部普遍认为“随时可以接入,不急”。然而,时机稍纵即逝,春节过后,字节开始紧急调动团队加班开发,加速整合DeepSeek。

目前看,字节的策略还在过渡期。一方面,它在对外表达中强调开源、强调开放生态价值;另一方面,在内部系统上,豆包仍然是很多应用场景的默认选择,只在少许应用上开放对DeepSeek模型的接入。但未来会不会像腾讯一样,开始在更广泛的层面接入第三方模型,或者在某些应用上放开“自家模型优先”的原则,现在还没有完全看清楚。

过去几个月是AI大厂们重新定位自己的生态角色、重新判断技术路径的关键窗口期。经历了DeepSeek-R1带来的“能力维度重构”之后,各家公司几乎都开始重新聚焦AGI这个长期目标,同时也在技术和生态层面更加现实与开放。

不过,即便目标一致,路径选择依然千差万别。这背后,是每家公司对自身优势的认知差异,也是它们对“AI时代应该怎么跑”的不同下注。

3 技术颠覆面前,没有永远的「历史赢家」

AI 行业不会因为某一个产品突然“杀出重围”而终结对抗,它注定是一场持续上演的生态重构游戏——生态位置、能力分工将反复洗牌,而每一次冲击,都会逼迫玩家重新思考“我是谁、我该怎么做”。

在 DeepSeek-R1 的冲击下,大厂开始重新审视自己与 AI 的关系。这场变化不会停止:在AI这个快速演进的技术浪潮中,任何人其实都没有资格背负历史包袱。

历史包袱,不只是落后的产线、沉重的组织、冗余的团队,更是一种路径依赖式的认知惯性。

过去几年,整个AI行业积累了太多“默认共识”:比如做大模型一定要砸上亿美金、做AI应用一定要追求闭环、只有To B业务才能形成收入闭环、AI不是消费品只能是工具型软件……这些“理性判断”在过去的技术范式下看似正确,但在新路径被打通之后,很多“理性”就变成了限制想象力的牢笼。

技术革命的残酷性就在于,它并不会给巨头太多“吃老本”的机会。AI 的快速迭代,正不断吞噬那些依赖过往成功经验的惯性组织。于是我们看到:百度转向开源,腾讯放下身段借势引流,字节加速重构算力体系……这些动作背后,藏着大厂对现实的一种「觉醒」:在 AI 的无限游戏中,唯一的生存法则,是保持战略弹性——既要摒弃对历史经验的盲目依赖,也要以开放姿态,拥抱技术普惠的新趋势。

旧范式困住了谁?

回顾国内过去两三年内大厂与头部创业公司的发展路径,几乎都踩在一套“经典剧本”上:

  • 先围绕一个目标设定OKR;

  • 再从模型能力、数据体系、应用矩阵做完整闭环;

  • 最终希望通过模型降本、产品增长、生态协同走通商业路径。

这个逻辑没错,但问题是它太像过去互联网时代的打法了——它默认“资源越多,路径越清晰”;但AI的突变恰恰是在路径模糊中爆发的。

比如,之前很多团队一边追求“闭环场景”,一边困于“能力不足”;一边想讲“自主模型”的故事,一边又拿不到基础设施层的调优能力。很多战略决策是“既定假设+组织惯性”的结果——看起来合理,但没人停下来问:如果这些假设本身就错了呢?

反观这轮跑出来的新玩家,无论是DeepSeek、Manus,他们有个共同点:思维轻盈,没有历史负担,也没有路线执念,这反而让他们成了这轮范式跃迁的开拓者。

如果回过头去看,DeepSeek和Manus做的那些事,其实都没有多么玄学,甚至可以说都站得住工程逻辑。但为什么几乎没有大厂走这条路?因为它们过于理性、过于系统化,也就过于保守。

比如大厂可能会问:做MoE到底能不能规模化?极限调优是不是浪费时间?——这些问题本身没错,但当还没验证过路径,就先否定它,那可能永远不会发现新大陆。

这也是为什么,越来越多投资人、开发者、行业观察者开始重新审视AI创业的价值判断:不是谁能讲出最全的闭环,不是谁能招来最多的模型科学家,而是——谁能打破“历史正确性”,走出一条技术与产品都能快速验证的新路线。

在AI这条超高速前进的技术公路上,最危险的不是落后一步,而是还相信旧的红绿灯规则。真正的变化总是发生在“不合理”与“不被看好”之间。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 有什么天气什么-什么天气什么成语

    有什么天气什么-什么天气什么成语

    2025-05-25 19:48

  • 以太坊复兴:Pectra升级引发2.05亿美元资金流入,机构投资者信心回归

    以太坊复兴:Pectra升级引发2.05亿美元资金流入,机构投资者信心回归

    2025-05-25 19:39

  • Experience upgrade! Understanding the 12 highlights of the Discovery section of OKX Web3 wallet in one article

    Experience upgrade! Understanding the 12 highlights of the Discovery section of OKX Web3 wallet in one article

    2025-05-25 18:51

  • a卡挖矿变频软件-a卡挖矿变频软件下载

    a卡挖矿变频软件-a卡挖矿变频软件下载

    2025-05-25 18:35

网友点评