大模型已死，“六小虎”求生-CSDN博客

本文链接：https://blog.csdn.net/yellowzf3/article/details/147758053

2025年的中国AI赛道，风声鹤唳。金沙江创投的朱啸虎，前段时间语出惊人，直言市场无需再关注“AI六小虎”，认为创业公司在底层大模型上已无戏可唱。无独有偶，创新工场的李开复也表达过类似观点，预测国内基础大模型的终局，可能只会剩下阿里、字节和DeepSeek这三家巨头。

一时间，“大模型已死”的论调甚嚣尘上。难道当初那场轰轰烈烈的“百模大战”真就这样尘埃落定了吗？曾经被寄予厚望、明星光环加持的“六小虎”们又将何去何从？今天，K哥就结合我的观察和思考，和大家聊聊这个话题。

来源：文小言

百模大战，三家幸存

实事求是的说，大模型之争从一开始就不是一场公平的游戏，其本质就是一场资源战争，而算力、数据、人才，构成了决定战争胜负的“三驾马车”。

先说说算力。如今，训练一个前沿大模型，万卡级别的GPU集群已经成了基础门槛。英伟达高端芯片（如A100/H100/H800）不仅价格高昂（单卡动辄十数万甚至数十万人民币），而且一卡难求。搭建并维护一个万卡集群，一次性投入就是数十亿甚至上百亿人民币，这还不包括后续电力、维护、研发等各种庞大费用。毫不夸张地说，仅算力成本一项，就足以将绝大多数玩家拒之门外了。

再来看数据。高质量、大规模、多样化的训练数据是模型智能的重要基石。而获取、清洗、标注这些数据，不仅需要技术，更需要持续的资金投入和庞大的人力。尤其在中文高质量语料相对匮乏的背景下，数据的壁垒作用就愈加突显了。

最后看人才方面。优秀的AI研究员和工程师早就是各大公司争抢的对象，他们的薪酬也一直跟着水涨船高，一个顶尖AI人才的年薪，百万甚至数百万已是常态。要维持一个数百人甚至上千人的高水平研发团队，每年的人力成本就是数亿乃至数十亿，同样是中小公司难以承受的。

当算力、数据、人才，三座大山叠加在一起，形成烧钱的“飞轮”时，只有拥有雄厚资本和持续“输血”能力的企业，才能支撑这种看不到短期回报的长期投入。由此来看，李开复预测大模型公司最终只剩下三家，并非主观臆断，而是有其现实逻辑的。

活下来的公司，都有一个特点

仔细观察被认为能“笑到最后”的这几家公司——阿里、字节跳动、DeepSeek，它们都有一个共同特点：不差钱。更准确地说，它们都拥有强大的、能够持续产生现金流的核心业务，足以支撑在AI大模型领域的长期巨额投入。

比如阿里，作为国内互联网巨头之一，其电商业务一直是其稳固的现金牛。以 2024 财年为例，阿里电商业务的年度活跃消费者达到约 9.79 亿，全年商品交易总额（GMV）达 8.11 万亿元。凭借电商业务的雄厚资金支持，阿里在大模型领域不断发力，其推出的通义千问大模型，背后是大量资金投入到算力建设、数据收集与处理，以及顶尖人才的招揽上，构建了其他AI企业难以超越的护城河。

字节跳动也不逊色，在短视频领域凭借抖音、TikTok 等产品取得了巨大的成功。其广告收入等盈利模式，为字节跳动带来了丰厚的利润。字节将这些资金积极投入到火山引擎等大模型相关业务中，并拥有自己的大规模数据中心，能够为模型训练提供强大的算力支持。同时，字节跳动通过高薪和良好的企业氛围，吸引了大量优秀的 AI 人才，这些人才在数据挖掘、算法优化等方面发挥着重要作用，推动字节在激烈竞争中，不断扩大优势。

DeepSeek，虽然相对阿里和字节，算是后起之秀，但它也有着独特的资金优势。作为幻方量化孵化的AI公司， DeepSeek 背后有强大的资本支持，其投资方包括一些知名的风险投资机构和产业资本。这些资本的注入，使得 DeepSeek 在算力采购、数据资源整合以及人才团队搭建上毫不吝啬。在人才方面，DeepSeek 从国内外顶尖高校和科研机构招募了一批优秀的 AI 人才，组建了一支实力强劲的研发团队，为其大模型的研发奠定了坚实基础。

这些公司能够在大模型这条路上持续走下去，靠的不仅仅是技术理想，更是实打实的“钞能力”。它们可以将大模型研发视为长期战略投资，而非急于变现的短期项目，没有这样的实力和定力，是很难在这场夸张的烧钱游戏中，继续玩下去的。

两只小虎，“跑”得快

面对巨头在基础大模型领域的“军备竞赛”，一些曾经雄心勃勃的“小虎”，开始展现出灵活的“求生”策略。百川智能和零一万物就是两个典型的“小机灵鬼”。

百川智能CEO王小川近期的一封内部全员信，在业内广泛流传。他在信中明确表示“我们要减少多余动作，专注医学方向”，这被大众解读为百川智能收缩战线的最新信号。要知道百川智能刚成立时可是怀揣着“ 打造中国版的 OpenAI 基础大模型及颠覆性上层应用 ”伟大愿景的。这才两年的时间，百川智能已经非常“识时务”地放弃在通用基础大模型上与巨头硬碰硬，转而专注于医疗这个潜力巨大的垂直领域。作为技术出身的创业者，王小川做出这样的决策，无疑是出于对现实压力的清醒认识。

此外，今年一月，零一万物的创始人李开复在接受媒体采访时也表示，“零一万物将不再追求超级大模型，而是训练‘小而美’的轻量化模型，专注赚钱的应用。”同时，零一万物与阿里云成立“产业大模型联合实验室”，大部分预训练团队并入阿里，剩余团队聚焦企业服务，也是非常明显的“瘦身”、转型之举。

这两家公司的快速转变，并非偶然，而是代表了一种趋势：在资源有限的情况下，与其在巨头的主战场上消耗殆尽，不如发挥自身技术优势，选择更具商业化前景的垂直赛道或应用层，实现“差异化生存”。

世上无难事，只要肯放弃

“六小虎”们纷纷调整策略，甚至被外界解读为“放弃”基础大模型，这背后既有无奈，也有智慧。

1、资本环境，容不下技术理想

“六小虎”齐刷刷组团转型，各有不得已的苦衷，其中资本环境的严酷，绝对是关键推手。国内的风险投资市场，相较于几年前变得更加谨慎和务实。经济周期的变化、地缘政治的不确定性，以及对“烧钱换增长”模式的反思，使得资本对需要长期巨额投入、回报周期不确定的基础科研项目（如基础大模型）越来越缺乏耐心。与xAI去年融资120亿美金，OpenAI今年4月初融资400亿美金、成立10年累计公开投资近1000亿美元这样的大手笔相比，更是有天渊之别。当然，人家也是一分投资，一分收获，xAI估值已达800亿美元，OpenAI估值更是高达8000亿美元。

类似xAI、OpenAI这种动辄百亿美金级别的投入和超高估值，在国内当前的资本环境下，几乎是难以想象的。这也让只有技术雄心，但缺乏长期、稳定的资本支持的AI创业公司，无法在基础大模型研发这样的“无限游戏”中继续玩下去。“六小虎”们眼睁睁看着行业“马太效应”越来越明显，留给他们的机会窗口一点点关闭，不得不痛下决心，转向更易获得现金流的业务，其实是资本压力之下理性又无奈的选择。

2、“六小虎”求生，比想象中乐观

那么，“放弃”基础大模型研发转向应用层，对“六小虎”们来说，是穷途末路还是柳暗花明？K哥认为，情况可能比想象中要乐观得多。为什么这么说呢？首先，要明确一点，这些公司之前的巨额亏损（如果存在的话），很大程度上是源于基础大模型训练的巨大投入，以及市场推广的烧钱大战。一旦剥离或大幅缩减这部分开支，成本压力将会显著降低。

另外，“六小虎”们并非一无所有。它们在过去几年积累了顶尖的技术团队（宝贵的稀缺资产）、成熟的模型能力（在特定能力上依然具有竞争力，足以支撑行业应用）、一定的品牌知名度和市场认知（在行业内和潜在客户中已经建立了认知度），凭借这些积累，转向垂直大模型（如医疗、金融、法律等）或企业级服务市场，对它们来说并非难事。

比如，智谱AI 一直在强化其To B和To G（政府）战略，并已与多家企业和政府机构展开合作，提供定制化的AI解决方案。根据公开报道，智谱已与金山办公合作，通过模型私有化和API调用，推动GLM系列模型在办公场景中的商用落地；还与北京、杭州、上海、成都、珠海等城市达成战略伙伴关系，促进了区域大模型应用生态的进一步发展。

再比如，月之暗面的Kimi智能助手，凭借其出色的长文本处理能力，已在C端市场获得了广泛关注和认可，这为它探索B端应用场景（如合同分析、研报生成、智能客服等），打下了非常好的基础。

总体来看，对于这些技术实力雄厚的小虎而言，拿下企业客户的大单，提供有价值的AI应用，实现盈利，并非遥不可及。毕竟，企业级市场对价格相对不敏感，他们更看重解决方案的实际效果和定制化能力，而这也恰恰是“小虎”们可以发挥优势的地方。

《周易》有言：穷则变，变则通，通则久。这句话就是当下AI创业者的写照。AI泡沫一点点退去，但小虎们并未"死去"，他们只是拿掉了理想主义的光环，开始“接地气”地在产业土壤中扎根生长。活下来的"小虎"，或许没能成为通天巨塔，却极可能开辟出新的通往未来的美好之路。祝福他们！

精选好文：

作者| Mr.K

编辑| Emma

号主简介