2025年的中国AI赛道,风声鹤唳。金沙江创投的朱啸虎,前段时间语出惊人,直言市场无需再关注“AI六小虎”,认为创业公司在底层大模型上已无戏可唱。无独有偶,创新工场的李开复也表达过类似观点,预测国内基础大模型的终局,可能只会剩下阿里、字节和DeepSeek这三家巨头。
一时间,“大模型已死”的论调甚嚣尘上。难道当初那场轰轰烈烈的“百模大战”真就这样尘埃落定了吗?曾经被寄予厚望、明星光环加持的“六小虎”们又将何去何从?今天,K哥就结合我的观察和思考,和大家聊聊这个话题。
来源:文小言
01
百模大战,三家幸存
实事求是的说,大模型之争从一开始就不是一场公平的游戏,其本质就是一场资源战争,而算力、数据、人才,构成了决定战争胜负的“三驾马车”。
先说说算力。如今,训练一个前沿大模型,万卡级别的GPU集群已经成了基础门槛。英伟达高端芯片(如A100/H100/H800)不仅价格高昂(单卡动辄十数万甚至数十万人民币),而且一卡难求。搭建并维护一个万卡集群,一次性投入就是数十亿甚至上百亿人民币,这还不包括后续电力、维护、研发等各种庞大费用。毫不夸张地说,仅算力成本一项,就足以将绝大多数玩家拒之门外了。
再来看数据。高质量、大规模、多样化的训练数据是模型智能的重要基石。而获取、清洗、标注这些数据,不仅需要技术,更需要持续的资金投入和庞大的人力。尤其在中文高质量语料相对匮乏的背景下,数据的壁垒作用就愈加突显了。
最后看人才方面。优秀的AI研究员和工程师早就是各大公司争抢的对象,他们的薪酬也一直跟着水涨船高,一个顶尖AI人才的年薪,百万甚至数百万已是常态。要维持一个数百人甚至上千人的高水平研发团队,每年的人力成本就是数亿乃至数十亿,同样是中小公司难以承受的。
当算力、数据、人才,三座大山叠加在一起,形成烧钱的“飞轮”时,只有拥有雄厚资本和持续“输血”能力的企业,才能支撑这种看不到短期回报的长期投入。由此来看,李开复预测大模型公司最终只剩下三家,并非主观臆断,而是有其现实逻辑的。
02
活下来的公司,都有一个特点
仔细观察被认为能“笑到最后”的这几家公司——阿里、字节跳动、DeepSeek,它们都有一个共同特点:不差钱。更准确地说,它们都拥有强大的、能够持续产生现金流的核心业务,足以支撑在AI大模型领域的长期巨额投入。
比如阿里,作为国内互联网巨头之一,其电商业务一直是其稳固的现金牛。以 2024 财年为例,阿里电商业务的年度活跃消费者达到约 9.79 亿,全年商品交易总额(GMV)达 8.11 万亿元。凭借电商业务的雄厚资金支持,阿里在大模型领域不断发力,其推出的通义千问大模型,背后是大量资金投入到算力建设、数据收集与处理,以及顶尖人才的招揽上,构建了其他AI企业难以超越的护城河。
字节跳动也不逊色,在短视频领域凭借抖音、TikTok 等产品取得了巨大的成功。其广告收入等盈利模式,为字节跳动带来了丰厚的利润。字节将这些资金积极投入到火山引擎等大模型相关业务中,并拥有自己的大规模数据中心,能够为模型训练提供强大的算力支持。同时,字节跳动通过高薪和良好的企业氛围,吸引了大量优秀的 AI 人才,这些人才在数据挖掘、算法优化等方面发挥着重要作用,推动字节在激烈竞争中,不断扩大优势。
DeepSeek,虽然相对阿里和字节,算是后起之秀,但它也有着独特的资金优势。作为幻方量化孵化的AI公司, DeepSeek 背后有强大的资本支持,其投资方包括一些知名的风险投资机构和产业资本。这些资本的注入,使得 DeepSeek 在算力采购、数据资源整合以及人才团队搭建上毫不吝啬。在人才方面,DeepSeek 从国内外顶尖高校和科研机构招募了一批优秀的 AI 人才,组建了一支实力强劲的研发团队,为其大模型的研发奠定了坚实基础。
这些公司能够在大模型这条路上持续走下去,靠的不仅仅是技术理想,更是实打实的“钞能力”。它们可以将大模型研发视为长期战略投资,而非急于变现的短期项目,没有这样的实力和定力,是很难在这场夸张的烧钱游戏中,继续玩下去的。
03
两只小虎,“跑”得快
面对巨头在基础大模型领域的“军备竞赛”,一些曾经雄心勃勃的“小虎”,开始展现出灵活的“求生”策略。百川智能和零一万物就是两个典型的“小机灵鬼”。
百川智能CEO王小川近期的一封内部全员信,在业内广泛流传。他在信中明确表示“我们要减少多余动作,专注医学方向”,这被大众解读为百川智能收缩战线的最新信号。要知道百川智能刚成立时可是怀揣着“ 打造中国版的 OpenAI 基础大模型及颠覆性上层应用 ”伟大愿景的。这才两年的时间,百川智能已经非常“识时务”地放弃在通用基础大模型上与巨头硬碰硬,转而专注于医疗这个潜力巨大的垂直领域。作为技术出身的创业者,王小川做出这样的决策,无疑是出于对现实压力的清醒认识。
此外,今年一月,零一万物的创始人李开复在接受媒体采访时也表示,“零一万物将不再追求超级大模型,而是训练‘小而美’的轻量化模型,专注赚钱的应用。”同时,零一万物与阿里云成立“产业大模型联合实验室”,大部分预训练团队并入阿里,剩余团队聚焦企业服务,也是非常明显的“瘦身”、转型之举。
这两家公司的快速转变,并非偶然,而是代表了一种趋势:在资源有限的情况下,与其在巨头的主战场上消耗殆尽,不如发挥自身技术优势,选择更具商业化前景的垂直赛道或应用层,实现“差异化生存”。
04
世上无难事,只要肯放弃
“六小虎”们纷纷调整策略,甚至被外界解读为“放弃”基础大模型,这背后既有无奈,也有智慧。
1、资本环境,容不下技术理想
“六小虎”齐刷刷组团转型,各有不得已的苦衷,其中资本环境的严酷,绝对是关键推手。国内的风险投资市场,相较于几年前变得更加谨慎和务实。经济周期的变化、地缘政治的不确定性,以及对“烧钱换增长”模式的反思,使得资本对需要长期巨额投入、回报周期不确定的基础科研项目(如基础大模型)越来越缺乏耐心。与xAI去年融资120亿美金,OpenAI今年4月初融资400亿美金、成立10年累计公开投资近1000亿美元这样的大手笔相比,更是有天渊之别。当然,人家也是一分投资,一分收获,xAI估值已达800亿美元,OpenAI估值更是高达8000亿美元。
类似xAI、OpenAI这种动辄百亿美金级别的投入和超高估值,在国内当前的资本环境下,几乎是难以想象的。这也让只有技术雄心,但缺乏长期、稳定的资本支持的AI创业公司,无法在基础大模型研发这样的“无限游戏”中继续玩下去。“六小虎”们眼睁睁看着行业“马太效应”越来越明显,留给他们的机会窗口一点点关闭,不得不痛下决心,转向更易获得现金流的业务,其实是资本压力之下理性又无奈的选择。
2、“六小虎”求生,比想象中乐观
那么,“放弃”基础大模型研发转向应用层,对“六小虎”们来说,是穷途末路还是柳暗花明?K哥认为,情况可能比想象中要乐观得多。为什么这么说呢?首先,要明确一点,这些公司之前的巨额亏损(如果存在的话),很大程度上是源于基础大模型训练的巨大投入,以及市场推广的烧钱大战。一旦剥离或大幅缩减这部分开支,成本压力将会显著降低。
另外,“六小虎”们并非一无所有。它们在过去几年积累了顶尖的技术团队(宝贵的稀缺资产)、成熟的模型能力(在特定能力上依然具有竞争力,足以支撑行业应用)、一定的品牌知名度和市场认知(在行业内和潜在客户中已经建立了认知度),凭借这些积累,转向垂直大模型(如医疗、金融、法律等)或企业级服务市场,对它们来说并非难事。
比如,智谱AI 一直在强化其To B和To G(政府)战略,并已与多家企业和政府机构展开合作,提供定制化的AI解决方案。根据公开报道,智谱已与金山办公合作,通过模型私有化和API调用,推动GLM系列模型在办公场景中的商用落地;还与北京、杭州、上海、成都、珠海等城市达成战略伙伴关系,促进了区域大模型应用生态的进一步发展。
再比如,月之暗面的Kimi智能助手,凭借其出色的长文本处理能力,已在C端市场获得了广泛关注和认可,这为它探索B端应用场景(如合同分析、研报生成、智能客服等),打下了非常好的基础。
总体来看,对于这些技术实力雄厚的小虎而言,拿下企业客户的大单,提供有价值的AI应用,实现盈利,并非遥不可及。毕竟,企业级市场对价格相对不敏感,他们更看重解决方案的实际效果和定制化能力,而这也恰恰是“小虎”们可以发挥优势的地方。
《周易》有言:穷则变,变则通,通则久。这句话就是当下AI创业者的写照。AI泡沫一点点退去,但小虎们并未"死去",他们只是拿掉了理想主义的光环,开始“接地气”地在产业土壤中扎根生长。活下来的"小虎",或许没能成为通天巨塔,却极可能开辟出新的通往未来的美好之路。祝福他们!
精选好文:
作者| Mr.K
编辑| Emma
号主简介
Mr.K,黄哲铿,「顿悟山丘」创始人,科技博主,曾担任海尔、中通快递、1药网技术高管,著有《技术人修炼之道》《技术管理之巅》。分享:AI产业观察、企业AI应用实践、领导者成长。
- END -
K哥在视频号讲干货,快来围观!