Hugging Face 是知识库里唯一一家,公司花了大约三年作为消费产品失败、用错的论点融了 520 万美元、然后悄悄交付了一段约 600 行的 PyTorch 移植代码——这段代码后来成为整个 NLP 学术界未来七年里反复 import 的命名空间。
聊天机器人没跑通。这个库跑通了。从技术拐点到正式宣布转向中间隔了 12 个月,从转向到完整变现中间隔了 7 年半。
两半故事,被 2018 年 10 月分隔
2016 – 2018 年 10 月:三位法国联合创始人在纽约注册成立 Hugging Face Inc.。做一款面向青少年的 iOS 聊天机器人。用户量到几千(MIT Tech Review,2017 年 3 月)。融了 120 万美元天使轮 + 400 万美元种子轮,论点没有投资人真心相信。
2018 年 10 月 – 2026 年 4 月:Google 发布 BERT 大约一周后,Hugging Face 交付的 PyTorch 移植版被学术 NLP 抓住,再也没放下。接下来七年里,六轮融资、四笔收购、累计融资 3.95 亿美元、投后估值 45 亿美元,到 2024 年——在约 1.3 亿美元营收上实现盈利。
转向的拐点不在 2019 年 12 月的 A 轮。在 2018 年 10 月的 PyTorch BERT 移植。A 轮只是事后正式确认了一个 12 个月前就已经发生的承重底层迁移。
聊天机器人时期 + 真正被保留下来的东西(2016–2018)
三位法国联合创始人在纽约通过一个线上斯坦福工程课的学习小组结识。Clément Delangue(CEO)有产品/商业背景。Julien Chaumond(CTO)是计算机工程师,曾在法国经济部工作过。Thomas Wolf(CSO)受过科学训练、当过专利律师,和 Chaumond 一起在乐队里玩过。
公司 2016 年成立。产品是面向青少年的「AI best friend」iOS 聊天机器人,跑在自研 NLP 模型上。iOS 在 2017 年 3 月 9 日上线。同月 MIT Tech Review 三周日记报告的用户基数是 几千个青少年用户(MIT Tech Review,2017 年 3 月)——不是某些事后追述里说的「数百万」。
公司 2018 年 5 月从 a_capital 拿了 400 万美元种子轮,Betaworks、SV Angel、Kevin Durant 跟投。聊天机器人仍是官方产品。
聊天机器人时期真正起承重作用的决策不是某个产品功能,是一次招聘。Wolf 是作为研究科学家、不是产品工程师被招进来的。他在为聊天机器人构建 NLP 基础设施——但用 PyTorch、按学术规范、对着文献做。
2018 年 10 月 Google 在 TensorFlow 中发布 BERT 时,差距是结构性的。学术 NLP 研究者大多数偏好 PyTorch。Wolf 和一个小团队在大约一周内交付了 PyTorch 移植版——pytorch-pretrained-bert。
几个月之内,pytorch-pretrained-bert 就成了大多数 NLP 论文使用 BERT 时引用的实现。聊天机器人在 2018 年 10 月没有转向。承重底层转向了。
Transformers 作为 A1:吞下整个 NLP 的承重底层
2019 到 2022 年间,transformers 这个库同时在做三件事。它是每一个新开源架构(RoBERTa、T5、GPT-Neo)发布时的标准分发渠道。它是跨架构的统一推理 API。它是好得让 arXiv 论文开始把引用从 GitHub repo 改成 Hugging Face model cards 的文档表面。
2019 年 9 月 v2.0.0 加上了 TensorFlow 2.0 支持,并启用了「transformers」这个不带框架前缀的规范命名。2019 年 10 月 Wolf 等的 arXiv 论文把学术公信力正式化。EMNLP 2020 demos 接收了它。2019 年之后学 NLP 的研究生,都是通过 Hugging Face 的 API 学的。
2021 年 3 月的 B 轮是资本效率的第一个有力公开信号。4000 万美元B 轮,Addition 领投,估值未公开披露,但 TechCrunch 携带了一个比头条数字更重要的细节:Hugging Face 在 2021 年 1 月与 2 月现金流为正,且上一轮 1500 万美元 A 轮还有大约 90% 的钱留在账上。
承重底层期烧钱(2018 年 10 月 → 2022 年 5 月)共 3.5 年,累计融资 5900 万美元——400 万美元种子 + 1500 万美元 A + 4000 万美元 B。对照:Vercel 在 AI 创造第二个复利循环之前就融了 3.13 亿美元;Replit 的承重底层期更长(8 年)但单位资本强度更低。Hugging Face 的承重底层期相对便宜——开源库没有推理成本,学术受众免费做布道。
两个不可迁移的结构性细节:
-
公司名 = 库名 = URL = 受众。 当一个研究者 import from transformers import AutoModel,他就是在伸手进 Hugging Face 的命名空间。这里没有 DBT-vs-Snowflake 那种「开源项目和跑在它之上的商业公司是两件事」的分离。
-
研究者天然预先分发。 每一篇引用 huggingface.co/{user}/{model} URL 的论文都是一次长尾 B3 推动。每一位复现实验的研究生、每一位若干年后在产业界读到这篇论文的 ML 工程师——所有人在拥有采购权之前都已经学会了这个 URL 模式。在四年一周期的学术循环里,承重底层以「研究生轮换率」的速度复利。
Hub 作为平台扩张(2020–2022)
到 2021 年,库本身已经够;战略问题变成了在它周围放什么。
答案是 Hub。先做模型托管,再做数据集托管,然后是 huggingface.co/spaces(2021 年 10 月)——免费的 ML demo 托管,以 Gradio 作为标准 SDK。2021 年 12 月,Hugging Face 把 Gradio 整体收购了下来(一支即将关张的五人工程团队)。
这就是 D1(技术叙事升维)在动作中。公司叙事从「开源 NLP 库」(承重底层、应用层估值)转向「机器学习领域的 GitHub」(平台、基础设施层估值)。2022 年 5 月 1 亿美元 / 20 亿美元的 C 轮第一次让平台叙事拿到了估值倍数。Lux Capital 第三次连续领投——这个阶段连续性信号很罕见。Sequoia 与 Coatue 首次入局——验证信号。
Spaces 重要的原因,大多数分析忽略了。Hub 上的 model card 是一个静态文件;一个 Space 是一个谁都能 fork(「Duplicate this Space」)、修改、再跑的可工作 web app。Stable Diffusion 在 2022 年 8 月发布时先在 Hugging Face Spaces 上爆红,再向其他渠道扩散——标志性 demo Spaces 被 fork 数千次。format 验证了 substrate。
BLOOM 紧随其后,C 轮两个月之后的 2022 年 7 月发布。1760 亿参数开放多语言 LLM,比 GPT-3 大。模型本身部署起来很难,但生产 BLOOM 的机制才是重点:Hugging Face 证明了它可以协调跨机构的 1000 名研究者,以开放协议产出一个前沿规模的模型。三年后,LeRobot 库会用同一套打法切机器人。
Inference Endpoints 在 2022 年 10 月上线——把 Hub 模型托管部署到 AWS、Azure、GCP。C2(高峰期变现)。 库一直免费;需求现在已经清楚到不能留在桌面上。
D 轮战略投资人阵容(2023 年 8 月 24 日)
Salesforce Ventures 领投的 D 轮,2.35 亿美元 / 45 亿美元,是 Hugging Face 的商业加冕。投资人名单本身就是头条。
| 投资人 | 对 Hugging Face 的角色 |
|---|
| Salesforce Ventures(领投) | 云客户,CRM-AI 集成锚点 |
| Google | 一号超大规模云,BERT 谱系,GCP 合作 |
| Amazon | 二号超大规模云,半年前的 AWS 优选 ML 平台合作 |
| Nvidia | GPU 承重底层;Llama 2 联合分发 |
| AMD | 与 Nvidia + Intel 直接竞争的硅 |
| Intel | 与 Nvidia + AMD 直接竞争的硅 |
| IBM | 企业渠道;watsonx 锚点 |
| Qualcomm | 端侧硅,边缘 AI |
8 家主流科技平台战略股东在同一轮。其中数家彼此直接竞争。Google 与 Amazon 是云对手。Nvidia、AMD、Intel 是硅对手。这是 案例库里最分散的战略投资人阵容。
ElevenLabs 的 C 轮战略阵容(Deutsche Telekom + NTT DOCOMO + RingCentral + HubSpot + LG)是 5 家,全部是邻接但不竞争的电信/通讯角度。Hugging Face 的 8 家在结构上更大、更冲突——而冲突本身就是重点。
Hugging Face 在这一轮卖的论点是中立。要做「每个组织出的每个模型都跑在上面」的开放承重底层,你必须在外观上不能向任何单一超大规模云倾斜。让自己看起来不倾斜的方法,是同时收下所有家的支票。
这是一个金融工程动作,但带着 GTM 弹头。每一家入局的战略股东都同时变成「高管层级客户」、「集成伙伴」与「联合营销管道」。D 轮披露的捆绑里程碑——50 万模型、25 万数据集、1 万付费客户——是 C1 标准动作。当时营收约 5000–7000 万美元 ARR。
到 2026 年 4 月仍没有公开 E 轮。 Hugging Face 自此再没有完成一轮定价主轮,这与 2024 年盈利声明一致。
创始人即 IP,三角化版本
Clément Delangue 的 X 账号(@ClementDelangue,呈现为「clem」)是看得见的创始人 IP 表面。他每天发——模型发布、合作公告、员工 shoutout、社区 Spaces 转推。节奏更接近 Vercel 的 Guillermo Rauch(持续每日在场版),而不是 Cursor 的 Michael Truell(阶段性长内容版)。
Fast Company 2023 年 4 月的人物报道把运营机制讲明:每位 Hugging Face 员工都有官方 X 与 LinkedIn 账号权限;公司没有专职社区经理。
相对其他案例,新东西是通过 Thomas Wolf 增加的「学术公信力支柱」。Wolf 维护个人博客 thomwolf.io,写长文,做主题演讲级别的公开露面。他 2025 年 3 月那篇挑战 Dario Amodei「压缩的 21 世纪」框架的长文——论点是当下 AI 正变成「服务器上的应声虫」、缺乏真正的科学创造力——被 TechCrunch、VentureBeat、CNBC 报道,把 Hugging Face 重新定位为研究可信的发声方,而不只是基础设施供应商。
由此构成了一个三角化的创始人 IP 表面,知识库里没有第二家这么干净:
- Delangue——X 上每日在场,开源 AI 的公开门面,商业媒体周期(Time 100 AI 2023、Fast Company)
- Wolf——学术公信力、论文署名、会议主题演讲、立场长文
- Chaumond——比另两位更安静,技术基础设施那一脚
代价是协调成本——三个声音要保持一致——好处是每个声音都能触达另外两个声音不可信传达的受众。Wolf 2025 年那篇长文如果由 Delangue 写,就接不住地——因为 Delangue 没有学术先验。Delangue 的战略股东阵容公告如果由 Wolf 写,也不会落地。
第二次 D1——机器人与本地推理(2024–2026)
LeRobot 在 2024 年 5 月开启第二次叙事升维。定位明确:LeRobot 是「机器人领域的 Transformers」。Hugging Face 从 Tesla 把 Remi Cadene 招来。库 12 个月内从 0 增长到 12000+ GitHub stars。
Pollen Robotics 在 2025 年 4 月是更硬的承诺——Hugging Face 收购了一家做 Reachy 2 人形机器人(7 万美元,部署在康奈尔与卡耐基梅隆)的法国机器人创业公司。Reachy Mini 在 2025 年 7 月(299/449 美元)是 HF 第一款自有硬件产品。
这一弧线是 D1 + D2 同时进行:D1(叙事从「AI 基础设施」走向「AI 基础设施 + 具身 AI 基础设施」);D2(受众边界从研究者/开发者推到买 299 美元桌面机器人的 maker 爱好者)。
ggml.ai / llama.cpp 在 2026 年 2 月被收购,是 D 轮后的第三次 D1。Hugging Face 把开源 LLM 主流本地推理引擎背后的团队收下。repo 保持 MIT 开源协议。战略逻辑:HF 是模型分发层;llama.cpp 是本地推理层;并到一起就把开源本地 AI 栈整合了。这是 HF 对 Modal、Replicate、Together 的定位反击——不在他们的毛利层级竞争,而是把承重底层往本地推理移,到一个对手没有开源心智份额可以跟的地方。
Hugging Face 特有的前提
- 2018–2019 年 BERT/PyTorch 这扇窗不可复现。 多重独特条件叠加:研究领域正向 transformer 类模型迁移、Google 在 TensorFlow 中发布而学术界大多数偏好 PyTorch、没有现成开源库占位、研究社区小到一份好的移植可以在几个月内拿下心智份额。一个 2026 年的创始人在 NLP 里再也开不出这扇窗。能否在机器人或别的垂直里复制——这是 LeRobot 正在测试的问题。
- 三位法国联合创始人 + 双文化纽约运营,不寻常但有后果。 它给 HF 带来法国政府资金(BLOOM、Jean Zay 超算)、法国研究人才(Pollen Robotics、Remi Cadene)、双跨大西洋的运营姿态——这正是中立框架需要的。美国 AI 基础设施公司在欧洲开源场域里天然公信力较弱;法国 AI 公司在美国超大规模云买家面前天然公信力较弱。Hugging Face 同时拥有两边。
- Wolf 的学术地位不可迁移。 一个非研究背景的单独创始人没法承担创始人 IP 三角化里的学术公信力支柱。三年后再招一个首席科学家也起不到同样作用——Wolf 自 2016 年起就在 cap table 上、从 2019 年起就以 Hugging Face 的署名发表论文。
- Lux Capital 跨 A–C 三轮的耐心资本支撑了承重底层期,押的是当时还不是风险投资类目的论点(开源 NLP 基础设施)。一个 2026 年的创始人拿同样论点见投资人,会面对一群已经知道结局长什么样、并据此定价的投资人。
- 依赖 transformer 架构继续主导。 库就叫
transformers;URL 约定、文档、demo Spaces 都假设 transformer 衍生架构会继续主导。如果下一代模型有意义地非 transformer(state-space、扩散原生 LLM),HF 必须改造承重底层——这比一次性建起来要难得多。
公开记录之外的部分
- **NDR(净美元留存率)**未披露。对一家 1.3 亿美元营收的基础设施公司,这是最物质的缺失数字。从一次性咨询向经常性收入的口径切换(Sacra 报告)有记录,但切换速率没有。
- Inference Endpoints / Hub 订阅 / 咨询的毛利结构不透明。Inference Endpoints 大概率会过转大量算力成本;Hub 订阅毛利更高。顶线营收说不出净经济。
- 盈利机制没有细节。Delangue X 帖子里的声明是真的,但底层驱动(开源分发带来的低 CAC?谨慎的人头?高毛利咨询业务的延续?)没有被拆开。
- 战略股东商业关系——D 轮 8 家战略股东里,多大比例转成付费客户、合同体量多大、节奏如何。新闻稿暗示有集成;营收处理方式没披露。
- 来自推理层专业玩家的竞争压力(Together、Replicate、Modal、Anyscale)——HF 公开口径里只在 ggml.ai 收购上回应过。经济上的问题是:HF 的中立模型能否在未来 3–5 年里保持和「垂直整合的推理供应商」相当的毛利率。
- 聊天机器人时代的技术决策——「一周内做出 PyTorch BERT 移植版」这一叙事到处被引用,但实际工程记录单薄。这是一个一人之力、还是一个小团队、还是已经备料的事,需要创始人长内容播客层级的核实——这个核实迄今没有发生。
- 自 2023 年 8 月起没有公开 E 轮或新估值。 45 亿美元是公开估值;运营业务画像(营收、盈利、1.3 亿美元规模)暗示了一个更高的内部估值。
来源