垂直 AI-OS 实战拆解:Parrot 与 Lassie 为什么先挖一口深井
用汽修 Parrot 和牙科 Lassie 对照,讲清「垂直深井型 Agent 产品」这一形态。
什么是「垂直 AI-OS」
把一个垂直行业里那些「核心工作不是记录、而是人类对话与系统操作」的环节,整体吃进一套系统,让 Agent 端到端替人跑完,并且按「替你完成的工作」收钱——这种形态就是「垂直 AI-OS」。
它和两类东西都不一样:不是横向通吃的通用 coworker(一个 Agent 嵌进 Slack 顺手把各种活都干),也不是只给人参考的 copilot(生成话术、起草内容,活还得人来做)。它选定一个 workflow 极标准的行业,把这个行业的全部上下文与干系人关系做成底座,再让 Agent 在底座上「真做活」。
本篇拆两个真实样本:
- Parrot(YC S26)做的是美国汽修,定位 "AI-native operating system for auto shops",核心是替修理厂打电话——和保险定损员谈补充款、找供应商催配件、协调客户与技师。
- Lassie(a16z 领投 $35M A 轮)做的是美国牙科诊所后台,核心是替诊所做保险理赔/收款对账——登记 EFT、进保险门户拉回款、对账、过账、预约管理,复杂问题才升级人工。
两者切的行业不同、形态不同,但选择的产品哲学高度一致:在一个行业里把「真做活」做到高自动化,而不是横向铺开。
对照表
| 维度 | Parrot(汽修) | Lassie(牙科) |
|---|---|---|
| 行业 | 美国汽修店($200B 市场) | 美国牙科诊所(约 16 万家) |
| 切的活 | 协调:追定损员、催配件、催客户,电话密集 | 后台金融:理赔/对账/过账,系统操作密集 |
| Agent 形态 | 语音 Agent 物理打电话给真人 | 进保险门户操作 + 预约管理 |
| 底座 | OS 五域上下文:估价/配件/客户/保险/供应商/付款 | 多系统打通 + system-of-record + 知识层 |
| 产品哲学 | 让 Agent "run the shop on autopilot" | "It does the work."(不是 copilot) |
| 自动化程度 | 早期(pivot 3 周签 2 家店) | 约 98% 自动化,复杂问题 flag 人工 |
| 护城河 | 行业 context 深度 + 汽修 know-how | 复杂度即壁垒 + 数据飞轮 + 合规(HIPAA/BAA) |
| 收费模式 | $30K/年/店(锚定一个全职协调岗) | performance-based,做了活才收钱 |
| 阶段 | 极早期,2 人团队,PMF 信号弱 | 已验证:700+ 诊所、49 州、$10M ARR |
核心洞察:「垂直深井 vs 横向通吃」之争
当下 Agent 产品有两条路线在对立:横向通吃(嵌进 Slack/Teams,一个通用 coworker 顺手把各种活都干,壁垒来自工具广度和渗透率);垂直深井(深扎一个行业,吃透全部干系人和 workflow,壁垒来自行业 context 深度和 know-how)。Parrot 和 Lassie 都选了后者。为什么在 Agent 能力还没强到能横向通吃之前,先挖一口深井是当下被验证的路径?
理由一:workflow 越标准,Agent 越能「真做活」。 投 Lassie 的核心逻辑是——workflow 越结构化、越重复、越高价值、错了代价越大,Agent 越能端到端替人完成。这等于反过来说:横向场景因为 workflow 不标准,先验证不了「真做活」,只能停在 copilot 形态。Parrot 印证了同一点——它专挑汽修里那个「没人能自动化、最耗人力、直接关现金流」的协调层(保险补充款扯皮)下手。两个独立样本指向同一件事:先在一个 workflow 极标准的垂直行业把自动化做到极致,再谈横向。
理由二:performance-based 收费倒逼「真做活」,也压低获客阻力。 Lassie 的模式是「做了活才收钱」。一是卖方担风险、买方先看到结果再付钱,对小企业主获客阻力极低;二是这种收费模式只有「真做完」才成立,copilot 拿不到这笔钱——它从机制上把产品逼向端到端闭环。
理由三:客单价锚定「省下的那个人」,而非按量计费。 Parrot $30K/年/店,锚的是「替代一个全职协调岗」;Lassie 把「省下的小时 / 追回的漏款」直接算给客户看。两者都不按分钟、按条、按通话量计费——那是工具的定价逻辑,会被压价、被通用 coworker 降维。垂直 AI-OS 的定价锚是「省下的那个人」或「追回的那笔钱」,这只有当 Agent 真的把岗位跑起来时才立得住。
理由四(隐含):数据飞轮把深井越挖越深。 Lassie 明说「跑得越多,需要的人工输入越少」——每跑完一单沉淀一层难复制的 knowledge layer。深井不是静态壁垒,是随使用自我加深的飞轮。这也是垂直路线对抗「语音/Agent 能力正在通用化」的唯一真壁垒:技术本身不是护城河,行业里跑出来的知识层才是。
用本课框架看它们的共性设计
Module A · L3 五维
- 任务路径(最关键):两者都不是单点能力,而是把一个行业的完整 workflow 串成一条可执行链。Lassie 的链最清晰:登记 EFT → 进门户拉回款 → 对账 → 更新 system-of-record → 核验到账 → 过账 → 预约。Parrot 是「先有全店上下文底座,Agent 才能打出有效的电话」。这正是把「一个行业的完整 workflow 做成 Agent」的范式:底座是前提,执行是末端。没有底座的电话 Agent 只是会说话的 IVR。
- 边界行为:两者都明确划了自主与升级的界线。Lassie「复杂问题 flag 人工」,Parrot 把人类技师留在协调环里。高自动化不等于无人化,而是把可标准化的部分吃干净、把不确定的部分干净地交出去——这是垂直深井能做到高自动化又不翻车的关键。
Module B · Harness / 评测
- Harness 即护城河:本课讲 Harness 是给 Agent 喂对上下文的工程层。在垂直 AI-OS 里,Harness 就是那套「行业领域知识 + 干系人关系 + 系统接口」的底座——Parrot 的五域 context、Lassie 的多系统打通和 knowledge layer,本质都是把行业 know-how 固化进 Harness。这层做得越深,通用模型越追不上,护城河就越宽。领域知识不是 prompt 里几句话,是产品形态本身。
- 评测:performance-based 收费天然内建了评测压力——做错了不仅收不到钱,在医疗/金钱场景还要担纠错和赔付成本。这迫使产品必须有一套「跑完一单后判断对错」的评分闭环,否则毛利会被错误吞掉。垂直深井的评测不是锦上添花,是收费模式逼出来的生存项。
对你自己做 Agent 的启发清单
- 先选行业,别先选能力。挑一个「核心工作是人类对话或系统操作、且没被 SaaS 数字化」的垂直岗位——电话密集、扯皮密集、直接关现金流的最好。
- 先建 context 底座,别上来就做模型。把这个岗位的全部上下文与干系人关系吃进系统,Agent 才能在底座上跑出有效动作。
- 卖「岗位 autopilot」,不卖「AI 会打电话」。定位是补一个历史空位(这个岗位以前不能自动化),不是又一个语音机器人。
- 定价锚「省下的那个人」或「追回的那笔钱」,别按分钟/按条/按量。考虑 performance-based 或「基础月费 + 按完成工作量浮动」。
- 坚持端到端「真做活」,警惕滑向 copilot。生成话术给人参考是退化,端到端闭环才是差异化和定价权的来源。
- 明确划自主/升级边界。把可标准化的吃干净,不确定的干净交人工——这是高自动化不翻车的前提。
- 把数据飞轮显式做成产品叙事。设计「跑完一单 → 评分 → 沉淀进知识层 → Agent 变强」的闭环,这是比纯工具更深的护城河。
- 别过度解读早期信号。Parrot 仅 2 人、3 周 2 店;垂直深井「复制到第二个行业」的成本至今未被验证。深度能抵御横向降维,但天花板与可规模化是这条路线必须正面回答的问题。