橙研所 · Build in Public

把 Agent 当产品设计，当系统交付

我是橙研所，一个 AI 产品经理。这里是我边做边写的 Agent 工程笔记——从产品能力、工程地基，到 Harness、设计模式与上下文工程。问题驱动，持续生长。

橙作者橙研所

AI 产品经理 · Build in Public。这门课配合公众号「橙研所」边做边写，把 Agent 学习笔记重写成讲义体。

GitHub公众号 · 橙研所

AAgent 产品与能力设计6 篇

A · 0 产品能力 · 第 0 篇

为什么搞懂 Agent，要先把它拆成五层来看

Agent 的能力与故障都长在 Loop / Tool / Planning / Memory / Multi-Agent 这五层地基上。

约 5 分钟 A · 1 产品能力 · 第 1 篇

为什么 Agent 接到任务后，第一步不该是动手

任务完成路径是 Agent 从需求到产出的拆解与推进能力，PM 要把它设计成可观测、可埋点的维度。

约 6 分钟 A · 2 产品能力 · 第 2 篇

为什么 Agent 失败不能笼统归因，必须按节点拆开

把 Agent 失败拆成输入 / 工具 / 推理 / 输出四类节点，先定位再改进。

查看全部 6 篇 →

BAgent 工程地基6 篇

B · 0 工程地基 · 第 0 篇

为什么换更强的模型救不了你的 Agent，先修 Harness

模型是司机，Harness 是车；交付不了多半是车的问题，不是司机。

约 5 分钟 B · 1 工程地基 · 第 1 篇

为什么管不好上下文窗口，再聪明的 Agent 也会变蠢

上下文是 Agent 最稀缺的资源，用七维透镜和构成审计把它当系统来工程化。

约 6 分钟 B · 2 工程地基 · 第 2 篇

为什么 Agent 上了生产，先崩的不是模型而是那层管道

Agent Gateway：接入、路由、持久化、可靠投递、并发，让 Agent 真正活在生产环境。

查看全部 6 篇 →

CHarness 工程8 篇

C · 0 Harness · 第 0 篇

为什么能力强的 Agent 仍然会失败

失败多半不在模型权重，而在权重之外那层叫 harness 的工程基础设施。

约 6 分钟 C · 1 Harness · 第 1 篇

为什么模型一样强，效果却天差地别——Harness 才是那个变量

Harness 是模型权重之外的全部工程基础设施，五子系统是组件、四层防御是落地。

约 6 分钟 C · 2 Harness · 第 2 篇

为什么仓库必须成为 Agent 的唯一事实源

不在仓库里的信息对 Agent 等于不存在，知识必须沉淀为文件而非散在工具里。

查看全部 8 篇 →

DAgent 设计模式（21 式）5 篇

D · 0 设计模式 · 第 0 篇

21 个 Agent 设计模式的全景地图

把 Google《Agentic Design Patterns》的 21 个模式一次铺开、归成 6 组，并标注本课讲过没。

约 4 分钟 D · 1 设计模式 · 第 1 篇

反思与推理：让 Agent 回头改一遍、也想得更深

一遍过会错而不自知，反思带批评定向改，推理把思考显式化想得更深。

约 5 分钟 D · 2 设计模式 · 第 2 篇

学习与适应 + RAG：让 Agent 不再每次从零，也不再瞎编

学习让 Agent 从反馈中改进策略，RAG 让它接上你的私有知识——都在上下文层做文章。

查看全部 5 篇 →

EContext Engineering 上下文工程7 篇

E · 0 上下文工程 · 第 0 篇

为什么模型这一轮看到的，从来不是你写的那段 prompt

模型每轮收到的上下文，是框架替你拼出来的一整坨；先让七层 100% 可见，才谈得上优化。

约 5 分钟 E · 1 上下文工程 · 第 1 篇

为什么你读到的那份 prompt 文件，常常不是模型真正收到的 system

一条 system message 往往由多源拼成；规则该写文件还是写代码，看作用域、优先级、健壮性三连。

约 6 分钟 E · 2 上下文工程 · 第 2 篇

为什么模型这一轮的输出，不该让它「既要念又要解析」

一段输出该说人话还是吐 JSON，唯一判据是「给谁消费」；工具该 eager 还是 deferred，看延迟红线乘以 tool 数量。

查看全部 7 篇 →

例实战示例3 篇

例 · 1 Claude Code

拆解 Claude Code：一个把五层架构做到极致的编码 Agent

用课程框架当透镜，拆解 Claude Code 的五层地基、透明度、错误恢复与上下文管理。

约 6 分钟例 · 2 Cursor

拆解 Cursor：上下文工程与人在环透明度

用技术地基五层与 Harness 框架拆 Cursor，看它如何把整个 codebase 喂进有限窗口、用 diff 守住信任。

约 6 分钟例 · 3 Parrot / Lassie

垂直 AI-OS 实战拆解：Parrot 与 Lassie 为什么先挖一口深井

用汽修 Parrot 和牙科 Lassie 对照，讲清「垂直深井型 Agent 产品」这一形态。

研实验室11 个项目

研 · 1 已开源

harness-kit

把「用 Claude Code 做长程任务」的工程方法，沉淀成一套可 clone 即用的项目骨架。

约 2 分钟研 · 2 已开源

agent-memory-kit

给你正在构建的产品 Agent 装一层运行时记忆——四个角色把经验沉淀成可复用的教训。

约 1 分钟研 · 3 已开源

context-engineering-kit

用一张 CONTEXT.md，把进入上下文窗口的每样东西按七层管理起来——每层带预算和缓存策略。

查看全部 11 个项目 →