AI Agent 与 Claude Skills 的正确用法——从零打造高效能智能工作流

频道:Greg Isenberg · 时长:35:25

📺 Greg Isenberg ⏱ 35:25 🗓 2026-05-19

视频信息

项目 详情
频道 Greg Isenberg
视频标题 How AI agents & Claude skills work (Clearly Explained)
视频ID S_oN3vlzpMw
发布日期 2026-04-08
时长 35:25
链接 https://www.youtube.com/watch?v=S_oN3vlzpMw
主题 AI Agent 上下文管理、Skills 构建方法论、渐进式生产力扩展
关键词 Claude Code, Skills, agent.md, Context Window, Progressive Disclosure, Sub-agents, Open Claw, Workflow
嘉宾 Ross Mike(AI 开发者、YouTube 创作者)

引言

“The models are exceptionally good. Opus 4.6 is amazing. GPT 5.4 is amazing… But, context still matters, and you have the power to steer the models in a direction where you can get quality or you can get slop.”

模型已经很强了——这是 Ross Mike 在本期节目开头就亮出的核心判断。Opus 4.6、GPT 5.4,无论你站哪个阵营,模型能力已经到了一个相当高的水平。但问题在于:同样的模型,有人用出了极致生产力,有人只得到一堆垃圾输出。 差距在哪?不在模型本身,而在你如何管理上下文、如何构建 Skills、如何一步步训练你的 Agent。

本期是一次没有新工具发布、没有炫酷 Demo 的「务实谈话」。Ross Mike 坦言自己差点不来录这期节目,因为觉得没有什么新东西可聊。但 Greg Isenberg 说服了他——真正有价值的,不是追逐最新工具,而是把底层方法论讲清楚。这期内容,正是这样的底层方法论。


第一阶段:理解上下文——Agent 的「认知世界」是怎么组装的

上下文的五大组成部分

Ross Mike 用一张图把 Agent 的完整上下文窗口拆解成五个层次:

  1. System Prompt(系统提示词)——由模型提供方预设,指导模型如何行动、什么该做、什么不该做
  2. agent.md / claude.md(配置文件)——用户自定义的指令文件
  3. Skills(技能文件)——以渐进式披露(Progressive Disclosure)加载的专用工作流
  4. Tools(工具)——读取文件、写入文件等内置工具的定义
  5. Codebase + User Conversation(代码库与用户对话)——实际项目代码和当前对话记录

“This is what the complete context window is filled with, right? And this can total up to let’s say like at the beginning, this could be like 20,000 tokens.”

随着对话推进,Token 消耗不断累积,最终可能触及 250,000 Token 的上限。此时 Claude Code 和 OpenAI Codex 都会启动「压缩」(Compact)机制。

为什么上下文管理如此重要?

模型的表现会随着上下文窗口的填充率下降。Ross Mike 画了一个示意图来说明这个问题:

“The closer you get to 99, 100% like 99, 90, 80%, it starts to get dumb, right? And you can think of this like a human. Like imagine you throw a bunch of information again and again and again.”

他用了一个生动的比喻:就像你上学时整年没听课,考前一晚临时抱佛脚,把多项式、图表、各种符号全往脑子里塞——根本消化不了。Agent 也是一样的道理。

“Last minute studying never worked for me cuz like I didn’t pay attention the entire year. Now I have to learn about polynomials, and I have to do these graphs, and there’s this weird notation. It’s impossible for me to catch up.”

所以,省 Token 不只是省钱——更重要的是让你的 Agent 保持在最佳认知状态。每一行不必要的上下文,都在把你的 Agent 推向那个「临时抱佛脚」的低效状态。


第二阶段:agent.md 的真相——95% 的人根本不需要它

一个让很多人意外的结论

“95% of people don’t need this. The reason being is, again, you have to assume that the models are already good, right?”

Ross Mike 毫不客气地说:绝大多数人在 agent.md / claude.md 文件里写的东西,都是浪费 Token

他举了一个类似的例子:

“Imagine I told you, Greg, every time we’re about to shoot a podcast, Greg, you need a microphone. You know you need a microphone, right? You’ve done this plenty of times.”

如果你在 agent.md 里写「本项目使用 React」——模型已经能从代码库中看到这一点,你不需要告诉它。如果你写「表示金额时使用美元符号」——模型默认就会这么做。这些都是在浪费上下文空间。

那 5% 什么时候需要?

只有一种情况:你有专有信息(Proprietary Information)需要在每次对话中都被引用

Token 消耗的代价

假设你的 agent.md 有 1,000 行,大约 7,000 个 Token。每一轮对话都会加载这 7,000 个 Token。这不仅花钱,更关键的是——它在挤压你宝贵的上下文空间,让模型更快地「变笨」。

“Tokens ain’t cheap now… It’s not even cheap. It’s just like you’re not trying to hit the limit quicker than you need to hit the limit.”

Ross Mike 特别指出,问题不仅仅是成本,而是你在加速消耗一个有限资源。你的上下文窗口就那么大,agent.md 吃掉的每一个 Token,都是你和 Agent 对话、传递真正重要信息的空间。

“It’s context being added at every turn, right? So, let’s say you have like a thousand line file, and let’s say that’s like 7,000 tokens. You’re spending 7,000 tokens on every run.”

Greg Isenberg 听到这里也补充道:这就像一个有限的容器,你不会想要主动去填满它。

System Prompt 泄露事件

Ross Mike 还提到一个有趣的细节:Claude Code 的 System Prompt 最近被泄露了。作为开发者,他仔细阅读了这份 System Prompt,发现模型提供方在这个层面已经做了大量精心设计——指导模型如何行动、什么该做、什么不该做。

“Claude Code leaked recently, and one of the cool things that, especially as a developer, I got to do is I got to read the system prompt.”

这进一步说明:模型已经被很好地「预训练」了,你不需要在自己的配置文件里重复那些模型已经知道的事情。


第三阶段:Skills 的魔力——渐进式披露(Progressive Disclosure)

Skills 如何工作?

一个 Skill 文件(skill.md)的结构是这样的:

关键机制:加入上下文的只有 Name 和 Description,详细内容不会被加载,直到 Agent 判断需要使用这个 Skill。

“What gets added into the context is actually just the name and the description, right? The bunch of info doesn’t get added.”

Token 对比:Skills vs agent.md

Ross Mike 用他自己的代码结构 Skill(Code Structure Skill)做了一个实际测量:

方式 Token 消耗
完整 Skill 内容(116 行)放在 agent.md 中 944 Tokens(每轮对话都消耗)
只加载 Name + Description 53 Tokens(每轮对话消耗)

差距高达 18 倍。而且 Skill 内容只有在被需要时才会被完整加载——这就是渐进式披露的威力。

代码本身就是上下文

“Code itself has become context now.”

随着模型能力的提升,代码文件本身就是最好的上下文。你不需要在 agent.md 里描述技术栈——模型会直接读代码。这意味着:

Ross Mike 还观察到一个行业趋势:各大模型公司已经意识到 Agent 在写代码方面特别擅长,尤其是 TypeScript。这就是为什么 Cloud Co-work 和 Open Claw 在底层做的事情,其实都是写代码、调 API。

“A lot of the companies model companies have realized that the agents are really good at writing code, particularly TypeScript.”

这意味着:如果你在搞编程项目,Agent 已经「天生」就理解你的技术栈了,你真的不需要在配置文件里再赘述一遍。


第四阶段:创建 Skills 的正确方法——不要跳步

最常见的错误

大多数人的做法是:

  1. 发现自己有一个工作流(Workflow)
  2. 立刻动手写一个 Skill

“This is the worst thing you can do.”

Ross Mike 在白板上画了大大的箭头,标注「This is bad」。为什么这样做是错的?

员工培训的类比

“Imagine you hire an employee or you’re mentoring somebody. You’re probably going to tell them what to do. And if they ask you questions on how to do it, you’ll help them. You would ideally like them to fail and then you want to then tell them, ‘No, this is how you do it.’”

你不会雇一个新员工,给他一本手册,然后说「去吧,祝你好运」。你会带着他做,让他犯错,纠正他,直到他掌握了整个流程。Agent 也应该这样训练。

正确流程:先做,再教,再固化

Step 1:识别工作流(Identify the Workflow)

你有一个需要反复执行的任务。

Step 2:手把手教 Agent 做(Walk Through Step-by-Step)

和 Agent 一起做整个流程,一步一步地指导它。

Step 3:让它完成一次成功的运行(Successful Run)

确保 Agent 在你的指导下,完整、正确地完成了整个工作流。

Step 4:让 AI 自己创建 Skill

“Review what you did and then create the skill.”

告诉 Agent:「回顾你刚才做的事情,然后把它创建成一个 Skill。」此时 Agent 拥有完整的成功运行上下文——它知道什么有效、什么没效、每一步该怎么做。

YouTube 赞助商审核案例

Ross Mike 用自己的真实工作流做了说明:

问题:他有一个 Open Claw Agent,专门审核赞助商邮件。最初他只告诉 Agent:「每 15 分钟检查邮件,研究赞助商,告诉我是否值得。」结果——

“Every sponsor email I sent it, it was like legit, legit, legit, perfect, perfect, perfect. There was no rejection.”

Agent 把每个赞助商都评为「合格」,没有做任何深入研究。

解决过程:Ross Mike 开始手把手教它:

“Once we had a successful run and we did it again and again, then I converted it to a skill.”

经过多次成功运行后,他才让 Agent 把这个流程固化成 Skill。

《The Office》的「Rundown」类比

Greg Isenberg 在这里插入了一个精妙的类比——来自美剧《The Office》的经典桥段。新老板 Charles 让 Jim 做一个「rundown」(概要报告),但从来没有解释过什么是「rundown」。Jim 整集都在到处问人,甚至打电话问自己老爸:「什么是 rundown?」

“The whole episode is about Jim trying to ask around and be like, ‘What is a rundown? Like what is a rundown?’ He’s like calling his dad, like ‘What is a rundown?’”

这个类比完美说明了问题:Agent 就像一个新员工,如果你不给它足够的上下文,它不可能知道你想要什么。 你说「给我做个报告」,但你没有定义什么算好的报告、需要哪些数据源、格式是什么——Agent 当然会给你一个泛泛的、毫无价值的结果。

“He didn’t have the context. And it goes back to my initial point. The models are really really good now, but the context matters more than anything.”


第五阶段:递归式 Skill 优化——让技能越用越强

核心理念:Skill 不是写完就完了

即使你创建了一个 Skill,Agent 仍然会在某些地方出错。这不是问题——这是优化的机会

“Even though you have the skill.md, the agent at some point is still going to mess up because there’s probably gaps in the information it has in the skill.”

递归优化的闭环

Ross Mike 描述了一个他称为「递归式构建 Skills」的方法论:

  1. 创建 Skill → Agent 使用 Skill 执行任务
  2. Agent 出错 → 不要抱怨,这是好事
  3. 诊断错误 → 问 Agent:「你为什么失败了?」「你遇到了什么错误?」
  4. 修复错误 → 告诉 Agent:「你在这里失败了,这个不行,修复它。」
  5. 更新 Skill → 告诉 Agent:「用新的修复方案更新 Skill,确保这个问题不再发生。」

“I have like a report generator. It calls Notion, Dub Analytics, YouTube Analytics, Twitter Analytics, pulls from like eight data sources… Every time I tell it to do that workflow, it takes like 10 minutes. It executes it flawlessly. Why? I went through five loops of this.”

他的报告生成器 Skill 调用了 8 个数据源(Notion、Dub Analytics、YouTube Analytics、Twitter Analytics 等),经过 5 轮递归优化后,现在每次执行都是完美无缺的。

转变心态:错误是礼物

“When it messes up, you thank God you don’t complain cuz a lot of people are like, ‘Oh, I messed up. I’m angry.’ No, this is a moment where you identify the error.”

大多数人遇到 Agent 出错就抱怨:「这技术太垃圾了。」正确的心态是:每次出错都是一次让 Skill 变得更强的机会。

期望管理:真实的进步曲线

Ross Mike 还纠正了大多数人对 Agent 生产力的期望曲线。很多人以为进步是线性的——一用就好。实际情况是:

“Most people’s expectations… And the way I’ve personally experienced is it’s like this.”

他在白板上画了一条先下后上的曲线——前期有一个明显的「投入低谷」,你会觉得 Agent 什么都做不好,质疑为什么要用它。但一旦度过这个低谷期(大约 2 周),Agent 的生产力会急剧攀升。

这和学任何新技能是一样的:先痛苦,后回报。关键是你是否愿意挺过那段不舒服的时期。


第六阶段:为什么不应该下载别人的 Skills

「Skills 市场」的陷阱

“I don’t download skills because your agent needs the context of a successful run, which you then turn to skills.”

Ross Mike 在这里提出了一个可能会得罪很多人的观点:不要下载别人的 Skills。理由有两个:

理由一:安全风险

“First of all, it’s a easy way to attack somebody. So, I would be very, very careful with downloading some random person’s skills.”

下载陌生人编写的 Skill 文件,本质上是在你的 Agent 工作流中植入未经审查的指令——这是一个明显的攻击向量。

理由二:缺乏你的上下文

别人的 Skill 是基于别人的工作流、别人的成功运行而构建的。你的 Agent 没有经历过那个过程,它不理解这个 Skill 背后的「为什么」。

“Your agent needs the context of a successful run.”

Ross Mike 甚至拿自己举例——他在 GitHub 上公开了自己的 Code Structure Skill(116 行),但明确告诫:

“Don’t download it. Do I’m telling you now, do not download it. Don’t use it. I just put it so I can get some GitHub stars.”

正确做法:学习别人的思路,构建自己的版本

Ross Mike 用了一个很接地气的比喻来总结这个观点:

“Build your own skills. You know like when you ask your mom when you were a kid, ‘Oh can we have McDonald’s?’ And she’s like ‘we have food at home.’ We have food at home. Build your own skills.”

就像小时候你想吃麦当劳,妈妈说「家里有饭」——别想着外面的,自己动手。

可以参考别人的 Skill 作为灵感——看看它的结构、它关注的维度——然后自己从零开始,通过实际工作流构建属于你自己的版本。

“I’ll review it. I’ll check it out. I’ll even give it to my AI and be like, ‘Oh, what are some things we can learn from this?’ But I don’t download skills.”

Skill 创建 Skill:「Skill Inception」

Ross Mike 还提到了一个有趣的事实:现在甚至有专门用来创建 Skill 的 Skill——他称之为「Skill Inception」(技能套娃)。

“They even have a skill to create skills. Skill inception.”

但核心原则不变:不管你用什么工具来创建 Skill,前提是你必须先和 Agent 走过一次成功的工作流,让它在有上下文的情况下生成 Skill。


第七阶段:从一个 Agent 到多个 Sub-agents——正确的扩展路径

不要一上来就搞复杂架构

“I see a lot of people who have, you know, 15 sub-agents, 30 skills. Yet, you haven’t even set up your own workflows, right?”

Ross Mike 见过太多人一开始就搭建复杂的多 Agent 系统——15 个 Sub-agents、30 个 Skills,但连一个基本工作流都没跑通过。

他用了一个比喻:

“Imagine I start a company and off rip, I have 10 employees. Never managed a team in my life.”

你从来没管过团队,上来就雇 10 个人?这注定会乱。

正确的扩展路径

Ross Mike 自己的演进过程:

  1. 从一个 Agent 开始——这个 Agent 做所有事情:检查表格、处理赞助商邮件等
  2. 建立 Skills——在单个 Agent 上不断优化工作流,把成功的流程固化为 Skills
  3. 分离 Sub-agents——当某个领域的 Skills 足够成熟,才拆分出专门的 Sub-agent
  4. 现在他有 5 个 Sub-agents:Marketing、Business、Personal 等

“I’m willing to bet if I went Open Claw to Open Claw with anyone, my system is more productive because I didn’t scale for what looks cool, I scale for productivity.”

Paper Claw 的例子

Ross Mike 提到了当时很火的 Paper Claw,他承认这个工具很酷、他自己也喜欢用。但他认为,如果人们花两到三周时间,用 Open Claude 从零构建自己版本的 Paper Claw——只构建自己真正需要的功能——生产力会远远超过直接使用现成工具。

“I’m willing to bet if people took two weeks to build up to the version… if they built up their own version of Paper Claw in two three weeks where like they’re building things that they actually need, their productivity level will skyrocket through the roof.”

Greg Isenberg 调侃他说这是「Hot Take」(犀利观点),可能会得罪人。Ross Mike 开玩笑说:「也许 Paper Claw 融了十亿美金然后不收购我的播客了。」但他坚持自己的观点:

“Scale for productivity, not scale for what looks cool.”

投入两周的「痛苦期」

Ross Mike 坦承,搭建自己的 Agent 系统并不轻松。他回忆自己第一次使用 Open Claw 的体验:

“When I first set up Open Claw, I thought the same thing. I’m like, ‘What is this garbage?’ Right? Like it doesn’t understand anything. It’s confusing.”

但大约两周后,他开始理解底层逻辑,开始用正确的方式和 Agent 交互,一切都变了。他把这两周称为「Early Area of Investment」——一个谁都不愿意告诉你的前期投入期。

“There’s like this early area of investment that you have to make that sucks, that nobody will tell you, especially Agent Harness companies cuz they wouldn’t raise as much money if they did.”

这是一个非常诚实的洞察:Agent 工具公司不会告诉你「上手需要两周磨合期」,因为这样他们的融资就会打折扣。但这就是现实。


第八阶段:模型 vs 上下文 vs Harness——未来的竞争在哪里

模型已经足够好,差异化在别处

“We’ve reached a point where the models are really really good. They’re probably going to get better. The next iteration is probably going to get better, but the harness and the tools that you surround it, the context that you give it is going to matter even more.”

Ross Mike 提到了一个 Benchmark,显示 Cursor、Claude Code 和 Codex 在相同模型下产出质量有差异。这说明:模型能力趋同之后,Agent Harness(代理框架)和上下文管理成为真正的差异化因素。

LLM 的本质:Token 预测器

“The models actually don’t think. They’re predictors of tokens, right? So, when you give it English, it maps it on this vector graph and then it looks for the closest resemblance and it says, ‘This is the response.’”

这不是在贬低模型——而是在强调一个关键认知:模型没有真正的「理解」。它做的是在向量空间中找到最近的匹配。这就是为什么上下文如此重要——你给它什么上下文,直接决定了它在向量空间中搜索的方向。

「永久下层阶级」的讨论

节目中还出现了一段关于「Permanent Underclass」(永久下层阶级)的讨论——一种流行于 Twitter 的说法,认为 AGI 到来后,不会使用 AI 的白领工作者将永久沦为底层。

Ross Mike 的态度是:

“I genuinely believe anyone who knows how these tools work and knows how to build agents and craft skills and knows how to make them productive, we’re in it for a good run.”

同时他也指出这个说法过于吓人:

“It’s ridiculous to call it a permanent underclass. Yeah, cuz that’s terrifying… You’re saying there’s no hope.”

但不可否认的现实是:

“Knowledge that took 20 people 20 years to acquire is now like 20 bucks a month.”

知识的获取成本已经被 AI 极度压缩。他提到了一个例子——有人通过 Vibe Coding 把一个应用做到了 18 亿美元的估值。

当 Ross Mike 听到这个数字时,他的反应很真实:

“How you were like billion. You were about to just leave this podcast and just be like… I just realized, man, I overthink things. Like I just need to drop the thing, release the thing.”

他从这个案例中学到的是:有时候需要一种「合理的疯狂」——少想,多做,把产品推出去。如果不行,就做下一个。

这一轮节目的特殊性

值得一提的是,Ross Mike 在节目结尾坦言自己差点没来。他觉得没有什么新工具发布,没什么可聊的:

“I told Greg, and I’m just going to be frank. I’m like, I don’t have that banger, you know, something new dropping.”

但 Greg 给他看了一条粉丝的短信——一个人因为看了他们之前的一期视频而入门编程,现在经营着一个蛋糕生意,年收入 15 万美元。

“That video got him into coding. Now, he’s running a cake business, he’s making $150,000 a year and growing.”

Greg 的回应发人深省:

“It’s not about the numbers… if it gets 2,000 and two people end up taking this information and changes their business, their productivity, how they think about things, then you know, I think that’s why you and myself have been put on this planet Earth is to inspire people.”

这段对话提醒我们:最有价值的内容,往往不是最炫酷的,而是最务实的。


核心概念速查表

概念 定义
Context Window Agent 的完整认知空间,由 System Prompt、配置文件、Skills、Tools、代码库和对话记录组成
Progressive Disclosure Skills 的加载机制——只在 Agent 判断需要时才加载完整内容,平时只保留标题和描述
agent.md / claude.md 每轮对话都会完整加载的配置文件,适用于必须在每次交互中引用的专有信息
Skill.md 以渐进式披露方式加载的专用工作流文件,比 agent.md 节省大量 Token
Recursive Skill Building 通过反复使用→出错→诊断→修复→更新 Skill 的闭环,让 Skill 越来越完善
Compaction 当上下文窗口接近上限时,Agent Harness 自动压缩历史对话的机制
Sub-agent 从主 Agent 分离出的专门 Agent,负责特定领域的任务
Token 经济 上下文中的每一条信息都消耗 Token,Token 不仅有成本,还会影响模型性能
Harness 围绕模型的工具框架(如 Claude Code、Cursor、Codex),决定了工具、上下文的组装方式
Successful Run 创建 Skill 之前必须完成的步骤——让 Agent 在你的指导下成功执行完整工作流

实用技巧总结

  1. 精简你的 agent.md:审视你的 agent.md / claude.md 文件,删除所有模型能从代码库中推断出的信息。保留的唯一标准是:这是专有信息,且每次对话都必须引用。

  2. 用 Skills 替代 agent.md:把工作流、编码规范、报告格式等从 agent.md 中提取出来,改写为独立的 Skill 文件。名称和描述写清楚,详细内容让 Agent 按需加载。

  3. 先教再固化:不要直接写 Skill。先和 Agent 一步步走完整个工作流,确保至少有一次完整的成功运行,然后让 Agent 自己总结并创建 Skill。

  4. 拥抱错误:Agent 使用 Skill 出错时,不要抱怨。问它为什么失败,指导它修复,然后让它更新 Skill 文件。每一次错误都是一次优化机会。

  5. 从一个 Agent 开始扩展:不要一上来就搞 15 个 Sub-agents。先用一个 Agent 跑通所有核心工作流,积累足够的 Skills,再按领域拆分 Sub-agents。

  6. 不要下载别人的 Skills:可以参考别人的 Skill 获取灵感和思路,但要从零构建自己的版本。你的 Agent 需要的是你的工作流上下文,不是别人的。

  7. 关注上下文窗口填充率:尽量让上下文保持在 70% 以下。越接近上限,模型表现越差。用 Skills 的渐进式披露来节省空间。

  8. 重视项目模板:好的项目模板(Template)本身就是高质量的上下文。投资时间打磨你的 Starter Template,比在 agent.md 里写一堆描述有效得多。


常见误区

  1. 误区:agent.md 越详细越好 → 错。agent.md 的每一行都会在每轮对话中消耗 Token,绝大多数内容应该放在 Skills 里,按需加载。

  2. 误区:模型不够聪明,需要大量提示 → 错。Opus 4.6 和 GPT 5.4 等模型已经非常强大,它们能从代码库中推断出技术栈、框架、约定等信息,不需要你反复告知。

  3. 误区:发现工作流后应该立刻写 Skill → 错。跳过「教 Agent 做」和「成功运行」这两步,写出来的 Skill 缺乏关键上下文,执行效果会很差。

  4. 误区:Skill 写完就不用管了 → 错。Skill 需要通过递归优化不断完善——使用、出错、修复、更新,这个循环至少要做 3-5 轮。

  5. 误区:下载 Skills 市场的热门 Skill 能快速提高生产力 → 错。别人的 Skill 基于别人的工作流构建,你的 Agent 没有那个成功运行的上下文,效果会大打折扣。而且还有安全风险。

  6. 误区:Sub-agents 越多越好,系统越复杂越强大 → 错。没有经过充分 Skill 积累就拆分 Sub-agents,只是「Scale for what looks cool, not for productivity」。

  7. 误区:AI Agent 出错说明技术不成熟 → 错。Agent 出错是正常的,关键是你如何利用这些错误来优化 Skill。Ross Mike 的报告生成器 Skill 经历了 5 轮优化才达到完美。

  8. 误区:模型能「理解」你的意图 → 错。LLM 本质上是 Token 预测器,它在向量空间中寻找最近匹配。它不理解,只是预测。这就是为什么上下文的质量比数量更重要。

  9. 误区:用现成的 Agent 框架(如 Paper Claw)比自己搭建更高效 → 不一定。现成框架能快速上手,但花 2-3 周从零构建适合自己需求的系统,长期生产力会更高。

  10. 误区:非技术人员无法从 Agent 构建中受益 → 错。Ross Mike 明确说这期内容「Anyone can watch this」,Agent 和 Skills 的构建方法论不依赖编程能力,适用于任何重复性工作流。


关键要点

  1. 模型已经足够好:Opus 4.6 和 GPT 5.4 等模型在编程和白领工作方面表现出色,差异化竞争已经不在模型层面,而在上下文管理和 Harness 层面。

  2. 95% 的人不需要 agent.md:除非你有每次对话都必须引用的专有信息,否则 agent.md 就是在浪费 Token——模型能从代码库中推断出绝大多数技术信息。

  3. Skills 利用渐进式披露节省 Token:同样的内容,放在 agent.md 中每轮消耗 944 个 Token,放在 Skill 中只消耗 53 个 Token(仅名称和描述),节省 18 倍。

  4. 创建 Skill 的正确流程:识别工作流 → 手把手教 Agent → 完成成功运行 → 让 AI 回顾并创建 Skill。不要跳步。

  5. 递归式 Skill 优化是关键:使用 Skill → 遇到错误 → 诊断并修复 → 更新 Skill。Ross Mike 的 8 数据源报告生成器经过 5 轮优化后达到了完美执行。

  6. 不要下载别人的 Skills:既有安全风险(攻击向量),也缺乏你的工作流上下文。可以参考别人的思路,但必须自己从零构建。

  7. 从一个 Agent 开始,逐步扩展:先用单个 Agent 跑通所有核心工作流并积累 Skills,再按领域拆分 Sub-agents。Ross Mike 自己只有 5 个 Sub-agents(Marketing、Business、Personal 等)。

  8. 上下文窗口有性能上限:填充率超过 70-80% 后,模型表现明显下降。每一个不必要的 Token 都在拉低你的 Agent 性能。

  9. 代码本身就是上下文:随着模型能力提升,好的项目模板(Template)比详细的配置文件更有价值——模板为 Agent 提供了结构化的高质量上下文。

  10. 为生产力而扩展,不为炫酷而扩展:「Scale for productivity, not scale for what looks cool.」这是 Ross Mike 的核心哲学——每一步扩展都应该基于真实需求和经过验证的工作流。

  11. 理解 LLM 的本质:模型不会思考,它们是 Token 预测器。「It has no—it doesn’t think. It doesn’t understand. It feels like it understands.」这个认知决定了你对 Agent 的正确期望和使用方式。

  12. 掌握 Agent 构建技能是长期竞争力:在 AI 极度压缩知识获取成本的时代,知道如何构建高效 Agent、如何编写优质 Skills,是个人最重要的护城河。


结论

“Less is more. Rely more on the model’s strength, and what the model needs is what’s unique and special about you, your workflow, your business, not general knowledge.”

这期节目的核心信息出乎意料地简单:少即是多

不要往 agent.md 里堆砌模型已经知道的信息。不要下载别人的 Skills 来填充你的系统。不要一上来就搞 15 个 Sub-agents 的复杂架构。相反,从一个 Agent 开始,手把手教它你的工作流,把成功的经验固化为 Skills,让错误成为优化的燃料,一步一步地构建属于你自己的高效能系统。

模型会越来越强,但你的独特价值——你的工作流、你的品味、你的策略——永远只有你自己知道。把这些独特性编码成 Skills,你就拥有了别人无法复制的生产力优势。

正如 Ross Mike 所说,这不是一条性感的捷径,但这是一条真正通向生产力的路径。