Hermes Agent 完全指南 —— 比 Open Claw 更强的个人 AI 代理

频道:Greg Isenberg · 时长:37:00

📺 Greg Isenberg ⏱ 37:00 🗓 2026-05-19

视频信息

项目 详情
频道 Greg Isenberg
视频标题 Hermes Agent: The New OpenClaw?
视频ID Qn2c_U-cWQs
时长 37:00
发布日期 2026-04-20
嘉宾 Imran(AI 代理专家,Alif 基金工作)
主题 个人 AI 代理 / Hermes Agent 安装与实战
难度 ⭐⭐⭐(需要终端基础,但讲解非常清晰)
字幕说明 ⚠️ 本教程基于英文 YouTube 自动字幕转录生成

引言

“Hermes agent, you’re seeing it everywhere. People are calling it the open claw killer.”

如果你在社交媒体上关注 AI 代理这个领域,最近一定被 Hermes Agent 刷屏了。它被很多人称为”Open Claw 杀手”。但到底是真的好用还是纯粹的炒作?

本期节目中,Greg Isenberg 邀请了他的朋友 Imran 来做一次完整的 Hermes Agent 实战教学。Imran 之前用过 Open Claw,踩了不少坑,最终迁移到 Hermes Agent 并持续使用了超过三周——在这个领域,三周已经算是很长时间了。他不仅展示了如何安装 Hermes Agent,还演示了如何将其与 G Stack、Obsidian 连接,如何创建自定义 Skills,甚至如何在 Android 手机上运行它。

这是一份从零开始的完整指南。如果你正在犹豫要不要从 Open Claw 切换过来,或者你想从零开始搭建自己的个人 AI 代理,这篇教程就是你需要的。


第一阶段:为什么要从 Open Claw 迁移到 Hermes Agent?

在讲安装之前,Imran 首先解释了他为什么放弃 Open Claw。他在使用 Open Claw 时遇到了三个严重问题,而这三个问题恰好就是 Hermes Agent 的核心优势所在。

问题一:没有内置记忆系统

“I kept having to tell it to do the same things over and over again because there was no built-in memory system.”

Open Claw 最让人崩溃的一点,就是你每次都得重复告诉它同样的事情。它不记得你之前的偏好、你的工作流程、你常用的 API Key。

Hermes Agent 的解决方案:内置记忆系统。每次你成功完成一个任务,它会自动写入自己的记忆。随着时间推移,它会越来越了解你。而且它使用标准的 SQLite 数据库,能够实时搜索之前所有成功完成的任务日志。

“Even things like API keys. If you forget to save them to an environment variable, but you kind of passed it to the agent, it can actually search through and find it for you.”

问题二:网关不断崩溃

“There was a day where I had to restart the gateway once an hour.”

Imran 提到有一天他每小时都得重启一次 Open Claw 的网关。这意味着他花在”维护工具”上的时间比”用工具干活”的时间还多。

Hermes Agent 的解决方案:更加稳定。Imran 表示他已经超过一周没有重启过 Hermes Agent 了。

问题三:Token 消耗不透明

“It was eating up tokens and I had no visibility into how or why.”

Open Claw 会大量消耗 Token,但你完全不知道它在哪里、为什么消耗了这么多。

Hermes Agent 的解决方案:通过 Open Router 等路由器,你可以清楚地看到每个模型的输入/输出价格,精确控制成本。


第二阶段:安装与基础配置

安装步骤(Mac / Linux / WSL)

安装过程非常简单。前往 Hermes Agent 官方文档网站,只需要一行命令即可完成安装。

前置条件:如果你是 Mac 用户且第一次安装这类工具,需要先安装 Xcode 开发者工具:

xcode-select --install

安装完 Hermes Agent 后,在终端输入 hermes 即可启动。

40+ 内置工具,开箱即用

“Hermes comes built-in with 40 plus built-in tools that open claw doesn’t have. So, you don’t have to go find out which tools to install.”

这是 Hermes Agent 和 Open Claw 的一个重要区别——你不需要到处去找工具然后一个个安装。Hermes Agent 内置了 40 多个工具,覆盖了绝大多数日常任务需求:

如果你用的是 MacBook,所有 Apple 生态的技能都已经预装好了,不需要从技能商店下载。

选择模型与控制成本

输入 hermes model 命令,你可以看到所有可用的模型提供商。核心省钱策略是使用 Open RouterPortal 作为路由器。

“By just switching to Hermes agent and open router, I basically got my token spend down from like about 130 dollars every 5 days down to like maybe 10 bucks every 5 days. So, about like a little bit over a 90% reduction.”

通过 Open Router,你可以: - 查看每个模型的精确价格(输入/输出 Token 单价) - 使用免费模型(如 Nvidia Neumotron 有时会免费开放) - 使用 Anthropic 的模型(Sonnet 等) - 使用性价比极高的模型(如 Qwen 3.6+,输入成本仅为 Sonnet 的十分之一)

成本对比:Imran 从 Open Claw 切换到 Hermes Agent + Open Router 后,5 天的 Token 花费从 130 美元降到了约 10 美元,降幅超过 90%。


第三阶段:安全与部署方式

安全审计

“You can always ask the agent to do an audit of your security setup, which a lot of people don’t think about.”

一个很多人忽略的功能:你可以直接让 Hermes Agent 审计你的安全配置。它知道密钥存储在哪里,会检查: - 是否有密钥以明文方式暴露 - 防火墙配置是否合理 - 整体安全设置是否存在漏洞

这是一种”元提示”(meta-prompting)的思路——用 AI 来检查 AI 自身的安全性。

三种运行方式

  1. 裸机运行(Bare Metal):直接在你的电脑上运行,最简单但风险最高。Imran 自己用的就是这种方式。
  2. Docker 容器:在你的机器上运行,但与其他文件隔离,更安全。
  3. Modal 无服务器部署:作为云端服务运行。

远程访问建议


第四阶段:在 Android 手机上运行 Hermes Agent

这是本期节目最令人兴奋的部分之一。Imran 成功地在一台 Solana Seeker Android 手机上部署了 Hermes Agent。

为什么要在手机上运行?

“You can imagine a world where instead of having this running on a Mac Mini, which is like sold out, you can have it running on an Android phone.”

Android 手机比 Mac Mini 便宜得多,而且: - 可以插 SIM 卡,随身携带 - 可以读取短信(自动处理双因素验证) - 低功耗、始终在线 - 相当于一个专用的 AI 代理设备

安装步骤

  1. 安装 Termux(Android 上的终端模拟器)
  2. 安装 Termux API(可从 F-Droid 开源应用商店获取)
  3. 使用与电脑端相同的安装脚本

Termux API 的强大之处

Termux API 让你的 AI 代理能够访问手机的所有传感器和功能: - 电池状态 - Wi-Fi 网络切换 - 音量调节 - 拍照 - 屏幕亮度 - 振动马达 - 屏幕点击操作

商业应用场景:社交媒体自动化

“Instead of having to literally open up your phone and download a video that’s generated and post it that way, you can have this technically running on an almost infinitely scalable amount of Android phones.”

核心思路:很多社交媒体排期工具会降低你的触达率(因为它们通过 API 发布而非直接从设备发布)。而 Hermes Agent 运行在真实的 Android 设备上,直接通过设备本身发布内容,显示真实的 MAC 地址,不会被平台降权。

理论上,你可以在多台 Android 手机上规模化运行这套系统。


第五阶段:个人生活自动化——从邮件管理到食谱推荐

邮件自动分拣

“I have an email triaging agent that every morning goes through my emails, deletes the ones that are unnecessary, unsubscribes from things that I subscribed to that are really useless, and then shows me a digest of the important emails.”

Imran 设置了一个每天早上自动运行的邮件分拣代理: - 删除无用邮件 - 自动退订垃圾邮件 - 生成重要邮件摘要

这个功能每天为他节省 30 分钟到一小时。

食谱推荐——解决”今天吃什么”的难题

“I sent a long like 8-minute Telegram voice message of me going through my fridge and my pantry, every single ingredient that’s in my pantry. And I said every day, can you send me three recipes based on what’s in my pantry and what my fitness goals are?”

Imran 的做法很有创意: 1. 在手机上设置本地语音转文字模型 2. 用 Telegram 发了一条 8 分钟的语音消息,逐一描述冰箱和储物柜里的所有食材 3. 让代理每天根据现有食材和健身目标推荐三个食谱

看似小事,但大大减轻了日常决策的心理负担。

如何审计自己的生活

“You can ask Hermes agent to audit your life and start asking you questions to help you.”

你可以让 Hermes Agent 分析你的日常行为,找出可以自动化的部分。比如问它: - “我把大部分时间花在哪里?” - “我一直在拖延什么?” - “今天最重要的事情是什么?”

因为它有记忆功能,随着使用时间增长,它的回答会越来越精准。


第六阶段:Agent 架构设计——一个还是多个?

推荐方案:个人 + 工作,两个代理

“I actually think the most optimal way to do it is to have one set up or two. And the only reason why I say two is if you have one for work and one for personal stuff.”

Imran 自己有四个代理(都以《布偶大电影》角色命名),但他认为对大多数人来说,两个就够了: - 一个用于个人生活:邮件、食谱、日程、健身等 - 一个用于工作:尤其如果你在大公司工作,公司可能不允许你在工作电脑上运行包含个人信息的代理

Cron Job vs Sub-Agent

Imran 目前使用 Cron Job(定时任务)而非 Sub-Agent(子代理)来管理不同的自动化任务。两种方式各有优劣:

Cron Job 方式: - 设置更简单 - 直接定时执行

Sub-Agent 方式: - 可以为每个子代理分配不同的模型(简单任务用便宜模型) - 可以添加更具体的指令 - 进一步节省成本

“The thing that we can agree on is that having an agent that has memory and learns over time is incredibly powerful.”

不论哪种方式,核心共识是:一个有记忆、能随时间学习的代理,威力是巨大的。

代码化重复任务以节省 Token

“Instead of requiring an agent in the loop every single time that you need to do something, you can actually write the code to make it more deterministic.”

一个非常聪明的省钱策略:对于你确定会反复执行的任务,让代理第一次帮你把代码写好,之后就不需要代理介入了。这样可以: - 用免费模型来写代码 - 之后执行时零 Token 消耗 - 结果更确定(deterministic)

这来自软件工程中”Don’t Repeat Yourself”(DRY)的原则。


第七阶段:Obsidian 整合——打造你的个人知识中枢

为什么是 Obsidian?

“The cool thing about Obsidian is that even if you have multiple agents, it’s all markdown files. So now instead of having to know markdown, you can just tell agents to organize them.”

Imran 之前一直用 Apple Notes,直到他发现 Obsidian 与 AI 代理的组合简直天作之合: - Obsidian 的文件都是 Markdown 格式,代理可以轻松读写 - 多个代理可以共享同一个 Obsidian 知识库 - 你不需要懂 Markdown,告诉代理怎么整理就行

Imran 的 Obsidian 实战

他的 Obsidian 知识库由 Hermes Agent 每天自动维护,包括: - 本周重要事项 - 今日待办 - 即将到来的差旅 - 工作相关任务 - 个人事务

“I would not have been able to go through the painstaking effort of putting this together by myself every single morning. But now I have an agent that does it for me.”

从零搭建 Obsidian 知识库需要多久?

“I think it takes building up the habit of using, of default going to the agent to get work done even if you can do it yourself. That’s the biggest thing.”

Imran 的 Obsidian 知识库是在使用 Hermes Agent 约 20 天后由代理自动搭建的。但他认为核心不在于时间,而在于习惯——你需要养成”默认先找代理”的习惯,哪怕这件事你自己也能做。

大约 7 天的持续使用后,Hermes Agent 就能了解你足够多的信息,然后你可以让它创建类似的 Obsidian 知识库。

为什么 Obsidian 比 Telegram 更适合查看信息?

“If you look at Telegram, some of these just kind of read as massive walls of text… it just becomes really unruly and it’s hard to find the most important information.”

Telegram 中的代理回复往往是大段文字墙,很难快速找到重点。Obsidian 的结构化布局让信息更清晰,而且可以同时在手机和电脑上查看。


第八阶段:Skills 系统与 G Stack

必装 Skills 推荐

  1. Obsidian Skill:最重要的 Skill 之一,即使你不用 Obsidian CLI
  2. Hancho Dev Memory Skill:扩展记忆容量,保持上下文尽可能小
  3. 自己构建的 Skills:围绕个人财务、健身、日常需求定制

G Stack:Y Combinator 的创业方法论

“G stack… was built for Claude Code and it was made by Garry Tan, the CEO of Y Combinator.”

G Stack 是 Y Combinator CEO Garry Tan 开发的一个 Skill,最初为 Claude Code 设计。它将 YC 的创业方法论开源成了一个可以加载到代理中的技能:

“Those types of things were previously only available to people who were in Y Combinator… but now a lot of that knowledge has been basically open sourced as a skill.”

如果你正在做创业项目,G Stack 是免费的,绝对值得安装。

ELIZA 心理咨询师——创意 Skill 示例

Imran 还展示了一个非常有创意的用法:他把维基百科上关于 Joseph Weizenbaum 的 ELIZA 程序(MIT 开发的自然语言处理心理咨询程序)的资料加载到 Hermes Agent 中,让它变成一个每日自我反思的工具。

“It took them 3 years to build out this natural language processing psychiatrist thing, but you can just drop this Wikipedia file inside of your Hermes agent and say turn this into a skill and it’ll do it.”

核心启示:你在浏览互联网的任何时候,都应该想一想——“这个东西能不能变成一个 Skill?”


核心概念速查表

概念 说明
Hermes Agent 开源个人 AI 代理,内置记忆系统、40+ 工具、预装常用 Skills
Open Claw 另一个个人 AI 代理工具,功能相似但缺乏记忆系统且不够稳定
Nebula 更适合作为 AI 协作同事使用的工具,而非个人化工作流
Open Router 模型路由器,支持多种 AI 模型,可查看价格、选择性价比最高的模型
Cron Job 定时任务,按预设的时间计划自动执行指定操作
Sub-Agent 子代理,可分配不同模型和指令,适合处理特定类型的任务
Skills Hermes Agent 的功能模块,可预装、自建或从社区获取
G Stack Garry Tan(YC CEO)开发的创业方法论 Skill,免费开源
Termux Android 上的终端模拟器,让手机能运行命令行工具
Termux API 扩展 Termux 功能的应用,提供手机传感器和硬件的访问接口
Tailscale 虚拟网络工具,让多台设备处于同一个安全网络中
Meta-prompting 用 AI 来审查和优化 AI 自身的配置和行为
SQLite Hermes Agent 使用的轻量级数据库,存储记忆和任务日志
Markdown Obsidian 使用的文本格式,AI 代理可以轻松读写
DRY 原则 “Don’t Repeat Yourself”,对重复任务写代码代替每次调用代理

实用技巧总结

  1. 用 Open Router 控制成本。 不同任务用不同模型——简单任务用便宜或免费模型,复杂任务才用高端模型。Token 花费可以降低 90% 以上。

  2. 重复任务写成代码。 如果一个任务你每天都在做(如生成日报、抓取数据),让代理第一次把代码写好,之后直接运行代码,不再消耗 Token。

  3. 每天晚上问代理一个关键问题。 “What is a tool that you can build me tonight that would make my life easier tomorrow?”——让代理主动为你发现可以自动化的事情。

  4. 从个人生活开始练手。 食谱推荐、邮件分拣、待办管理——这些是最容易上手的自动化场景,帮你建立”代理优先”的思维习惯。

  5. 用 Obsidian 而非 Telegram 查看信息。 Obsidian 的结构化 Markdown 布局远比 Telegram 的文字墙更容易找到关键信息,而且手机电脑同步。

  6. 定期让代理做安全审计。 直接问”Is this a secure setup? Tell me why or why not.”——让代理检查密钥暴露、防火墙配置等安全问题。

  7. 个人和工作分开两个代理。 避免隐私问题,也让每个代理的上下文更聚焦。

  8. 每天更新 Hermes Agent。 它仍然是 Beta 软件,频繁更新。Imran 有一次 9 天没更新就落后了 535 分钟的更新量。


常见误区

  1. 误区:Open Claw 和 Hermes Agent 差不多,没必要切换。 真相:Hermes Agent 的内置记忆系统、稳定性和成本控制能力是质的飞跃。Imran 从 Open Claw 切换后 Token 花费降低了 90%。

  2. 误区:安装好代理就算完成了。 真相:真正的价值在于持续使用。大约 7 天的日常使用后,代理才开始真正了解你,变得越来越有用。

  3. 误区:应该花大量时间定制和优化代理。 真相:“Customizing it is not the skill, but it’s more about what you get done with it.” 不要在配置上无限投入时间,尽快用起来才是关键。

  4. 误区:每个任务都应该让代理来处理。 真相:重复性任务应该写成代码(Cron Job),只在第一次用代理生成代码,之后让代码自动运行。这样既省 Token 又更可靠。

  5. 误区:个人 AI 代理需要很贵。 真相:通过 Open Router 选择合适的模型,每天只需几美元。免费模型也能完成很多基础任务。

  6. 误区:需要一台 Mac Mini 才能运行始终在线的代理。 真相:一台便宜的 Android 手机 + Termux 就可以做到,而且还能插 SIM 卡、访问传感器,功能更灵活。

  7. 误区:AI 代理只能帮忙写代码。 真相:邮件管理、食谱推荐、日程安排、安全审计、社交媒体发布——AI 代理可以自动化生活和工作中的几乎任何重复性任务。

  8. 误区:Skills 要从商店下载现成的。 真相:最有价值的 Skills 往往是你根据自己的需求自己构建的。看到任何有趣的概念(甚至一篇维基百科文章),都可以让代理把它变成一个 Skill。

  9. 误区:用 Telegram 和代理对话就够了。 真相:Telegram 的文字墙很难快速检索信息。配合 Obsidian 使用,让代理自动维护结构化的知识库,信息获取效率会大幅提升。

  10. 误区:代理会自动知道该为你做什么。 真相:目前你仍然需要”元提示”它——每天问”我在拖延什么?““有什么任务应该自动化?”“今天有什么重要的事情我遗漏了?”它需要你的引导才能发挥最大价值。


关键要点

  1. Hermes Agent 解决了 Open Claw 的三大痛点:内置记忆系统、运行稳定性、Token 成本透明。这不是微调,是架构层面的根本改进。

  2. 记忆系统是核心竞争力。Hermes Agent 每次成功完成任务都会自动写入记忆,使用 SQLite 数据库存储,能实时搜索历史任务日志。随着使用时间增长,它会真正”了解”你。

  3. 成本控制是可实现的。通过 Open Router 选择合适的模型,Token 花费可以从每 5 天 130 美元降至 10 美元——降幅超过 90%。

  4. 40+ 内置工具 + 预装 Skills = 开箱即用。不需要像 Open Claw 那样自己到处找工具安装,浏览器、定时任务、图像生成、Apple 生态集成全部预装。

  5. Android 手机可以成为低成本的 AI 代理专用设备。通过 Termux + Termux API,一台廉价 Android 手机就能替代 Mac Mini,还能访问手机传感器、插 SIM 卡、始终在线。

  6. Obsidian 是 AI 代理的最佳信息展示层。Markdown 格式让代理可以轻松读写,结构化布局比 Telegram 文字墙更适合快速检索信息。

  7. 重复任务应该代码化。让代理第一次写好代码,之后作为 Cron Job 自动执行。这是 DRY 原则在 AI 代理领域的应用——既省 Token 又更可靠。

  8. 从个人生活开始养成习惯。食谱推荐、邮件分拣这些简单场景是最好的练手项目。关键是养成”默认先找代理”的思维习惯,即使这件事你自己也能做。

  9. “元提示”是当前阶段的必修课。每天问代理关键问题:“我在拖延什么?”“今天最重要的事是什么?”“有什么任务可以自动化?”“你今晚能为我构建什么工具让明天更轻松?”

  10. 学会使用 AI 代理不是一项可选技能,而是即将成为一项基本要求。不论是 Hermes Agent、Open Claw 还是其他工具,核心在于你知道如何用它来为自己创造价值。

  11. 安全不能忽视。定期让代理审计自身安全配置,考虑使用 Docker 容器隔离运行,配合 Tailscale 进行安全的远程访问。

  12. G Stack 让 YC 的创业方法论触手可及。这个免费的 Skill 将 Y Combinator 的产品迭代框架开源了,任何做创业项目的人都应该试试。


结论

“Learning how to use Hermes agent is not actually the skill. It’s going to become a requirement.”

这句话或许是整期节目最重要的一句。Imran 不是在推销一个工具——他在描述一个正在发生的范式转移。个人 AI 代理正在从”极客玩具”变成”工作必需品”。

Hermes Agent 的真正价值不在于它比 Open Claw 多了几个功能,而在于它让”代理驱动的工作方式”变得足够简单、足够稳定、足够便宜,以至于任何人都可以真正用起来。

从今天开始,安装它,坚持用 7 天,让它了解你。然后你会发现:你花在重复性工作上的时间大幅减少,而你做出决策的质量反而提高了。正如 Imran 所说——因为有了代理处理背景工作,他能和更多创始人交流,获取更好的投资信号,最终为基金创造更大的回报。

这不是未来。这是现在。


本教程基于 Greg Isenberg YouTube 频道视频整理,视频ID:Qn2c_U-cWQs,时长 37:00。原始字幕为英文 YouTube 自动生成字幕。