频道:Greg Isenberg · 时长:1:04:40
| 项目 | 详情 |
|---|---|
| 频道 | Greg Isenberg |
| 视频ID | LWx4FGam2aQ |
| 视频标题 | Stop using Claude. Start using Codex? |
| 时长 | 1:04:40 |
| 发布日期 | 2026-04-27 |
| 嘉宾 | Riley Brown(AI 创业者、内容创作者) |
| 主题 | OpenAI Codex 深度使用指南:为何它可能是最强 AI agent 平台 |
| 关键词 | Codex, OpenAI, GPT-5.5, Claude Code, browser use, computer use, Remotion, skills, plugins, automations |
| 链接 | https://www.youtube.com/watch?v=LWx4FGam2aQ |
“Some of my smartest friends are saying OpenAI’s Codex is the super app for AI. They’re saying you pair that with GPT 5.5, Images 2.0, and use Codex’s interface, and you are going to be unstoppable.”
Greg Isenberg 的最聪明的朋友们都在说:Codex 是 AI 的超级应用。在这期节目中,Greg 坦诚自己从未下载过 Codex,而嘉宾 Riley Brown 则是 Codex 的深度用户——他团队的七位工程师全部切换到了 Codex。这不是一集理论探讨,而是一场从零到一的实战演示:如何创建项目、配置 skills、连接 Notion、用 Remotion 制作高质量视频、设置自动化工作流,以及为什么 Riley 认为 Codex 正在成为知识工作者的终极平台。
无论你是 Claude Code 的忠实用户、Cursor 的重度使用者,还是完全没接触过 AI agent 平台的新手,这篇教程都会帮你理解 Codex 的核心能力边界,以及它在当前 AI 工具生态中的真实定位。
“A good way to think about Codex is it is a state-of-the-art AI agent on your computer… in a nice interface that allows you to build an app, create any type of document, control your computer, and create automations.”
Riley 给出了一个精炼的定义:Codex = 顶级 AI agent + 优雅界面 + 全能创作。它不只是一个聊天窗口,而是:
很多人搞不清 Codex 和 ChatGPT 的区别。简单来说:
如果你有 ChatGPT 订阅,你已经有 Codex 的访问权限了。
Codex 的界面采用文件夹 + 聊天线程的组织方式:
New Chat 都会归入该项目Command + N 快速开启新聊天“Notice there wasn’t anything in this one and you can very easily just remove these from the side. So, it’s just like you have your folder and your chats within each folder, which is just a project.”
这种组织方式与 Claude Code 桌面版和新版 Cursor 非常相似——所有主流 AI 公司都在收敛到同一种界面范式:左侧文件夹/项目,中间 agent 对话,右侧预览输出。
Riley 列举了 Codex 相对于竞品的核心差异化:
1. Vibe coding + 知识工作合一
“It is the only interface that does vibe coding and knowledge work in one platform.”
2. 内置 browser use 速度更快
“This is the first time that I see it, I’m like, ‘Oh, it’s actually starting to be faster.’ And I could definitely see by the end of the year, these browser agents are going to be as fast as humans.”
Riley 用 Codex 让 AI 自己下棋来演示 browser use 的速度——AI 构建了一个棋盘游戏,然后通过浏览器操控自己的棋局,白棋执子将杀黑棋,全部一次提示完成。相比之前 Manus 等工具”像拨号上网”的体验,Codex 的 browser use 感觉是”宽带”。
3. 内置 Remotion 插件
Codex 有官方 Remotion 插件,可以在对话中直接 @remotion
调用,生成动效视频并在应用内预览,这是其他平台做不到的。
4. Computer use 更快、支持多应用并行
“Not only can it control your computer, it can control multiple of your apps at the same time, which is a mind-blowing experience and you can see the mouse moving around on your device.”
Riley 用 Codex 控制 Canva 完成了设计导出,然后把结果直接反馈回 Codex——这种跨应用的联动操控是当前最好的 computer use 体验。
Riley 对 Anthropic 将 Claude Code 和 Co-work 拆分为两个产品表达了明确的不满:
“Claude made a decision to split up Co-work and Claude Code. I would definitely try Claude more if they didn’t do this… You can’t just ask Co-work to build an app. You have to go to Claude Code to do that.”
他的核心观点是:代码工作和知识工作不应该被人为隔离。作为创业者,他的文档和网站是紧密相关的——他要做调研、写报告、再把报告转化成落地页,这些应该在同一个平台里无缝完成。
值得注意的是,Riley 并没有盲目推销 Codex:
“I don’t hate on anyone for using any stack. I think it’s kind of dumb to do that. I think you should pick a stack and you should stick with it. Moving from hot tool to hot tool is actually not the right strategy.”
选一个工具,深耕下去,比频繁切换更有效率。
Codex 中有两个看起来类似但机制不同的概念:
| 特征 | Plugins | Skills |
|---|---|---|
| 创建方式 | 需要 OpenAI 官方审批 | 用户自行创建 |
| 调用方式 | 用 @ 提及(如 @remotion) |
用 / 调用(如 /image) |
| 本质 | 官方深度集成 | 文件夹 + skill.md 指令文件 |
| 示例 | Slack, Notion, Remotion, Canva, Expo | YouTube Researcher, Internet Image Puller |
“Honestly, I think plugins are just like a deeper integration… If you’re a company and you want to create an official plugin, you go to OpenAI and you create it with them.”
Riley 坦承这个体系有点混乱——plugins 用 @ 调用,skills 用
/ 调用,两者在 UI 上分属不同
tab,对新用户来说确实让人困惑。但他也说:
“I will say I’ve tried all of these tools. This is the simplest version that exists yet.”
Riley 展示了他常用的几个 plugins:
@remotion
直接生成动效视频创建 skill 非常简单——直接在聊天中说”我想创建一个 skill,它能做XX”即可:
“Any repetitive task that you have in Codex, say, ‘Hey, I want to create a skill so we can do this faster next time.’ And then the AI will be like, ‘Okay, cool,’ it may ask you some follow-up questions, and then it’ll just create the skill.”
每个 skill 本质上是一个文件夹,里面有一个 skill.md 文件包含具体指令。AI 非常擅长创建这类结构化指令。
Riley 展示的两个实用自定义 skill:
“Remotion turns code into videos. So, you can create motion graphic videos with code. Well, guess what? Lucky for you, AI will write all that code.”
Remotion 是一个将代码转化为视频的框架。在 Codex 中:
@remotion 描述你想要的视频Riley 分享了一个高效工作流:
brand assets
文件夹中“Once you’ve generated a video with all of your brand assets, you can just reference that to your AI… And you don’t have to manually tell it what to do. It’ll just pull all of that information.”
“I know multiple people who’ve gone from zero to 100,000 Instagram followers by doing Remotion videos.”
Riley 展示了一个获得近 80 万次播放的 Remotion 生成视频。他强调:这不是一次提示就完美的——需要反复迭代——但效果确实是专业级的。Anthropic 自己的产品发布视频最初也是用 Remotion 制作的。
Riley 演示了一个完整的自动化设置过程:
“Do it once and then tell the agent to do that every time on this day. And that’s kind of a good workflow.”
先做一次,确认效果,再自动化 ——这是 Riley 推荐的最佳实践。
Riley 反复强调一个核心原则——给 AI 好的示例比给它好的指令更有效:
“Really good instructions are good, but giving it a really good example is great. You give an AI one good example, it’s amazing. You give it five good examples, it’s just going to do a great job every time.”
建议做法:
GPT-5.5 是 Codex 当前使用的主力模型,Riley 对其评价很高:
“If you ask it to make a simple change and you use extra high, it’ll often really try and put a ton of effort into it and it might go off and do unintended things.”
关键信息:
Codex 提供了不同的 effort 等级(low / medium / high / extra high / fast):
“A lot of people have been talking about how they like to use 5.5 on low and medium effort for most tasks… If you ask it to make a simple change and you use extra high, it’ll often really try and put a ton of effort into it.”
这是很多人不知道的功能:
“Command J opens the terminal. Type Claude. Congratulations, you’re using Claude Code inside Codex.”
Riley 的工作流:用 GPT-5.5 构建应用,用 Claude Code 优化设计。
“People say, ‘Oh, but Claude’s way better at design.’ So it’s like just make the whole app and then tell Claude to design it.”
他还提到自己设置了 dangerously skip permissions 模式让
Claude Code 自动运行——这当然有安全风险,但对于开发效率来说非常高效。
“It basically watches your screen for context, so you don’t have to explain yourself again. It just kind of knows what you’re working on.”
Chronicle 是 Codex 刚发布两天的新功能:
“By no means am I telling you to do this and that it’s worth the risk. I’ve no idea what the risk is.”
Riley 透露了几个 Codex 的发展方向(基于他与 OpenAI 内部人士的交流):
“Pretty soon we’ll live in a world where an AI will be able to go to any site, open the browser, you’re going to be logged in, so it’ll have all of your login information. It’ll be a full browser like Atlas and it will be able to take any action.”
“Most of my workflows as a creator… a lot of my workflows require using an interface or using a tool like CapCut, like Canva, and AI will pretty soon get to a point where it can do that.”
Riley 建议现在就开始录制你的工作流程——Meta 和 Microsoft 已经要求员工录屏执行特定任务。虽然这在公司层面引发了”被替代”的焦虑,但对小团队和创业者来说,这是将自己的专业知识转化为可复用 AI 能力的绝佳机会。
Riley 在节目最后给出了明确的入门路径:
“Make a game and have browser use play a game against itself. Just use the browser use, test it.”
“You can literally download the code to your web app or website, upload it and say, ‘Hey, I want you to build a mobile app in Swift.’ It can one-shot mobile apps. Like full mobile apps.”
“List out all of the things that you do on a day-to-day basis, pick the most annoying thing that you do every day, and then try and do it with computer use, or just try to create a workflow that accomplishes it… then tell your agent to turn it into an automation.”
“If you can create one useful automation in a couple of hours, that might be worth it.”
| 概念 | 定义 |
|---|---|
| Codex | OpenAI 推出的 AI agent 超级应用,集代码、文档、浏览器控制、自动化于一体 |
| Skills | 用户自建的可复用指令集,本质是文件夹 + skill.md 文件 |
| Plugins | OpenAI 官方审批的深度集成,如 Slack、Notion、Remotion |
| Remotion | 将代码转化为动效视频的框架,Codex 有官方插件支持 |
| Browser Use | AI 直接控制浏览器执行操作(点击、输入、导航等) |
| Computer Use | AI 控制桌面上的多个应用程序,可见鼠标移动轨迹 |
| Chronicle | Codex 的屏幕上下文记忆功能,自动记录你的工作状态 |
| Atlas | OpenAI 开发的浏览器技术,正在被整合进 Codex 成为内置全功能浏览器 |
| Automations | 定时重复执行的 AI 任务,可在 Automations tab 中管理 |
| Brand Assets | 预先收集的品牌资源(logo、颜色、字体),供 AI 生成内容时使用 |
| Effort Level | Codex 中控制 AI 投入程度的设置:low / medium / high / extra high / fast |
| Annotations | 在 Codex 浏览器预览中直接标注修改意见,类似 Cursor 的 comment 功能 |
先玩后用:拿到新 AI 工具后,花 30-60 分钟做有趣的项目(游戏、模拟器),再切入正事。直接追求生产力往往适得其反。
示例 > 指令:一个好示例胜过一段长指令。给 AI 五个高质量示例,它几乎每次都能产出满意结果。把好的输出存进 Notion 数据库作为参考。
先做一次,再自动化:不要一上来就设置 automation。先手动跑一遍任务,确认效果,再说”每周五上午 9 点重复执行”。
用 Claude Code 补设计短板:在 Codex 里按
Command + J 打开终端,输入 claude 即可使用
Claude Code。用 GPT-5.5 构建功能,用 Claude 优化视觉设计。
控制 effort level:简单修改用 low/medium,复杂任务用 high/extra high。Effort 太高时 AI 可能过度发挥,产生意料之外的改动。
用 brand assets 文件夹统一品牌素材:提前收集 logo、颜色、字体,存入一个文件夹。生成视频或设计时告诉 AI “请使用 brand assets 中的 X”。
口述 20 分钟记录你的日常:对着手机说出每天做的所有事,不跳过细节。生成文本后,逐条评估哪些可以用 AI 自动化。
利用 Notion 细粒度权限:连接 Notion plugin 时,可以只给 AI 访问特定数据库的权限,不必暴露全部工作区。
误区:Codex 和 ChatGPT 是一回事 → 错。ChatGPT 是对话工具,Codex 是 AI agent 平台。你在 Codex 中可以构建应用、控制浏览器、创建自动化——这些 ChatGPT 做不到。
误区:用 Codex 就不能用 Claude 了 → 错。Codex
内置终端,Command + J 打开后输入 claude
就能直接使用 Claude Code,两者完全兼容。
误区:应该频繁切换到最新最热的 AI 工具 → 错。Riley 明确建议”选一个 stack,坚持用下去”。频繁跳转反而会降低效率。
误区:Skills 和 plugins 是同一个东西 →
错。Plugins 是 OpenAI 官方审批的深度集成(用 @
调用),skills 是用户自建的指令集(用 /
调用),两者调用方式和管理位置都不同。
误区:AI agent 平台一上手就应该追求生产力 → 错。Riley 建议先花 30-60 分钟”玩”——做游戏、做模拟器,理解平台能力边界后再进入正式工作。
误区:给 AI 写越详细的指令越好 → 不完全对。一个好的示例比一页指令更有效。如果你能给 AI 五个高质量示例,它的表现会远超只有详细指令的情况。
误区:GPT-5.5 贵就意味着用起来更费钱 → 不一定。5.5 虽然 API 价格是 5.4 的两倍,但它更高效——用更少的 token 完成更好的结果,实际任务成本可能更低。在 Codex 平台内使用还享受大量补贴 token。
误区:Chronicle 功能值得所有人立即开启 → 错。Chronicle 有明确的隐私风险,Riley 自己也说”这是工作电脑,我爱测试一切”。普通用户应该先了解风险再决定。
误区:Effort level 越高越好 → 错。简单任务用 extra high effort,AI 会过度思考、做出不必要的改动。日常修改用 low/medium 更高效。
误区:Browser use 还太慢,没有实用价值 → 过时的认知。最新版 Codex 的 browser use 速度已经从”拨号上网”进化到”宽带”,Riley 预计 3 个月内将达到人类操作速度。
Codex 是目前唯一将 vibe coding 和知识工作(文档、PPT、电子表格)统一在同一界面中的 AI 平台,Claude Desktop 将两者拆分成了 Claude Code 和 Co-work。
有 ChatGPT 订阅就有 Codex 访问权限。Codex 的订阅模式($100-200/月)包含大量补贴 token,比通过 API 使用 GPT-5.5 划算得多。
Skills 是可复用的自定义指令集,本质是一个文件夹加一个 skill.md 文件。任何重复性任务都应该被封装成 skill。
Remotion 插件让 Codex 可以直接生成专业级动效视频,Anthropic 自己的产品发布视频最初就是用 Remotion 制作的。配合 brand assets 文件夹,可以一次提示生成带品牌标识的视频。
Computer use 已经可以同时控制多个桌面应用,Riley 演示了 AI 控制 Canva 导出文档并反馈回 Codex 的完整工作流。
Browser use 的速度正在快速提升。Codex 内置的 Atlas 浏览器将发展为支持持久登录的全功能浏览器,预计 3 个月内 AI 的浏览器操控速度将达到人类水平。
GPT-5.5 比 GPT-5.4 API 价格贵一倍,比 Opus 4.7 贵 20%,但因为 token 效率更高,在复杂任务上实际成本可能更低。
在 Codex 内可以直接使用 Claude
Code(Command + J 打开终端),形成”GPT-5.5
构建功能 + Claude 优化设计”的互补工作流。
Automation 的最佳实践是”先做一次再自动化”——手动执行确认效果后,告诉 AI 将其转为定时任务。可以在 Automations tab 中测试和编辑。
Chronicle 功能可以让 AI 记住你的工作上下文,但存在隐私风险。Riley 建议在充分了解风险后再决定是否启用。
录制工作流的价值正在上升。未来 Codex 将支持上传视频让 AI 观看并学习复制操作,Meta 和 Microsoft 已经在要求员工录屏。
成功使用 AI 工具的关键心态是”不怕看起来很蠢”。Greg 引用旧金山创业圈的经验:赢家不是最聪明的人,而是敢于反复试错、深入兔子洞的 tinkerer。
“I think all of the magic in AI happens in these rabbit holes and then once you find something, just go all in on it.”
这期节目的核心信息非常清晰:AI 工具的竞争正在从”谁的模型更强”转向”谁的平台体验更好”。Codex 试图成为知识工作者的终极入口——写代码、做文档、控制浏览器、自动化工作流,全部在一个窗口里完成。
Riley 并没有说你必须放弃 Claude Code 或 Cursor——他明确说”选一个工具,坚持下去”。但他的实际行动很说明问题:七人团队全部切换到 Codex,然后在 Codex 内部按需调用 Claude Code。这种”超级应用 + 专业工具”的组合方式,可能是当前最务实的 AI 工作流架构。
无论你最终选择哪个平台,这期节目的真正价值在于 Riley 的那句话:先玩 30 分钟,再干正事。理解一个 AI 工具的能力边界,不靠读文章,不靠看视频——你得自己动手,钻进兔子洞里去。