Codex 进了你的口袋:OpenAI 把 AI Agent 的战场搬到了手机上

2026 年 5 月 14 日,OpenAI 做了一件看似不起眼但意味深长的事——把 Codex 塞进了 ChatGPT 手机 App。iOS 和安卓同步开启 preview,所有用户都能用,包括免费版和最低价的 Go 套餐。
注意措辞:所有用户。免费版也行。这不是某个 Pro 专属的高级功能,这是 OpenAI 在给 400 万周活用户铺一条新的使用路径。
先搞清楚:不是在手机上写代码
这个更新的本质不是「手机编程」。你的手机屏幕太小,键盘太难受,没有人真的想在手机上写代码。
真正干活的 Codex 还是跑在你的笔记本、Mac mini 或者 devbox 上。手机只是一个远程窗口。
具体来说,你能用手机做这些事:
- 查看进度。地铁上打开手机,看到 Codex 跑到哪一步了——它在读什么文件、跑了什么测试、改了什么代码
- 审查 diff。Codex 改完代码,你直接在手机上看 diff,绿色红色一目了然
- 批准操作。Codex 要执行一条命令?手机上点一下 Approve 就行
- 换个方向。发现它走偏了?直接在手机上告诉它换条路
- 起个新任务。等咖啡的时候,想到一个 bug,直接给 Codex 下指令
文件、凭证、权限全都留在原来那台机器上,不上传到手机。这不是远程桌面,不是 VNC——它更像是你从手机上伸了一只手过去,拍了拍 Codex 的肩膀说「往这边走」。
安全中继:不暴露在公网上的连接
技术上怎么实现的?OpenAI 说底层走了一层 secure relay(安全中继)。
简单说:你的手机不直接连你的电脑。两边都连到 OpenAI 的中继服务器上,中继负责把状态、上下文、审批请求实时同步过来。你的机器不暴露在公网上,手机也不直接访问你的文件系统。
你在哪台设备登录 ChatGPT,会话状态和上下文就跟到哪里。
这个设计有一个隐藏的好处:跨设备无缝切换。在电脑上给 Codex 下了一个任务,出门了,手机上继续跟进。回家打开电脑,状态完全同步。不需要额外配置,不需要记住 IP 地址,不需要开端口映射。
为什么是现在:400 万周活用户背后的焦虑
OpenAI 自己公布的数字:Codex 每周活跃用户已经超过 400 万。
400 万。这个数字比今年年初涨了 8 倍。但问题也来了——当 Agent 越来越多地跑长任务,几十分钟甚至几小时的那种,人坐在电脑前盯着就很傻。
想象一下这个场景:你让 Codex 重构一个模块,预计要跑 20 分钟。你有两个选择:A,坐在电脑前盯着终端输出发呆;B,出去买杯咖啡,回来再看结果。
以前只有选 A,因为你必须守在电脑前等审批请求。现在有了手机端,你可以选 B 了——甚至你在买咖啡的时候就能审一眼 diff,点一下 Approve,回来它已经跑完了。
这不是一个功能更新,这是 AI Agent 使用方式的范式转变。 从「人守着机器」变成「人带着手机,机器自己干」。
「超级 App」的拼图又多了一块
注意一个细节:OpenAI 没给 Codex 单独做手机 App,而是塞进了 ChatGPT 主 App。
这不是偷懒。这是战略。
桌面端有独立的 Codex App,但手机端直接合并进 ChatGPT。这意味着什么?意味着 OpenAI 在做一件事——把 ChatGPT 变成一个「超级 App」。ChatGPT 负责对话,Codex 负责干活,Atlas 浏览器负责上网,全部统一到一个入口。
对用户来说,少装一个 App;对 OpenAI 来说,多了一个让用户留在 ChatGPT 里的理由。日活、时长、粘性——全都往 ChatGPT 主 App 里收。
这种打法不新鲜。微信做过同样的事:从一个聊天工具,慢慢长出支付、小程序、公众号、视频号。每个功能单独看都不大,但拼在一起就是一个操作系统级别的入口。
OpenAI 在走同一条路。
和 Claude Code 的对决
说到手机远程控制 AI Agent,绕不开 Anthropic。
Claude Code 从去年秋天起就支持手机远程查看和介入正在跑的任务。后面的 Cowork 配合移动端走的也是类似的 dispatch 思路——你不需要时刻守在终端前,AI 干活你拍板。
OpenAI 这次算是追上了。但不止是追平——Codex 把覆盖范围扩到了 devbox 和远程企业环境,支持 Remote SSH 接入。这意味着你不仅能连自己的笔记本,还能连公司的开发服务器、CI 环境、甚至 HIPAA 合规的医疗环境。
| 能力 | Codex Mobile | Claude Code Mobile |
|---|---|---|
| 手机查看任务进度 | ✅ | ✅ |
| 审查 diff 和测试结果 | ✅ | ✅ |
| 远程批准操作 | ✅ | ✅ |
| 连接 devbox | ✅ | ✅ |
| 连接 macOS | ✅ | ✅ |
| 连接 Windows | 🔄 即将支持 | ✅ |
| Remote SSH | ✅ | ✅ |
| 免费 Plan 可用 | ✅ | ❌ |
| HIPAA 合规 | ✅ 企业版 | ❌ |
| 合并进主 App | ✅ | ❌ 独立 |
一个有意思的对比:Claude Code 的手机端是独立入口,Codex 的手机端嵌在 ChatGPT 里。两种做法各有取舍——独立入口功能更聚焦,合并入口流量更大、获客成本更低。
还有一个关键差异:Codex 手机端目前只能连 macOS。Windows 支持据说「很快」。如果你是 Windows 用户,还得再等等。
企业级更新:不止是手机
和手机端一起发布的,还有几个面向企业用户的更新:
- Programmatic access tokens:可以从 ChatGPT workspace 设置里直接生成 scoped 凭证,用在 CI pipeline、发布流程、内部自动化里。不用再手动管理 API key 了
- Hooks 正式 GA:可以用来扫描 prompt 里的敏感信息、跑验证器、记录对话、创建记忆、或者为特定仓库定制 Codex 行为
- HIPAA 合规:企业版用户在本地环境(CLI、IDE、App)使用 Codex 时,满足 HIPAA 要求。这对医疗行业的团队来说是刚需
这些更新放在一起看,OpenAI 的意图很明显:不只是让个人开发者用得爽,要让整个团队、整个企业把 Codex 嵌进工作流里。
手机端是「人在外面也能干活」的解决方案,Programmatic tokens 和 Hooks 是「机器也能调用 Codex」的解决方案。人和机器两条路都通了。
一个做产品的人怎么看这件事
说实话,这件事让我最兴奋的不是技术本身,而是它背后的产品逻辑。
第一,AI Agent 的使用场景正在从「坐在电脑前」扩展到「任何时刻」。 以前用 AI Agent 是一个需要专门腾出时间、坐在电脑前做的事情。现在它可以嵌入你的碎片时间——等电梯的时候审个 diff,坐地铁的时候起个任务。使用频率会指数级上升。
第二,「不传文件」是一个正确的产品决策。 很多人第一反应可能是:为什么不在手机上也能直接编辑代码?因为你不需要。代码编辑在手机上是伪需求。你需要的是「决策权」——看一眼,拍个板,或者换个方向。这才是手机真正适合做的事。
第三,免费用户也能用,这是在扩盘。 不是收割存量用户,而是让没用过 Codex 的人有一个零成本的入口试试看。先拉人进来,再靠 Pro 订阅变现。标准的漏斗模型。
局限
不是所有东西都完美:
- 只支持 macOS。Windows 用户还得等。这个时间差对 Anthropic 来说是一个窗口期
- Preview 阶段。功能可能不稳定,体验可能有粗糙的地方
- 依赖 ChatGPT App。如果你不想装 ChatGPT(虽然概率很低),就没有其他入口
- 欧盟和英国。Codex 的某些功能在部分地区的可用性仍然受限
接下来会怎样
OpenAI 的路线图越来越清晰了:
- Codex 多端覆盖:Mac ✅ → Windows ✅ → Chrome ✅ → 手机 ✅ → 下一步可能是 CarPlay、Apple Watch?
- ChatGPT 「超级 App」:对话 + 编程 + 浏览 + 视频生成,一个入口全搞定
- 企业渗透:Programmatic tokens + Hooks + HIPAA,把 Codex 从个人工具变成团队基础设施
回到现在这个时间点——Codex 进手机看起来只是一个小更新。但站在更高的维度看:AI Agent 正在从「你坐在电脑前用的工具」变成「无处不在的协作伙伴」。
手机是第二步。下一步可能是你身边的所有屏幕。
发布日期:2026-05-15信息来源:OpenAI 官方博客、宝玉 xp 推文、The Verge、9to5Mac、Thurrott、TechCrunch、Android Authority
