Skip to content

Codex 进了你的口袋:OpenAI 把 AI Agent 的战场搬到了手机上

2026 年 5 月 14 日,OpenAI 做了一件看似不起眼但意味深长的事——把 Codex 塞进了 ChatGPT 手机 App。iOS 和安卓同步开启 preview,所有用户都能用,包括免费版和最低价的 Go 套餐。

注意措辞:所有用户。免费版也行。这不是某个 Pro 专属的高级功能,这是 OpenAI 在给 400 万周活用户铺一条新的使用路径。

先搞清楚:不是在手机上写代码

这个更新的本质不是「手机编程」。你的手机屏幕太小,键盘太难受,没有人真的想在手机上写代码。

真正干活的 Codex 还是跑在你的笔记本、Mac mini 或者 devbox 上。手机只是一个远程窗口。

具体来说,你能用手机做这些事:

  • 查看进度。地铁上打开手机,看到 Codex 跑到哪一步了——它在读什么文件、跑了什么测试、改了什么代码
  • 审查 diff。Codex 改完代码,你直接在手机上看 diff,绿色红色一目了然
  • 批准操作。Codex 要执行一条命令?手机上点一下 Approve 就行
  • 换个方向。发现它走偏了?直接在手机上告诉它换条路
  • 起个新任务。等咖啡的时候,想到一个 bug,直接给 Codex 下指令

文件、凭证、权限全都留在原来那台机器上,不上传到手机。这不是远程桌面,不是 VNC——它更像是你从手机上伸了一只手过去,拍了拍 Codex 的肩膀说「往这边走」。

安全中继:不暴露在公网上的连接

技术上怎么实现的?OpenAI 说底层走了一层 secure relay(安全中继)。

简单说:你的手机不直接连你的电脑。两边都连到 OpenAI 的中继服务器上,中继负责把状态、上下文、审批请求实时同步过来。你的机器不暴露在公网上,手机也不直接访问你的文件系统。

你在哪台设备登录 ChatGPT,会话状态和上下文就跟到哪里。

这个设计有一个隐藏的好处:跨设备无缝切换。在电脑上给 Codex 下了一个任务,出门了,手机上继续跟进。回家打开电脑,状态完全同步。不需要额外配置,不需要记住 IP 地址,不需要开端口映射。

为什么是现在:400 万周活用户背后的焦虑

OpenAI 自己公布的数字:Codex 每周活跃用户已经超过 400 万

400 万。这个数字比今年年初涨了 8 倍。但问题也来了——当 Agent 越来越多地跑长任务,几十分钟甚至几小时的那种,人坐在电脑前盯着就很傻

想象一下这个场景:你让 Codex 重构一个模块,预计要跑 20 分钟。你有两个选择:A,坐在电脑前盯着终端输出发呆;B,出去买杯咖啡,回来再看结果。

以前只有选 A,因为你必须守在电脑前等审批请求。现在有了手机端,你可以选 B 了——甚至你在买咖啡的时候就能审一眼 diff,点一下 Approve,回来它已经跑完了。

这不是一个功能更新,这是 AI Agent 使用方式的范式转变。 从「人守着机器」变成「人带着手机,机器自己干」。

「超级 App」的拼图又多了一块

注意一个细节:OpenAI 没给 Codex 单独做手机 App,而是塞进了 ChatGPT 主 App。

这不是偷懒。这是战略。

桌面端有独立的 Codex App,但手机端直接合并进 ChatGPT。这意味着什么?意味着 OpenAI 在做一件事——把 ChatGPT 变成一个「超级 App」。ChatGPT 负责对话,Codex 负责干活,Atlas 浏览器负责上网,全部统一到一个入口。

对用户来说,少装一个 App;对 OpenAI 来说,多了一个让用户留在 ChatGPT 里的理由。日活、时长、粘性——全都往 ChatGPT 主 App 里收。

这种打法不新鲜。微信做过同样的事:从一个聊天工具,慢慢长出支付、小程序、公众号、视频号。每个功能单独看都不大,但拼在一起就是一个操作系统级别的入口。

OpenAI 在走同一条路。

和 Claude Code 的对决

说到手机远程控制 AI Agent,绕不开 Anthropic。

Claude Code 从去年秋天起就支持手机远程查看和介入正在跑的任务。后面的 Cowork 配合移动端走的也是类似的 dispatch 思路——你不需要时刻守在终端前,AI 干活你拍板。

OpenAI 这次算是追上了。但不止是追平——Codex 把覆盖范围扩到了 devbox 和远程企业环境,支持 Remote SSH 接入。这意味着你不仅能连自己的笔记本,还能连公司的开发服务器、CI 环境、甚至 HIPAA 合规的医疗环境。

能力Codex MobileClaude Code Mobile
手机查看任务进度
审查 diff 和测试结果
远程批准操作
连接 devbox
连接 macOS
连接 Windows🔄 即将支持
Remote SSH
免费 Plan 可用
HIPAA 合规✅ 企业版
合并进主 App❌ 独立

一个有意思的对比:Claude Code 的手机端是独立入口,Codex 的手机端嵌在 ChatGPT 里。两种做法各有取舍——独立入口功能更聚焦,合并入口流量更大、获客成本更低。

还有一个关键差异:Codex 手机端目前只能连 macOS。Windows 支持据说「很快」。如果你是 Windows 用户,还得再等等。

企业级更新:不止是手机

和手机端一起发布的,还有几个面向企业用户的更新:

  • Programmatic access tokens:可以从 ChatGPT workspace 设置里直接生成 scoped 凭证,用在 CI pipeline、发布流程、内部自动化里。不用再手动管理 API key 了
  • Hooks 正式 GA:可以用来扫描 prompt 里的敏感信息、跑验证器、记录对话、创建记忆、或者为特定仓库定制 Codex 行为
  • HIPAA 合规:企业版用户在本地环境(CLI、IDE、App)使用 Codex 时,满足 HIPAA 要求。这对医疗行业的团队来说是刚需

这些更新放在一起看,OpenAI 的意图很明显:不只是让个人开发者用得爽,要让整个团队、整个企业把 Codex 嵌进工作流里。

手机端是「人在外面也能干活」的解决方案,Programmatic tokens 和 Hooks 是「机器也能调用 Codex」的解决方案。人和机器两条路都通了。

一个做产品的人怎么看这件事

说实话,这件事让我最兴奋的不是技术本身,而是它背后的产品逻辑。

第一,AI Agent 的使用场景正在从「坐在电脑前」扩展到「任何时刻」。 以前用 AI Agent 是一个需要专门腾出时间、坐在电脑前做的事情。现在它可以嵌入你的碎片时间——等电梯的时候审个 diff,坐地铁的时候起个任务。使用频率会指数级上升。

第二,「不传文件」是一个正确的产品决策。 很多人第一反应可能是:为什么不在手机上也能直接编辑代码?因为你不需要。代码编辑在手机上是伪需求。你需要的是「决策权」——看一眼,拍个板,或者换个方向。这才是手机真正适合做的事。

第三,免费用户也能用,这是在扩盘。 不是收割存量用户,而是让没用过 Codex 的人有一个零成本的入口试试看。先拉人进来,再靠 Pro 订阅变现。标准的漏斗模型。

局限

不是所有东西都完美:

  • 只支持 macOS。Windows 用户还得等。这个时间差对 Anthropic 来说是一个窗口期
  • Preview 阶段。功能可能不稳定,体验可能有粗糙的地方
  • 依赖 ChatGPT App。如果你不想装 ChatGPT(虽然概率很低),就没有其他入口
  • 欧盟和英国。Codex 的某些功能在部分地区的可用性仍然受限

接下来会怎样

OpenAI 的路线图越来越清晰了:

  1. Codex 多端覆盖:Mac ✅ → Windows ✅ → Chrome ✅ → 手机 ✅ → 下一步可能是 CarPlay、Apple Watch?
  2. ChatGPT 「超级 App」:对话 + 编程 + 浏览 + 视频生成,一个入口全搞定
  3. 企业渗透:Programmatic tokens + Hooks + HIPAA,把 Codex 从个人工具变成团队基础设施

回到现在这个时间点——Codex 进手机看起来只是一个小更新。但站在更高的维度看:AI Agent 正在从「你坐在电脑前用的工具」变成「无处不在的协作伙伴」。

手机是第二步。下一步可能是你身边的所有屏幕。


发布日期:2026-05-15信息来源:OpenAI 官方博客、宝玉 xp 推文、The Verge、9to5Mac、Thurrott、TechCrunch、Android Authority

最近更新

基于 MIT LICENSE 许可发布