重磅消息,没想到 OpenAI 又在深夜放炸弹了,我感觉在这几天 Google I/O 大会之前,很多人工智能公司都会逐渐的发布一些产品,来群殴 Google I/O 大会。
就在前两天,山姆·奥特曼还在 X 发推说:
很快会发布一个“低调的”研究预览版 xx;
xx 的起名要比“ChatGPT”好,以防产品像 ChatGPT一样原地起飞。

好了,现在确定了,OpenAI 推出其迄今为止最强大的 AI 编程助手 Codex 的研究预览版。
具体效果到底怎么样呢?我们还得用户自己实践去测评和体验。
现在的 AI 产品,千万别相信网络上的 AI 博主的吹嘘,大多数 AI 博主都是跟厂商有合作,第一时间为了博流量,把产品吹的神乎其神,最后,当用户真实体验的时候,也就那样,很一般。
最典型的案例就是:Manus 。
很多人看到 Codex 的第一反应就是,它不就是让微软 Copilot 火爆全球的编程模型,不就是旧瓶装新酒吗?
这次似乎不太一样,官方说以前的 Codex 模型就是自动补全的一个助手,现在是以“基于云的软件工程Agent”身份重新登台亮相,带有了人工智能的身份。
好了,那咱们看看官方是如何介绍 Codex 的。
Codex 是一个云端软件工程智能体(Agent),可以并行处理多项任务,包括编写功能、解答代码库相关问题、修复 bug 以及提交拉取请求以供审核等,并且,每个任务都在其专属的云沙盒环境中运行,并预加载代码库。
山姆·奥特们是这么说的:
今天我们推出了 Codex。它是一个在云端运行的软件工程智能体,能为你完成诸如编写新功能或修复 bug 等任务。你可以并行运行许多任务。「你只管做就行」是我最喜欢的句子之一;我没想到它会这么快,并以如此重要的方式应用于 AI 本身及其用户。

Codex 背后的模型其实就是 codex-1,它是 OpenAI o3 的一个版本,专门针对软件工程进行了优化。
它使用强化学习在各种环境中针对真实编程任务进行训练,生成的代码能够高度反映人类的风格和 PR 偏好,精确遵循指令,并可以迭代运行测试,直到获得合格结果。
不仅追求基准测试的高分,更注重生成那些开发者真正愿意合并到代码库中的代码——考虑注释、避免不必要的更改、符合代码风格,从而真正加速开发工作。
在编程评估和内部基准测试中,codex-1 模型即便没有其他 Agent 能力的优化,表现也十分出色。

所以,OpenAI 称其为迄今为止最强的编码模型。
以下是其核心功能:
-
高效代码生成:Codex 能够生成“更干净”的代码,严格遵循用户指令,并通过迭代测试确保代码通过所有测试用例。这使其在生成生产级代码方面表现出色。 -
多任务并行处理:作为一款自主 AI 编码代理,Codex 能够同时执行多个开发任务,例如编写新功能、修复 bug、回答代码库特定问题以及运行测试。任务完成时间通常在 1 到 30 分钟之间。 -
安全运行环境:Codex 运行在云端的沙箱虚拟计算机中,采用空气隔离(air-gapped)环境,无互联网或外部 API 访问,确保安全性。它还拒绝编写恶意软件的请求,进一步提升了其在安全敏感项目中的适用性。 -
GitHub 集成与自定义:Codex 可以连接 GitHub,预加载用户的代码库,从而更好地理解开发环境。开发者可以通过在仓库中添加“AGENTS.md”文件,提供项目级别的配置,例如代码库导航、测试策略和代码风格标准。这种自定义功能帮助 Codex 更精准地适应具体项目需求。 -
透明性和可追溯性:Codex 会记录所有操作,引用测试输出,并总结所做的更改,为开发者提供详细的工作日志。这不仅提高了透明度,也便于跟踪和审核。
此外,Codex CLI 版本已更新,使用 codex-mini-latest 模型,适用于低延迟的代码编辑和问答任务,扩展了其在终端环境中的应用。
Codex 目前以研究预览版形式发布,仅限 ChatGPT Pro、Enterprise 和 Team 用户使用,未来计划扩展到 Plus 和 Edu 用户。以下是使用流程:
-
访问入口:用户可以通过 ChatGPT 网页版侧边栏访问 Codex,无需额外安装。 -
任务分配:输入提示后,点击“code”按钮生成代码,或点击“ask”按钮提问代码库相关问题。Codex 会在一个独立的容器中执行任务,该容器镜像用户的开发环境,确保与实际开发设置一致。 -
任务监控:任务进度会在提示栏下方显示,开发者可以实时跟踪。任务通常在 1 到 30 分钟内完成,具体取决于任务复杂性。 -
审查与验证:尽管 Codex 能够生成高质量代码,但 OpenAI 强调开发者必须手动审查和验证所有 AI 生成的代码,以确保符合项目需求和安全标准。这一点尤为重要,因为 AI 模型可能存在偏见或生成非标准代码的风险。 -
使用限制与定价:当前,Codex 提供免费且宽松的访问权限,预计未来将引入使用限制和定价方案。定价为每百万输入令牌 1.50 美元、每百万输出令牌 6 美元,并提供 75% 的缓存折扣,以降低重复请求的成本。
对于工程师来说,Codex 的使用体验类似于一个“早晨待办清单”工具:开发者可以一次性分配多个任务,然后在稍后审查草稿解决方案。这种工作流特别适合处理重复性或时间敏感的任务。
OpenAI 对 Codex 的未来充满期待。
OpenAI 的联合创始人 Greg Brockman 展望道:“你真正想要的是一个拥有自己电脑的远程同事,但它也能随时‘站在你身后’看你的屏幕。你正在写代码,想去吃午饭,对 Codex 说‘能帮我完成这个吗?’它就能无缝接管并在云端运行。”
未来的蓝图包括:
-
功能融合:本地同步的 Codex CLI 与云端异步的 Codex 将走向融合,形成统一的工作流。 -
更强交互:允许开发者在任务中途提供指导、协作制定实施策略、接收主动进度更新。 -
深度集成:与 GitHub 的连接只是开始,未来将能从 Codex CLI、ChatGPT 桌面版,甚至 Jira 等问题跟踪器或 CI/CD 系统直接分配任务。如果 CI 报错,Codex 或许能自动修复。
Greg 总结道:“它是一个你可以委托任务的实习生,一个导师,一个结对编程伙伴,集所有角色于一身。我们的目标是加速有用的工作,让世界上有更多的软件工程师,完成更多有用的编程工作,推动世界前进。”
对此大家怎么看呢?


转载请注明:深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了 | AI工具大全&导航