深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了

AI资讯 9小时前 charles
135 0

重磅消息,没想到 OpenAI 又在深夜放炸弹了,我感觉在这几天 Google I/O 大会之前,很多人工智能公司都会逐渐的发布一些产品,来群殴 Google I/O 大会。

就在前两天,山姆·奥特曼还在 X 发推说:

很快会发布一个“低调的”研究预览版 xx;

xx 的起名要比“ChatGPT”好,以防产品像 ChatGPT一样原地起飞。

深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了

好了,现在确定了,OpenAI 推出其迄今为止最强大的 AI 编程助手 Codex 的研究预览版。

具体效果到底怎么样呢?我们还得用户自己实践去测评和体验。

现在的 AI 产品,千万别相信网络上的 AI 博主的吹嘘,大多数 AI 博主都是跟厂商有合作,第一时间为了博流量,把产品吹的神乎其神,最后,当用户真实体验的时候,也就那样,很一般。

最典型的案例就是:Manus 。

很多人看到 Codex 的第一反应就是,它不就是让微软 Copilot 火爆全球的编程模型,不就是旧瓶装新酒吗?

这次似乎不太一样,官方说以前的 Codex 模型就是自动补全的一个助手,现在是以“基于云的软件工程Agent”身份重新登台亮相,带有了人工智能的身份。

好了,那咱们看看官方是如何介绍 Codex 的。

深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了

Codex 是一个云端软件工程智能体(Agent),可以并行处理多项任务,包括编写功能、解答代码库相关问题、修复 bug 以及提交拉取请求以供审核等,并且,每个任务都在其专属的云沙盒环境中运行,并预加载代码库。

山姆·奥特们是这么说的:

今天我们推出了 Codex。它是一个在云端运行的软件工程智能体,能为你完成诸如编写新功能或修复 bug 等任务。你可以并行运行许多任务。「你只管做就行」是我最喜欢的句子之一;我没想到它会这么快,并以如此重要的方式应用于 AI 本身及其用户。

深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了

Codex 背后的模型其实就是 codex-1,它是 OpenAI o3 的一个版本,专门针对软件工程进行了优化。

它使用强化学习在各种环境中针对真实编程任务进行训练,生成的代码能够高度反映人类的风格和 PR 偏好,精确遵循指令,并可以迭代运行测试,直到获得合格结果。

不仅追求基准测试的高分,更注重生成那些开发者真正愿意合并到代码库中的代码——考虑注释、避免不必要的更改、符合代码风格,从而真正加速开发工作。

在编程评估和内部基准测试中,codex-1 模型即便没有其他 Agent 能力的优化,表现也十分出色。

深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了

所以,OpenAI 称其为迄今为止最强的编码模型。

以下是其核心功能:

  • 高效代码生成:Codex 能够生成“更干净”的代码,严格遵循用户指令,并通过迭代测试确保代码通过所有测试用例。这使其在生成生产级代码方面表现出色。
  • 多任务并行处理:作为一款自主 AI 编码代理,Codex 能够同时执行多个开发任务,例如编写新功能、修复 bug、回答代码库特定问题以及运行测试。任务完成时间通常在 1 到 30 分钟之间。
  • 安全运行环境:Codex 运行在云端的沙箱虚拟计算机中,采用空气隔离(air-gapped)环境,无互联网或外部 API 访问,确保安全性。它还拒绝编写恶意软件的请求,进一步提升了其在安全敏感项目中的适用性。
  • GitHub 集成与自定义:Codex 可以连接 GitHub,预加载用户的代码库,从而更好地理解开发环境。开发者可以通过在仓库中添加“AGENTS.md”文件,提供项目级别的配置,例如代码库导航、测试策略和代码风格标准。这种自定义功能帮助 Codex 更精准地适应具体项目需求。
  • 透明性和可追溯性:Codex 会记录所有操作,引用测试输出,并总结所做的更改,为开发者提供详细的工作日志。这不仅提高了透明度,也便于跟踪和审核。

此外,Codex CLI 版本已更新,使用 codex-mini-latest 模型,适用于低延迟的代码编辑和问答任务,扩展了其在终端环境中的应用。

Codex 目前以研究预览版形式发布,仅限 ChatGPT Pro、Enterprise 和 Team 用户使用,未来计划扩展到 Plus 和 Edu 用户。以下是使用流程:

  • 访问入口:用户可以通过 ChatGPT 网页版侧边栏访问 Codex,无需额外安装。
  • 任务分配:输入提示后,点击“code”按钮生成代码,或点击“ask”按钮提问代码库相关问题。Codex 会在一个独立的容器中执行任务,该容器镜像用户的开发环境,确保与实际开发设置一致。
  • 任务监控:任务进度会在提示栏下方显示,开发者可以实时跟踪。任务通常在 1 到 30 分钟内完成,具体取决于任务复杂性。
  • 审查与验证:尽管 Codex 能够生成高质量代码,但 OpenAI 强调开发者必须手动审查和验证所有 AI 生成的代码,以确保符合项目需求和安全标准。这一点尤为重要,因为 AI 模型可能存在偏见或生成非标准代码的风险。
  • 使用限制与定价:当前,Codex 提供免费且宽松的访问权限,预计未来将引入使用限制和定价方案。定价为每百万输入令牌 1.50 美元、每百万输出令牌 6 美元,并提供 75% 的缓存折扣,以降低重复请求的成本。

对于工程师来说,Codex 的使用体验类似于一个“早晨待办清单”工具:开发者可以一次性分配多个任务,然后在稍后审查草稿解决方案。这种工作流特别适合处理重复性或时间敏感的任务。

OpenAI 对 Codex 的未来充满期待。

OpenAI 的联合创始人 Greg Brockman 展望道:“你真正想要的是一个拥有自己电脑的远程同事,但它也能随时‘站在你身后’看你的屏幕。你正在写代码,想去吃午饭,对 Codex 说‘能帮我完成这个吗?’它就能无缝接管并在云端运行。”

未来的蓝图包括:

  • 功能融合:本地同步的 Codex CLI 与云端异步的 Codex 将走向融合,形成统一的工作流。
  • 更强交互:允许开发者在任务中途提供指导、协作制定实施策略、接收主动进度更新。
  • 深度集成:与 GitHub 的连接只是开始,未来将能从 Codex CLI、ChatGPT 桌面版,甚至 Jira 等问题跟踪器或 CI/CD 系统直接分配任务。如果 CI 报错,Codex 或许能自动修复。

Greg 总结道:“它是一个你可以委托任务的实习生,一个导师,一个结对编程伙伴,集所有角色于一身。我们的目标是加速有用的工作,让世界上有更多的软件工程师,完成更多有用的编程工作,推动世界前进。”

对此大家怎么看呢?

最后,介绍一下我的星球社群,「AIGC・掘金成长研习社」一个高质量陪伴成长社群,主打陪伴和成长,我会每天第一时间在里面分享很多最新的知识和各种干货,持续坚持至少分享 10 年
星球内有很多干货,有 AI 工作流,Coze 智能体教程,有 AI 编程的教程,有 AI 副业或者个人成长、商业思考等内容。送一张立减 50 元的优惠券。
?只需 99 元解锁全年 AI 进化指南:
✅ AI 领域的最新趋势与应用
✅保姆级 AI 工作流搭建教程
✅Coze 智能体开发全攻略
✅AI 编程实战案例手册
✅AI + 副业变现深度解析和实战干货
✅每日商业思考笔记连载
?新用户专享:3 天无理由全额退款
(悄悄说:已有 570 + 学员通过教程获得成长)
?适合人群:
想用 AI 提升工作效率 / 开拓副业赛道 / 构建商业思维的终身学习者
早加入早受益,用一天的饭钱换全年 AI 进化加速!?
深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了
长按扫码加入「AIGC・掘金成长研习社」一起掘金,一起暴富,一起用 AI 赋能
深夜炸场,OpenAI 偷偷发布史上最强大的 AI 编程助手 Codex,新一代编程神器来了

相关文章