OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈

AI资讯 1年前 (2025) charles

5K 0 35

6月11日，OpenAI首席产品官Kevin Weil接受播客Azeem Azhar访谈，本次对话中，Kevin Weil就AI从“回答者”向“执行者”的范式转移、AI Agent的产品化路径与战略支点、新型产品研发范式，以及OpenAI独特的用户信任构建，系统性地阐述了其团队在产品层面的前沿思考与完整战略。

Kevin Weil指出：“我们正在经历一个转变，ChatGPT正在从一个回答问题的工具，演变为一个能在现实世界中为你执行任务的产品。”

就在本月，OpenAI发布了一系列连接器，允许ChatGPT接入Google Docs、SharePoint、Gmail等主流生产力工具，这一新功能授予了这位“数字员工”访问公司知识库的权限，AI更深度融入每个人的日常工作流。

AI新范式：从信息叠加到第一性原理重构

每当颠覆性技术浪潮来临，人们的初始反应往往是保守的。Kevin Weil讲述了一个有趣的现象：“最早的电视广告，不过是让人站在镜头前，照本宣科地朗读广播广告词。” 人们习惯于用新的媒介，去重复上一代技术浪潮中早已驾轻就熟的事情。今天，许多组织对AI的应用也陷入了类似的思维定式：“我现有这些工作流程，要如何将AI技术‘点缀’其上，让它变得更好、更快？”

这种“叠加式”的应用固然能在短期内带来效率提升，但Weil强调，这远非AI的真正潜力所在。真正的力量源于利用新技术，从第一性原理出发，彻底重塑我们正在做的工作。他指出：“移动互联网的意义远不止是把电脑放进口袋，而是让你能随时使用GPS、接收通知，带来了与技术互动的全新方式。” 同样，AI的革命性价值，在于它能够催生出全新的工作与生活范式，而非仅仅优化存量。

Weil观察到，这种思维模式的转变在不同代际的用户群体中表现出显著差异，他分享道：“Sam Altman曾经谈到过一些代际差异，我非常同意他的看法。现在很多人还只是将AI简单地应用在自己现有的工作流上。”

对于在没有AI的环境中成长起来的“我们这些老人”，思维惯性是难以避免的。我们总是在努力回忆和思考自己固有的流程，并琢磨如何去改造它们。然而，对于“AI原住民”而言，情况截然不同。

“对更年轻的用户而言，AI已经成为他们生活方式的核心，仿佛一项永远在线的能力。” 对他们来说，与一个可以量身定制、回答任何问题的超强AI对话，是理所当然的存在。他们很自然地意识到，口袋里有这样一个超级助理，它不仅能回答任何问题，还能教会你想学的任何东西。

这种差异的核心在于，年轻一代没有固化的流程需要去“改造”，他们直接用AI从零开始建立自己的方法论。Weil表示：“AI只是你生活运作方式的核心组成部分。从某些方面来说，他们已经走在了前面，而我们其他人则在奋力追赶。”

信任始于“去使用它”，但用户必须能控制AI采取的每一个行动

面对公众对AI普遍存在的疑虑，Weil认为，在产品层面消解这种恐惧，建立用户信任，是推动AI健康发展的首要任务，而OpenAI的策略可以归结为两个核心支点：亲身体验与用户掌控。

“当人们问：‘我该如何面对AI？我该怎么看待它？’我的回答永远是：‘去用它。’” 他相信，无论选择ChatGPT还是其他产品，亲身实践是打破媒体渲染的“恐怖叙事”、建立客观认知最有效的方式。只有当用户真正开始使用，他们才会发现AI并非洪水猛兽，而是一个强大的助手，能将他们从繁琐的重复性劳动中解放出来。他强调：“如果你相信AI将成为我们生活的重要组成部分，那这趟列车你肯定不想错过。”

他分享的个人经历，他的儿子不久前经历了一场小手术，术后的活检报告充满了普通人难以理解的医学术语，在无法立即联系到主治医师的72小时里，他将报告拍照上传至ChatGPT，并用最简单的语言提问：“我应该担心吗？你能用像对五岁小孩说话的方式给我解释一下吗？”ChatGPT给出了明确而抚慰人心的回答：“不，这完全没问题，一切都好，没什么可担心的。” Weil感慨道，想象一下，这项技术在全球那些医疗资源匮乏的地区能产生多大的影响。它的力量真的非常强大，我认为这是ChatGPT有些被低估的一面。”

随着AI能力的进化，特别是当它从一个被动的“回答者”转向主动的“执行者”时，仅有情感信任是远远不够的，更需要建立机制上的信任。Weil强调的第二个核心支点：用户掌控权。

“当我们正在经历一个转变，即ChatGPT从一个回答问题的工具，演变为一个能在现实世界中为你执行任务的产品时，你必须能够控制它采取的每一个行动”。用户不希望AI在自己感觉失控的情况下，自作主张地完成一系列任务。因此，在AI Agent化的初期，每一步行动的决策权都必须牢牢掌握在用户手中。随着时间的推移，当模型性能越来越好，用户对它的信任度逐步建立，才可以授予其更大的自主权。Weil认为：“这种共同成长和演进的过程，是我们建立用户信任最重要的方式之一。”

这种对用户体验和控制权的追求，也深刻地影响了OpenAI独特的产品策略。许多用户都曾对ChatGPT左上角那个令人困惑的、包含多个模型选项的下拉菜单感到不解。Weil坦诚地回应了背后的策略——“迭代部署”。

他解释道：“我们相信，实现AI改变世界的最佳方式是与社会‘共同进化’。” 这意味着要将尚不完美的模型尽快交到用户手中，让用户帮助OpenAI发现其能力、弱点和未曾预料到的用途，从而形成一个快速学习、迭代和改进的闭环。如果坚持将所有新功能都集成到一个完美的模型中再发布，开发速度将大大减慢。因此，OpenAI选择牺牲一时的清晰易用性，以换取更快的进化速度。

这种策略的结果就是，用户会看到一个模型的集合，其中一些是实验性的，在某些新能力上表现卓越，但在其他方面可能稍逊一筹；另一些则是更稳定、更全面的主力模型，如GPT-4。Weil透露，未来的GPT-5正是为了实现这一目标：将过去实验中验证过的诸多能力集成到一个单一、更强大的模型中，从而减轻用户的认知负荷。然而，他也清醒地认识到，这并非终点。“即便我们推出了GPT-5，我们之后还会有大量超越它的新功能需要构建和实验。我预计，你会一直看到这样的情况：市场上会有新的实验性模型，同时有你信赖的主力模型。”

这种看似“混乱”的迭代部署，其本质是一个高效的“学习循环”。通过同时放出“好几匹赛马”（不同的实验模型），OpenAI能够快速收集关于不同能力表现的数据，从而为下一代主力模型的开发指明方向。

以“Eval”为核心的全新产品开发范式

OpenAI正在实践一种颠覆传统互联网产品开发模式的新范式。它不再由产品经理的需求文档主导，而是由前沿研究的发现驱动，并以“Eval”（评估体系）作为连接研究与产品的核心度量衡。

Weil将这一过程描述为一个紧密的闭环：

研究发现：基础研究团队探索并实现了某种新的模型能力，例如“Deep Research”功能背后的迭代式搜索与推理能力。

问题定义：产品团队介入，将这种抽象能力与真实的用户痛点相结合，将其定义为一个需要解决的具体问题。

量化评估：产品与研究团队共同创建专属的“Eval”，将用户问题的解决程度转化为可量化、可追踪的基准指标。

闭环优化：研究团队利用Eval的反馈，针对性地对模型进行后期训练与优化，直至其在该项特定任务上的表现达到产品化标准。

在这个新范式中，“Eval”取代了传统的需求文档，成为事实上的“产品规格说明书”。Weil指出，创建高质量Eval的能力，特别是针对创意写作、多步骤任务等主观、复杂领域的Eval，正成为产品经理的一项核心技能。

然而，创建有效的Eval本身就是一项巨大的挑战。Weil解释说，一年前，Eval大多是“非黑即白”的，比如衡量数学能力，因为答案有对错之分。但现在，随着模型开始处理更复杂的任务，Eval也必须随之进化。他提出了两个难题：如何评估创意写作的优劣？对于没有唯一正确答案的领域，如何建立公正、可复现的评分标准？当一个AI Agent尝试帮你预订航班或自动化一个复杂流程时，并没有单一的“正确”执行路径。如何评估整个过程的质量和效率？

为了解决这些问题，团队不仅要设计Eval，还必须为其配备一个能够快速、自动评分的系统，以便在模型训练中实现高效反馈。Weil预计：“为你正在构建的产品创建专属Eval的能力，将逐渐成为产品经理一项愈发重要的核心技能。”

此外，“系统提示”成为另一个强大的调节杠杆。尽管长期目标是降低用户对提示工程的依赖，但在当前，精心设计的系统提示是开发团队在不重新训练整个模型的前提下，快速修正和微调模型行为的最高效工具。

这个由“研究发现、Eval量化、闭环优化”构成的高效引擎，其产出物便是能力日益强大的AI系统，而AI Agent正是其最前沿的体现。

战略支点：以“编程”为突破口的Agent化路径

Kevin Weil将AI Agent定义为“能够独立完成工作的实体”，它超越了一问一答的模式，能在真实世界中为用户主动执行任务。在OpenAI的产品矩阵中，选择“编程”作为Agent化的首个主要突破口。

Weil兴奋地表示，“我正在处理邮件、在Slack上沟通，做着我白天的本职工作，而一个编程Agent正在为我解决真实世界里的任务。” 更酷的是，这种工作模式具备巨大的并行处理潜力。“如果你有一个Codex Agent为你工作，为什么不能同时让10个Codex Agent为你处理10个不同的任务呢？”

做为首个主要突破口，其背后有多重缜密的考量，Weil系统地阐述了为什么“编程”成为AI Agent率先攻克的垂直领域：

内部战略价值：提升编码效率能直接加速OpenAI自身的研发迭代，是推动其实现AGI使命的“元能力”。

通用能力的试金石：编程涉及高度复杂的逻辑推理，是检验和提升模型通用智能水平的理想场景。

结果的可评估性：代码的正确性与有效性相对客观，易于建立清晰的Eval进行衡量与优化。

理想的市场条件：开发者是典型的早期采用者，市场接受度高；同时，该领域监管较少，便于快速部署和创新。

以Codex为例，它能够自主理解代码库、定位问题、编写代码并提交合并请求，这不仅极大地赋能了专业开发者，更预示着一个更为宏大的愿景——“让十亿人能够编写代码”。Weil认为，通过将编程这一通用技能大众化，AI将释放出巨大的社会创造力。

起初，某个能力被认为是AI无法攻克的。然后，一个模型实现了从0到5%的突破。很快，两个月后有人达到30%，四个月后达到60%，不出半年，这项能力就被彻底掌握，成为所有模型的基础功能。Weil说：“一项新技能从‘证明其可能性’到‘哦，AI当然能做这个’的转变过程异常迅速。我认为，我们对这种惊人的发展速度仍未完全适应。”大平台能力指数级增长，那初创公司还有生存空间吗？

生态法则：在平台引力下寻找创新前沿

“Kevin每发一条推文，就有50家初创公司倒闭。” 这个流传于硅谷的玩笑，精准地捕捉到了AI时代创业者们的集体焦虑。当平台的基础模型能力日益强大，不断将原本属于应用层的功能“内置”时，第三方开发者该何去何从？

面对初创公司的普遍焦虑，Weil提出了一个清晰的生态位法则，其核心思想是：平台的责任是不断吸纳并商品化那些非差异化的底层基础设施，从而为开发者让渡出更有价值的创新空间。

他以微软在Windows 95中内置TCP/IP协议栈为例，说明平台的进化本质上是降低了生态系统内所有参与者的开发成本。基于此，Weil为AI时代的创业者提供了一个明确的“试金石”：

“如果你正在探索模型能力的最前沿，你的产品目前只是勉强可用，但你迫切期待下一代模型的发布，因为它将让你的产品大放异彩——那么，你很可能走在正确的道路上。反之，如果你在为当前模型的弱点修修补补，并畏惧新模型的发布，那么你就处在非常危险的境地。”

Weil认为，AI将触及所有行业、所有垂直领域，为无数的重塑和重构提供了广阔的舞台。

当被问及与设计师Jony Ive的合作时，Weil透露，Jony Ive的团队将首先专注于消费级硬件产品，并将在未来对OpenAI的整体设计产生深远影响。OpenAI与Jony Ive的合作，预示着其对未来交互范式的思考已超越现有硬件。Weil指出，智能手机作为当前的主要交互设备，其形态在功耗、尺寸和交互模式上，已难以承载“环境智能”的未来。一个能时刻伴随、无缝融入环境的“超级助理”，需要一个全新的硬件载体。

AGI是一个渐进过程

访谈最后，当呗问到“我们什么时候会交付AGI？”，Weil认为，AGI的到来不会是一个可以被精确标记到“某年某月某日”的突变事件。它是一个渐进的过程，是一个AI能力基线不断提升的过程。

“正如我们之前讨论的，智能是多维度的。今天，在很多领域，AI的能力已远超人类；但在另一些领域，它的表现又差得可笑。” Weil解释道，“然而，每当新模型发布，AI能力的基线就会提升，它在越来越多的任务上达到超人水平。当它在几乎所有重要方面都达到超人水平时，我们或许就会称之为AGI。”

我们不会在某天一觉醒来，发现世界已然不同。相反，我们正身处其中，与这项技术共同成长，每一天，都在向那个目标更近一步。

【AI技术与应用交流群｜仅限受邀加入】

AI算力领域TOP级从业者专属圈层

√ 与头部算力企业深度对话

√ 与AI上下游企业深度对话

√ 获取一手全球AI与算力产业信息

√ 获取AI热点及前沿产业独家信息

√ 随时了解全球AI领域高管最新观点及实录全文

√ 有机会参与AI主题产业交流活动

扫码验证身份（需备注姓名/公司/职务）

不止有 DeepSeek，更有 AI产业的未来！

| 文章来源：数字开物

• END•

【专栏】精品再读

大模型最大的落地场景出现了｜2024数字开物大会成功举办

AI与数据中心出海东南亚面临两大挑战｜万字圆桌实录

2万字完整演讲实录：最强TPU芯片、全新AI Agent 来了｜谷歌云 Next 大会

黄仁勋3万字完整精校实录："思考型token"爆发，AI infra即将巨变

何宝宏：大语言模型上半场已进入“垃圾时间”

深度｜“唤醒”特斯拉，进击的中国Robotaxi

版权声明：charles 发表于 2025年6月16日 pm12:50。
转载请注明：OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈 | AI工具大全&导航

AGI的终极形态，是分布式集体智能？

charles

0 15

🧠 解码大语言模型的记忆力：上下文长度的前世今生

charles

3.6K 30

AI自创符号语言：DeepSeek内部私语被曝光！

charles

11K 20

🧠 解码大语言模型的记忆力：上下文长度的前世今生

charles

7.8K 25

🧠 解码大语言模型的记忆力：上下文长度的前世今生

charles

9K 15

通义千问与文心一言对比评测：谁才是苹果AI的“黄金搭档”？

charles

9.9K 45

OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈

基于Dify构建客服智能体全流程实战，揭秘提升RAG效果关键

OpenAI o3-pro发布，也许当前的RAG过时了...

相关文章

相关文章