OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈

AI资讯 17小时前 charles
165 0

OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈

OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈

6月11日,OpenAI首席产品官Kevin Weil接受播客Azeem Azhar访谈,本次对话中,Kevin Weil就AI从“回答者”向“执行者”的范式转移、AI Agent的产品化路径与战略支点、新型产品研发范式,以及OpenAI独特的用户信任构建,系统性地阐述了其团队在产品层面的前沿思考与完整战略。


Kevin Weil指出:“我们正在经历一个转变,ChatGPT正在从一个回答问题的工具,演变为一个能在现实世界中为你执行任务的产品。”


就在本月,OpenAI发布了一系列连接器,允许ChatGPT接入Google Docs、SharePoint、Gmail等主流生产力工具,这一新功能授予了这位“数字员工”访问公司知识库的权限,AI更深度融入每个人的日常工作流。


01

AI新范式:从信息叠加到第一性原理重构


每当颠覆性技术浪潮来临,人们的初始反应往往是保守的。Kevin Weil讲述了一个有趣的现象:“最早的电视广告,不过是让人站在镜头前,照本宣科地朗读广播广告词。” 人们习惯于用新的媒介,去重复上一代技术浪潮中早已驾轻就熟的事情。今天,许多组织对AI的应用也陷入了类似的思维定式:“我现有这些工作流程,要如何将AI技术‘点缀’其上,让它变得更好、更快?”


这种“叠加式”的应用固然能在短期内带来效率提升,但Weil强调,这远非AI的真正潜力所在。真正的力量源于利用新技术,从第一性原理出发,彻底重塑我们正在做的工作。他指出:“移动互联网的意义远不止是把电脑放进口袋,而是让你能随时使用GPS、接收通知,带来了与技术互动的全新方式。” 同样,AI的革命性价值,在于它能够催生出全新的工作与生活范式,而非仅仅优化存量。


Weil观察到,这种思维模式的转变在不同代际的用户群体中表现出显著差异,他分享道:“Sam Altman曾经谈到过一些代际差异,我非常同意他的看法。现在很多人还只是将AI简单地应用在自己现有的工作流上。”


对于在没有AI的环境中成长起来的“我们这些老人”,思维惯性是难以避免的。我们总是在努力回忆和思考自己固有的流程,并琢磨如何去改造它们。然而,对于“AI原住民”而言,情况截然不同。


“对更年轻的用户而言,AI已经成为他们生活方式的核心,仿佛一项永远在线的能力。” 对他们来说,与一个可以量身定制、回答任何问题的超强AI对话,是理所当然的存在。他们很自然地意识到,口袋里有这样一个超级助理,它不仅能回答任何问题,还能教会你想学的任何东西。


这种差异的核心在于,年轻一代没有固化的流程需要去“改造”,他们直接用AI从零开始建立自己的方法论。Weil表示:“AI只是你生活运作方式的核心组成部分。从某些方面来说,他们已经走在了前面,而我们其他人则在奋力追赶。”


02

信任始于“去使用它”,但用户必须能控制AI采取的每一个行动


面对公众对AI普遍存在的疑虑,Weil认为,在产品层面消解这种恐惧,建立用户信任,是推动AI健康发展的首要任务,而OpenAI的策略可以归结为两个核心支点:亲身体验与用户掌控。


“当人们问:‘我该如何面对AI?我该怎么看待它?’我的回答永远是:‘去用它。’” 他相信,无论选择ChatGPT还是其他产品,亲身实践是打破媒体渲染的“恐怖叙事”、建立客观认知最有效的方式。只有当用户真正开始使用,他们才会发现AI并非洪水猛兽,而是一个强大的助手,能将他们从繁琐的重复性劳动中解放出来。他强调:“如果你相信AI将成为我们生活的重要组成部分,那这趟列车你肯定不想错过。”


他分享的个人经历,他的儿子不久前经历了一场小手术,术后的活检报告充满了普通人难以理解的医学术语,在无法立即联系到主治医师的72小时里,他将报告拍照上传至ChatGPT,并用最简单的语言提问:“我应该担心吗?你能用像对五岁小孩说话的方式给我解释一下吗?”ChatGPT给出了明确而抚慰人心的回答:“不,这完全没问题,一切都好,没什么可担心的。” Weil感慨道,想象一下,这项技术在全球那些医疗资源匮乏的地区能产生多大的影响。它的力量真的非常强大,我认为这是ChatGPT有些被低估的一面。”


随着AI能力的进化,特别是当它从一个被动的“回答者”转向主动的“执行者”时,仅有情感信任是远远不够的,更需要建立机制上的信任。Weil强调的第二个核心支点:用户掌控权。


“当我们正在经历一个转变,即ChatGPT从一个回答问题的工具,演变为一个能在现实世界中为你执行任务的产品时,你必须能够控制它采取的每一个行动”。用户不希望AI在自己感觉失控的情况下,自作主张地完成一系列任务。因此,在AI Agent化的初期,每一步行动的决策权都必须牢牢掌握在用户手中。随着时间的推移,当模型性能越来越好,用户对它的信任度逐步建立,才可以授予其更大的自主权。Weil认为:“这种共同成长和演进的过程,是我们建立用户信任最重要的方式之一。”


这种对用户体验和控制权的追求,也深刻地影响了OpenAI独特的产品策略。许多用户都曾对ChatGPT左上角那个令人困惑的、包含多个模型选项的下拉菜单感到不解。Weil坦诚地回应了背后的策略——“迭代部署”。


他解释道:“我们相信,实现AI改变世界的最佳方式是与社会‘共同进化’。” 这意味着要将尚不完美的模型尽快交到用户手中,让用户帮助OpenAI发现其能力、弱点和未曾预料到的用途,从而形成一个快速学习、迭代和改进的闭环。如果坚持将所有新功能都集成到一个完美的模型中再发布,开发速度将大大减慢。因此,OpenAI选择牺牲一时的清晰易用性,以换取更快的进化速度。


这种策略的结果就是,用户会看到一个模型的集合,其中一些是实验性的,在某些新能力上表现卓越,但在其他方面可能稍逊一筹;另一些则是更稳定、更全面的主力模型,如GPT-4。Weil透露,未来的GPT-5正是为了实现这一目标:将过去实验中验证过的诸多能力集成到一个单一、更强大的模型中,从而减轻用户的认知负荷。然而,他也清醒地认识到,这并非终点。“即便我们推出了GPT-5,我们之后还会有大量超越它的新功能需要构建和实验。我预计,你会一直看到这样的情况:市场上会有新的实验性模型,同时有你信赖的主力模型。”


这种看似“混乱”的迭代部署,其本质是一个高效的“学习循环”。通过同时放出“好几匹赛马”(不同的实验模型),OpenAI能够快速收集关于不同能力表现的数据,从而为下一代主力模型的开发指明方向。


03

以“Eval”为核心的全新产品开发范式


OpenAI正在实践一种颠覆传统互联网产品开发模式的新范式。它不再由产品经理的需求文档主导,而是由前沿研究的发现驱动,并以“Eval”(评估体系)作为连接研究与产品的核心度量衡。


Weil将这一过程描述为一个紧密的闭环:


研究发现:基础研究团队探索并实现了某种新的模型能力,例如“Deep Research”功能背后的迭代式搜索与推理能力。

问题定义:产品团队介入,将这种抽象能力与真实的用户痛点相结合,将其定义为一个需要解决的具体问题。

量化评估:产品与研究团队共同创建专属的“Eval”,将用户问题的解决程度转化为可量化、可追踪的基准指标。

闭环优化:研究团队利用Eval的反馈,针对性地对模型进行后期训练与优化,直至其在该项特定任务上的表现达到产品化标准。


在这个新范式中,“Eval”取代了传统的需求文档,成为事实上的“产品规格说明书”。Weil指出,创建高质量Eval的能力,特别是针对创意写作、多步骤任务等主观、复杂领域的Eval,正成为产品经理的一项核心技能。


然而,创建有效的Eval本身就是一项巨大的挑战。Weil解释说,一年前,Eval大多是“非黑即白”的,比如衡量数学能力,因为答案有对错之分。但现在,随着模型开始处理更复杂的任务,Eval也必须随之进化。他提出了两个难题:如何评估创意写作的优劣?对于没有唯一正确答案的领域,如何建立公正、可复现的评分标准?当一个AI Agent尝试帮你预订航班或自动化一个复杂流程时,并没有单一的“正确”执行路径。如何评估整个过程的质量和效率?


为了解决这些问题,团队不仅要设计Eval,还必须为其配备一个能够快速、自动评分的系统,以便在模型训练中实现高效反馈。Weil预计:“为你正在构建的产品创建专属Eval的能力,将逐渐成为产品经理一项愈发重要的核心技能。”


此外,“系统提示”成为另一个强大的调节杠杆。尽管长期目标是降低用户对提示工程的依赖,但在当前,精心设计的系统提示是开发团队在不重新训练整个模型的前提下,快速修正和微调模型行为的最高效工具。


这个由“研究发现、Eval量化、闭环优化”构成的高效引擎,其产出物便是能力日益强大的AI系统,而AI Agent正是其最前沿的体现。


04

战略支点:以“编程”为突破口的Agent化路径


Kevin Weil将AI Agent定义为“能够独立完成工作的实体”,它超越了一问一答的模式,能在真实世界中为用户主动执行任务。在OpenAI的产品矩阵中,选择“编程”作为Agent化的首个主要突破口。


Weil兴奋地表示,“我正在处理邮件、在Slack上沟通,做着我白天的本职工作,而一个编程Agent正在为我解决真实世界里的任务。” 更酷的是,这种工作模式具备巨大的并行处理潜力。“如果你有一个Codex Agent为你工作,为什么不能同时让10个Codex Agent为你处理10个不同的任务呢?”


做为首个主要突破口,其背后有多重缜密的考量,Weil系统地阐述了为什么“编程”成为AI Agent率先攻克的垂直领域:


内部战略价值:提升编码效率能直接加速OpenAI自身的研发迭代,是推动其实现AGI使命的“元能力”。

通用能力的试金石:编程涉及高度复杂的逻辑推理,是检验和提升模型通用智能水平的理想场景。

结果的可评估性:代码的正确性与有效性相对客观,易于建立清晰的Eval进行衡量与优化。

理想的市场条件:开发者是典型的早期采用者,市场接受度高;同时,该领域监管较少,便于快速部署和创新。


以Codex为例,它能够自主理解代码库、定位问题、编写代码并提交合并请求,这不仅极大地赋能了专业开发者,更预示着一个更为宏大的愿景——“让十亿人能够编写代码”。Weil认为,通过将编程这一通用技能大众化,AI将释放出巨大的社会创造力。


起初,某个能力被认为是AI无法攻克的。然后,一个模型实现了从0到5%的突破。很快,两个月后有人达到30%,四个月后达到60%,不出半年,这项能力就被彻底掌握,成为所有模型的基础功能。Weil说:“一项新技能从‘证明其可能性’到‘哦,AI当然能做这个’的转变过程异常迅速。我认为,我们对这种惊人的发展速度仍未完全适应。”大平台能力指数级增长,那初创公司还有生存空间吗?


05

生态法则:在平台引力下寻找创新前沿


“Kevin每发一条推文,就有50家初创公司倒闭。” 这个流传于硅谷的玩笑,精准地捕捉到了AI时代创业者们的集体焦虑。当平台的基础模型能力日益强大,不断将原本属于应用层的功能“内置”时,第三方开发者该何去何从?


面对初创公司的普遍焦虑,Weil提出了一个清晰的生态位法则,其核心思想是:平台的责任是不断吸纳并商品化那些非差异化的底层基础设施,从而为开发者让渡出更有价值的创新空间。


他以微软在Windows 95中内置TCP/IP协议栈为例,说明平台的进化本质上是降低了生态系统内所有参与者的开发成本。基于此,Weil为AI时代的创业者提供了一个明确的“试金石”:


“如果你正在探索模型能力的最前沿,你的产品目前只是勉强可用,但你迫切期待下一代模型的发布,因为它将让你的产品大放异彩——那么,你很可能走在正确的道路上。反之,如果你在为当前模型的弱点修修补补,并畏惧新模型的发布,那么你就处在非常危险的境地。”


Weil认为,AI将触及所有行业、所有垂直领域,为无数的重塑和重构提供了广阔的舞台。


当被问及与设计师Jony Ive的合作时,Weil透露,Jony Ive的团队将首先专注于消费级硬件产品,并将在未来对OpenAI的整体设计产生深远影响。OpenAI与Jony Ive的合作,预示着其对未来交互范式的思考已超越现有硬件。Weil指出,智能手机作为当前的主要交互设备,其形态在功耗、尺寸和交互模式上,已难以承载“环境智能”的未来。一个能时刻伴随、无缝融入环境的“超级助理”,需要一个全新的硬件载体。


06

AGI是一个渐进过程


访谈最后,当呗问到“我们什么时候会交付AGI?”,Weil认为,AGI的到来不会是一个可以被精确标记到“某年某月某日”的突变事件。它是一个渐进的过程,是一个AI能力基线不断提升的过程。


“正如我们之前讨论的,智能是多维度的。今天,在很多领域,AI的能力已远超人类;但在另一些领域,它的表现又差得可笑。” Weil解释道,“然而,每当新模型发布,AI能力的基线就会提升,它在越来越多的任务上达到超人水平。当它在几乎所有重要方面都达到超人水平时,我们或许就会称之为AGI。”


我们不会在某天一觉醒来,发现世界已然不同。相反,我们正身处其中,与这项技术共同成长,每一天,都在向那个目标更近一步。


OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈


【AI技术与应用交流群|仅限受邀加入】


AI算力领域TOP级从业者专属圈层

√  与头部算力企业深度对话

√  与AI上下游企业深度对话
√  获取一手全球AI与算力产业信息
√  获取AI热点及前沿产业独家信息
√  随时了解全球AI领域高管最新观点及实录全文
√  有机会参与AI主题产业交流活动


扫码验证身份(需备注姓名/公司/职务)

OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈

不止有 DeepSeek,更有 AI产业的未来!

OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈


| 文章来源:数字开物

• END• 

【专栏】精品再读

大模型最大的落地场景出现了|2024数字开物大会成功举办
AI与数据中心出海东南亚面临两大挑战|万字圆桌实录
2万字完整演讲实录:最强TPU芯片、全新AI Agent 来了|谷歌云 Next 大会
黄仁勋3万字完整精校实录:"思考型token"爆发,AI infra即将巨变
何宝宏:大语言模型上半场已进入“垃圾时间”
深度|“唤醒”特斯拉,进击的中国Robotaxi

版权声明:charles 发表于 2025年6月16日 pm12:50。
转载请注明:OpenAI的“第一性原理重构” | OpenAI首席产品官最新访谈 | AI工具大全&导航

相关文章