ChatGPT 也有了自己的 “Artifacts”
OpenAI 刚刚推出的一项名为“Canvas”(画布)的新功能。
可以简单理解为提供了一种新的跟 ChatGPT 的交互方式。
我的第一反应是这东西类似于 Claude 的 Artifacts 功能,但是看起来比 Artifacts 功能更全面一些。
Canvas 提供一个新的界面/窗口,用于与ChatGPT在写作和编程项目上进行更好的协作。
比如选定内容,进行针对性修改⬇️

在使用 ChatGPT 的时候,在该界面可以就 ChatGPT 生成的内容,进行进一步交互,比如修改、编辑。
比如编程时修改和迭代代码更方便⬇️

Canvas主要特点:
-
• 在单独的窗口中打开,允许用户和 ChatGPT 共同创作和完善想法。
-
• 用户可以突出选中特定部分,指示 ChatGPT 需要关注的重要内容。
-
• 针对选中内容,ChatGPT 可以提供内联反馈和修改建议。

主要工作场景和功能
Canvas 的工作场景分为两个部分:写作和编程。

1、在写作场景下,可以进行的操作包括:
-
• 建议编辑——针对选中内容,ChatGPT 提供内联建议和反馈。
-
• 调整长度——将文档内容修改为更长或更短。
-
• 更改阅读等级——调整阅读级别,小学、初中、大学、研究生等。
-
• 最终润色——检查语法、清晰度和一致性。
-
• 添加表情符号——添加相关表情符号以强调重点和颜色。

2、在编程场景下,Canvas 修改和迭代模型生成的代码变得更加容易,具体可以进行的操作包括:
-
• 审查代码——ChatGPT 提供内联建议来改进代码。
-
• 添加日志——插入打印语句,帮助用户调试和理解代码。
-
• 添加注释——为代码添加注释,使其更易理解。
-
• 修复 bug——检测代码,如果有问题会重写以解决错误。
-
• 转换为其他语言——将代码移植为 JavaScript、TypeScript、Python、Java、C++或PHP等多种语言。

技术细节:
Canvas 功能基于 GPT-4o 模型构建。
OpenAI 研究团队针对 Canvas 的核心行为进行了广泛研究,如如何触发 Canvas、生成多样内容、进行有针对性的编辑等。
比如模型在何时触发 Canvas 问题上面临挑战,团队使用新型合成数据生成技术进行后期训练。
经过测试,写作任务的正确触发率达到83%,而编码任务则偏向于不触发。

研究团队还调整了模型在 Canvas 功能触发后的编辑行为,区分定向编辑和全文重写等操作。
通过人工评估,集成 Canvas 的模型在准确性和质量方面分别比原始 GPT-4o 提高了 30% 和 16%。
何时能用?
今天开始,Plus 和 Team 用户已经可以使用该功能。

同时,OpenAI 表示 Canvas 处于早期测试阶段,未来计划快速丰富其功能。
对 Canvas 的看法
1、用户对AI生成内容的掌控性
众所周知,大模型之所以爆火,主要在于它强大的生成能力。
但是在这种能力的另一面,是 AI 生成内容的不确定性。
我们在用大模型时,希望模型提供我们完全符合我们需求的内容,最好一步到位。
但事实往往并非如此。
用户输入 prompt 之后,模型生成什么样的内容就完全不受控制了,全由模型自己决定。
像个“黑匣子”一样。
即使你的 prompt 写的再具体和详细,还是避免不了最终回答与需求不一致的情况。
就拿AI写作来说,不管怎么对模型微调、prompt工程,它写出来的东西还是会在某些方面达不到你的要求,比如用词,比如文章风格。
所以最多只能把AI生成的内容作为“草稿”,复制下来,进行一遍一遍的修改。
而 OpenAI Canvas 这样的功能,在我看来就是提高用户在整个AI创作周期中的参与度和对内容的操控程度。
创作过程由原来大模型单方面的“一锤子买卖”,变成了现在的共同创作+多次迭代。
对于用户来说,它不光是提供了方便,还让大家对最终结果更加信任。
因为人都是更愿意接受自己亲自参与过的事物。
所以,Canvas 的思路是合理的。
我认为在未来,图像、视频、音乐等 AIGC 产品需要着重考虑的一个方面同样是增强用户对生成内容的可操控性,让用户参与到创作过程中,增加对内容的掌控感。
用户对生成内容的操控性变高了,对AI的信任程度和依赖程度就会变高。
这样的产品才更有可能成为用户眼中的生产力“工具”,而不是“玩具”。
2、生成式AI的关键已经从提高模型能力逐渐转向产品设计
大模型竞赛的上半场,是大家卷模型基础能力,只要我模型性能好,大家就会用。
但是现在模型性能提升已经趋于平缓,不再有谁一家独大。
特别是对于大多数普通用户的日常使用来说,很多模型都已经能满足需求。
此时,反而是一个有独特的亮点和优势AI产品更能吸引人们使用它。
隔壁 Claude 推出的 Artifacts 组件,一个看似不起眼的功能,极大的丰富了用户使用 Claude 的方式,在过去几个月收到了无数的好评和追捧,在结合 3.5 Sonnet 的能力,吸引了一大波忠实用户。
我之前也专门写过:不会编程也能写软件——如何让一个想法直接变成应用程序?
相比之下,ChatGPT 这个祖传的 UI 早已经略显简陋。
现在,OpenAI 终于意识到要做产品了。
大模型竞赛下半场,一定会从重点卷模型能力过渡到重点做产品设计。
因为这关系到用户量,关系到盈利规模,也关系到能否吸引到资金。
谁能围绕大模型开发出更多不一样的用法和使用场景,做出有特色的产品,谁才有可能在这场角逐中胜出。