12月11日,继OpenAI于周二凌晨发布人工智能视频生成工具Sora后,该公司在周三凌晨的活动中向所有ChatGPT用户正式开放了交互界面Canvas。早在今年10月初,OpenAI就向全球的ChatGPT Plus和Teams用户推出了Canvas的测试版服务。
从12月5日起,OpenAI进入了持续发布新功能的阶段,计划在接下来的12天内通过12场直播活动发布新产品和功能。在此之前,OpenAI已经陆续推出了ChatGPT Pro计划、强化微调技术和Sora。
此次Canvas的更新包含三大亮点:
一、全面开放Canvas,并与OpenAI的主要模型深度集成。
二、用户可以在Canvas中运行Python代码,并直接查看文本或图形输出。
三、Canvas以独立窗口的形式打开,可以整合到定制的GPT模型中。
Canvas是基于OpenAI最新主力模型GPT-4o推出的全新工具,它不仅是一个聊天工具,还是一个强大的协作平台,专门用于写作和编码项目。与传统的聊天界面不同,Canvas以独立窗口的形式打开,提供了一个类似笔记本的界面,使用户能够编辑回应并与ChatGPT进行深入协作。Canvas的新功能包括接收以评论形式呈现的反馈和编辑建议,帮助用户根据ChatGPT的建议调整内容。
正式版的Canvas现已对所有ChatGPT用户开放,并能整合到定制的GPT模型中。此外,用户现在可以在Canvas中运行Python代码,并直接查看文本或图形输出。这是OpenAI在ChatGPT之后首次推出的重大视觉界面更新,不仅提升了人机交互的自然度,还显著提高了工作效率。
在OpenAI官网提供的演示片中,用户可以从主ChatGPT搜索中选择Canvas。用户的提示词在左侧显示,而Canvas和新文本则在右侧显示。用户可以请求ChatGPT编辑文档,或直接进行编辑,结果均会显示在左侧。Canvas同样支持表情符号的使用。
除了上述协作示例,用户还可以在ChatGPT的Canvas功能中使用“获取建议”和“帮助我写”等指令。当用户输入大量文本并选择在Canvas中打开时,这些指令将显现。需要注意的是,除非用户主动提出请求,否则这些文本不会被发送给ChatGPT或被其阅读。根据演示片所示的功能,Canvas类似于一个集成人工智能的高级版谷歌文档,具备许多相似的功能。
Canvas的一个重要更新是它现在能够理解并执行Python代码。通过新的“运行”按钮,用户可以在Canvas窗口中启动Python代码,并通过控制台窗口实时查看执行结果。与编写代码时使用的Canvas相似,ChatGPT同样提供了上下文支持,并在一定程度上帮助解决运行代码时可能出现的错误。用户还可以通过点击“修复漏洞”让ChatGPT来承担复杂的任务。
虽然聊天界面易于使用,但在需要编辑和修订的项目工作中却显得有些局限。Canvas提供了一个新的界面,专门用于这类工作。
通过Canvas,ChatGPT可以更好地理解用户试图完成的工作的上下文。用户可以高亮特定部分,精确指示ChatGPT关注的内容。这类似于编辑,用户可以在整个上下文中具体地提出反馈和建议。
在Canvas中,用户可以控制项目,可以直接编辑文本或代码。Canvas还提供了快捷菜单,可以让ChatGPT帮用户调整文本长度、调试代码或快速执行其他实用操作。如果想要恢复之前的版本,一键返回即可恢复。
Canvas会在ChatGPT检测到它可以提供帮助的场景时自动打开。用户也可以在提示中包含“使用Canvas”,打开Canvas并用于处理现有项目。
编码是一个迭代过程,在聊天中跟踪和理解代码的所有修订可能会很困难。Canvas使得跟踪和理解ChatGPT的更改变得更加容易。
OpenAI的研究团队对GPT-4o进行了训练,使其能够作为创意合作伙伴进行协作。该模型知道何时打开Canvas,何时进行目标性编辑以及何时需要完全重写。同时,它还能够理解更广泛的上下文,从而提供精准的反馈和建议。
为了支持这一点,研究团队开发了以下核心行为:
OpenAI通过20多项自动化内部评估来衡量进展,并使用了新颖的合成数据生成技术,例如从o1-preview中提取输出,对模型进行核心行为的后训练。这种方法能够快速应对写作质量和新的用户交互需求,从而无需依赖人工生成的数据。