12月6日凌晨2点,OpenAI举办了一场为期12天工作日的首次直播活动。在这次直播中,OpenAI推出了全新的o1模型以及一项新的订阅服务——ChatGPT Pro。从即日起,o1模型将取代原有的o1-preview模型,所有ChatGPT Plus和Pro订阅用户都可以使用。
早在今年9月,OpenAI就已正式发布了o1大模型,该模型能够解答科学、代码和数学等领域中的复杂问题。当时,o1模型仅推出了o1-preview和o1 mini两个版本,未能完全发挥其全部潜力。而在本次发布的o1模型中,其智能化程度、多模态输入能力和处理速度都得到了显著提升。
OpenAI的联合创始人兼首席执行官Sam Altman指出,相较于o1-preview,o1模型的错误率降低了约34%,并且处理速度提高了大约50%。他解释说,o1模型的独特之处在于它会在每次回答前进行深思熟虑,从而提供更为详尽和准确的答案。
在智能表现方面,o1模型在解决数学等复杂问题时的准确率更高。例如,在解答AIME 2024数学竞赛题时,o1模型的准确率达到78.3%,比o1-preview高出28.3%。对于博士级别的科学问题,o1模型的准确率为75.6%,比o1-preview高出1.5%。
在处理速度方面,o1模型也有显著改进。在离线测试中,o1模型的平均响应速度比o1-preview快了约60%。例如,当被要求列举公元2世纪的罗马皇帝及其生平简介时,o1模型仅用了约14秒,而o1-preview则需要33秒。
OpenAI还提到,之前的模型对所有问题的响应时间都较长。经过优化,现在如果提出简单的问题,o1模型会迅速给出答案;如果是复杂问题,则会花费更多时间进行思考。
此外,o1模型新增了多模态输入能力,能够同时处理图片和文本内容,并进行推理。OpenAI展示了一个实例,其中一张包含太阳、冷却系统等物体的手绘草图被拍照上传至o1模型。o1模型在没有任何提示的情况下,生成了用户可能感兴趣的问题并自动解答。不到10秒内,o1模型不仅理解了草图中的问题要求,还进行了必要的推理,给出了正确的答案。
为了满足用户希望无限制使用模型的需求,OpenAI推出了ChatGPT Pro订阅服务。用户只需每月支付200美元,即可无限制地使用更强大的o1 Pro模型。OpenAI展示了o1-preview、o1和o1 Pro在数学竞赛、代码竞赛和博士级别科学问题上的回答差异。结果显示,在每个问题询问四次后,o1 Pro的准确率最高,分别为80.0%、74.9%和74.2%。
在直播过程中,OpenAI还提出了一道化学问题,要求o1 Pro找到符合特定标准的蛋白质。结果显示,o1 Pro仅用了53秒便完成了答题,并允许用户查看整个思考过程。
OpenAI表示,未来计划让o1 Pro支持更多的高计算密集型任务,允许处理更长和更复杂的任务。此外,o1 Pro还将新增网络浏览、文件上传和增强的API支持(如结构化输出、函数调用和图像理解)等功能。