跑分超 o1,还会看图思考,数理化正在被 AI「完爆」

图灵汇官网

导读

在OpenAI的o1正式版发布10天后,Kimi的“高阶推理模型”也发布了。12月16日,Kimi推出了自己的“视觉思考模型”k1。相较于一个月前推出的k0-math,k1支持端到端的图像理解和思维链(CoT),不仅增强了推理能力,还能够识别几何图形、图表等图像信息。通过增强推理能力,大模型能够进行更严密的逻辑思考,并在基础科学领域表现出色。

视觉思考模型k1

Kimi k1在多个基础学科的基准能力测试中表现出色,超越了OpenAI的o1、GPT-4o及Claude 3.5 Sonnet。这一进步标志着Kimi在数理化方面取得了显著进展。Kimi不仅能处理文字信息,还能识别和理解图像中的内容,这使得它在解决复杂问题时更加得心应手。

数理化能力的提升

在今年夏天,媒体利用高考试卷测试了大模型的“知识水平”。结果表明,许多大模型在文科科目上的表现较好,但在数理化方面表现不佳。Kimi k1的发布改变了这一现状,它在数理化方面的表现尤为出色,甚至能够解答高级数学竞赛题目。这表明Kimi k1在某些领域已经达到了研究生甚至博士级别的水平。

应用前景

Kimi k1的两个关键特点是支持端到端的视觉内容处理和“思维链”技术。用户只需上传问题截图或照片,Kimi就能识别并解答问题,即使画面中有噪音或不清晰的情况也不影响。此外,用户可以看到模型思考和推演答案的全过程,这有助于更好地理解模型的推理过程。

细致的推理过程

Kimi k1的推理过程非常细致,能够将问题分解到最底层,并从多个角度进行验证。这种思维链技术不仅可以提高模型的逻辑性和可控性,还能增强用户的信任感。当用户提出一个问题时,如果他们不知道答案,他们仍然无法判断模型给出的答案是否正确。然而,通过展示详细的推理过程,用户可以更好地评估答案的合理性,从而提高模型的安全性和可靠性。

突破知识边界

高阶推理能力、思维链技术和端到端的视觉输入等功能,使大模型AI正经历一次新的变革。Kimi再次展示了其领先地位。过去的大模型主要是基于数据进行“拟合”,模仿人类的行为。然而,这种模型难以超越人类已知的知识范畴,无法产生新的知识。而Kimi k1的“反思”能力,意味着AI未来可能通过自我强化学习,产生新的知识,真正超越人类现有的知识边界。

成功案例

AlphaGo和AlphaZero的成功案例表明,通过强化学习方法,AI可以产生超出人类现有知识范围的策略。Kimi k1的功能演示中,它能够理解古代科学家的手稿,发掘出其中的背景信息。这表明,具备深度思考能力和高学习效率的AI,可能正在开启知识和智能的新维度。

本文来源: 互联网 文章作者: 亚峰科技
    下一篇

导读:AI 提效一切,尤其是时间。不知你是否发觉,如今我们的手机交互、日常搜索、音视频转写、文案与图片视频生成,工作与生活,每个角落,都已经与大模型牢牢绑定。而在产业中,大模型也带来了新范式的可能,就