11月29日,智谱AI CEO张鹏宣布,其智能体AutoGLM进行了重大升级,能够自主执行超过54步的连续操作,并且可以在多个应用程序间无缝协作完成任务。现场演示中,张鹏成功展示了通过AutoGLM发放2万元微信红包和1万元支付宝口令红包的过程。
AutoGLM最初于今年10月推出,能够执行诸如在微信上点赞评论、在淘宝上购买历史订单商品、在携程上预订酒店以及在12306上购买火车票等任务。此次更新不仅带来了新版AutoGLM,还推出了基于PC平台的智能体GLM-PC,探索的应用场景包括会议记录、文档处理、网页搜索与总结、远程指令执行以及隐形屏幕操作等。
2024年上半年,随着ChatGPT的流行,许多企业开始寻找大模型领域的超级应用。然而,到了下半年,智能体成为了更加重要的发展方向。苹果、Anthropic、谷歌和OpenAI等公司都将智能体视为2025年的主要研究方向。Gartner预测,到2028年,至少有15%的工作决策将由智能体自主完成,而这一比例在2024年仅为零。
对此,张鹏在接受第一财经采访时指出,当前行业对大模型超级应用的期望可能过高。他认为,大模型是一项高投入的技术,需要长期积累。智谱AI更注重智能体的基础技术研发,而非单纯提升某一方面的能力。此外,由于人类日常处理的任务往往是多模态的复杂交互,因此智能体必须具备全面的能力,否则难以达到预期效果。
目前市场上已经有不少智能体产品,如字节跳动的扣子、钉钉AI助手、夸克AI写作助手CueMe以及百度的AI助手百小应等。互联网巨头凭借多年积累的资源,与行业伙伴之间更容易形成资源互补。对于创业公司与大厂之间的竞争,张鹏表示,智谱AI更侧重于技术驱动,其次是目标导向,并不会局限于短期内的技术变现。在生态系统建设方面,智谱AI持开放态度,鼓励合作伙伴在其开放技术平台上开发自有应用和商业价值。
从技术角度来看,智谱AutoGLM的技术负责人刘潇解释道,AutoGLM本质上是一个基于用户图形界面的交互智能体,通过模仿人类操作来完成任务,而不是依赖传统的机械调用方式。
张鹏还提到,AutoGLM在人与应用之间提供了一个执行调度层,显著改变了人机交互模式。未来,智谱AI看到了LLM-OS(大型语言模型操作系统)的可能性,基于大模型的智能能力,有望实现更加自然的人机交互。
LLM-OS是一种基于深度学习技术的创新操作系统,利用大型语言模型作为核心组件,实现操作系统层面的智能化功能。
在大模型时代操作系统布局方面,张鹏表示,智谱AI主要通过与现有操作系统厂商合作的方式进入市场,将AI能力融入其中,推动原生大模型的新操作方式。目前,团队正在开展相关研究工作。