2022年11月9日,OPPO语音语义研究部的融智团队开发的中文预训练大模型CHAOS,在中文自然语言理解测评基准CLUE上取得了显著成就,以30亿参数刷新了CLUE总排行榜、分类任务排行榜和阅读理解排行榜的最佳成绩。在“AFQMC、TNEWS、CSL、CHID1.1”这四个赛道中,CHAOS的表现甚至超过了人类的精确度,整体成绩仅比人类水平低0.1。
同时,该团队自主训练的中文多模态预训练模型也在MUGE(Multimodal Understanding and Generation Evaluation)综合评测中排名第一。MUGE是由达摩院联合浙江大学、阿里云天池平台以及中国计算机学会计算机视觉专委会共同推出的首个大规模中文多模态评测基准,涵盖图文检索、看图说话、文本到图像生成等多个任务。
CLUE作为中文自然语言理解领域的重要评测榜单,包含多个语义分析和理解的任务,旨在推动自然语言处理技术的发展,对学术界和产业界都有重要影响。MUGE则致力于帮助研究人员全面评估多模态算法模型。
自然语言处理技术是人工智能的核心研究方向之一,目标是使计算机具备人类的听说读写能力,并能运用知识和常识进行推理和决策。目前,多模态技术的研究重点在于建立图像和文本之间的联系,这种能力可以应用于搜索、推荐、服装设计和智能文案等多个实际场景。
融智团队的目标是融合多种智能,研发统一的基础模型。未来,该团队将继续在感知与认知融合、可控的视觉生成以及模型小型化等方面取得进展。