在中国人工智能技术快速发展的背景下,本土企业云从科技以其卓越的技术实力,在大模型领域实现了新的突破。根据权威测评机构SuperCLUE发布的《中文大模型基准测评报告》,云从科技自主研发的从容大模型表现亮眼,成功晋升至领导者象限,并以70.35分的优异成绩位列国内大模型综合测评第六名,正式进入国内大模型的第一梯队。
此次测评覆盖了32个国内外知名大模型,从容大模型在激烈的竞争中脱颖而出,展现出了在中文大模型领域的领先地位。相较于广受推崇的GPT系列模型,从容大模型不仅超越了GPT3.5,与全球领先的GPT-4之间的差距仅为4.97分,这表明云从科技在大模型领域正在逐步接近国际领先水平。
从容大模型在计算能力、知识百科能力和语义理解能力方面均表现出色,分别获得了75.8分、80.6分和74.8分的高分,分别排名国内第一、第三和前五,显示出其在不同任务上的强大实力。
在与GPT-4的直接对比中,从容大模型在对战中赢得了20.79%的胜率,仅次于Claude3-Opus,进一步证明了其在实际应用中的竞争力。这不仅是对云从科技研发团队不懈努力的认可,也展示了中国AI技术的显著进步。
云从科技在OpenCompass的多模态评测中也取得了重要进展,从容大模型在该体系中的平均得分达到了65.5,使其跻身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v,仅次于GPT-4o(69.9)和Claude3.5-Sonnet(67.9)。在国内市场,从容大模型的表现同样优秀,超过了InternVL-Chat(61.7)和GLM-4V(60.8),位列榜首。
除了在大模型领域的杰出表现,云从科技还提出了一种视觉-语言跟踪大一统模型All-in-One,并在跨模态领域刷新了四项世界纪录。在COCO基准测试中,视觉大模型从微软研究院、上海人工智能实验室、智源人工智能研究院等多家知名企业和研究机构中脱颖而出,刷新了世界纪录。多模态大模型在ICCV2023细粒度行为检测挑战赛中击败了早稻田大学、软银等国内外知名企业、科研机构,夺得了冠军。
云从科技的一大亮点在于其自研的多模态大模型基础架构“all in one Transformer”,使得从容大模型仅需少量算力就能实现与第一梯队AI性能相当的效果,从而有利于降低成本、提高效率,加速行业大模型和AI智能体的普及与应用。
综上所述,云从科技在SuperCLUE的综合基准测评中的优异表现,不仅代表了中国在AI大模型研发领域的显著进步,同时也预示着云从科技在全球AI竞争格局中的重要地位将进一步提升。