岩芯数智展示机器人多模态能力

图灵汇官网

在2024年的全球人工智能盛会WAIC上,上海岩芯数智展示了其创新的Yan1.2多模态大型模型,这款模型以其卓越性能和广泛应用潜力吸引着众人的目光。令人瞩目的是,该模型不仅能在手机、电脑以及树莓派等不同设备上无缝运行,还展现出对用户模糊指令和意图的精准理解和执行能力。

现场演示中,研发团队呈现了搭载Yan1.2多模态大模型的智能机器人“小智”。这款机器人借助Yan1.2的综合语音与视觉处理能力,能够实时感知环境变化,迅速理解用户的模糊指令及意图,并据此灵活操控其机械结构,高效执行各种复杂任务。尤其引人注目的是,“小智”所配备的核心硬件——树莓派第五代芯片,以其极低的算力需求,实现了在有限资源下展现强大多模态功能的壮举。

例如,在收到“让一让,我要放东西”的模糊指令时,“小智”能准确判断用户的真实意图及行动方向,进而作出恰当的避让动作。面对诸如“小智,你现在看到了什么?”这样的提问,或是与“小智”一同阅读书籍的邀请,“小智”则能够利用其多模态能力,精确描绘环境与人物特征,甚至学习书籍信息,展现出超越常规的交互能力与学习智慧。

本文来源: 图灵汇 文章作者: 大话区块