科技媒体《The Decoder》于9月18日发布了一篇报道,英伟达高级科学家Jim Fan预测,未来几年机器人领域将出现重大突破,类似于GPT-3在自然语言处理领域的变革。
Jim Fan在斯坦福大学视觉实验室获得博士学位,师从著名学者李飞飞教授。他的研究领域涵盖多模态基础模型、强化学习和计算机视觉,曾在谷歌云AI、OpenAI和百度硅谷人工智能实验室等机构实习。
目前,Jim Fan在英伟达公司领导AI相关研究,团队正致力于开发名为“Project Groot”的项目,旨在为创建人形机器人基础模型做出贡献。Fan预测,未来两到三年内,机器人基础模型的研究将取得重大进展。尽管如此,他承认机器人真正融入日常生活还需更多时间。
在接受红杉资本采访时,Fan表示期待机器人领域出现“GPT-3时刻”,即基础机器人模型取得重大突破,其影响力能与GPT-3在语言处理领域的成就相媲美。
Fan指出,要使机器人真正走进人们的生活,不仅仅依赖技术的进步,还需要考虑成本、量产能力、硬件安全以及隐私保护和法规支持等因素。他认为,人形机器人硬件生态系统的完善将在未来两到三年内实现。
英伟达在开发机器人人工智能时采用互联网数据、模拟数据和真实世界机器人数据相结合的方法。Fan博士强调了这种方法的优势与局限,并认为三者的结合是成功的必要条件。此外,英伟达正在研发如“Eureka”等技术,通过语言模型生成机器人训练的奖励函数,实现自动化流程。
除了关注现实世界的应用,Fan的团队还在探索用于视频游戏等虚拟环境的AI代理。他发现这些领域存在许多共通之处,并致力于开发一种长期能同时控制虚拟和实体代理的统一模型。