标题:商汤科技发布“日日新SenseNova 5.5”大模型体系,探索人工智能关键转折点
伴随AI大模型的爆发,生成式人工智能迎来飞跃性发展。在2024年世界人工智能大会期间,商汤科技宣布发布“日日新SenseNova 5.5”大模型体系,CEO徐立在会议上强调,当前人工智能正处于关键转折期,构建超级应用需行业共同努力。
中国人工智能产业经历了哪些重大变革?如何塑造独特竞争优势?未来人类与科技如何共生?针对这些问题,时代周报记者采访了商汤智能产业研究院院长田丰,深入探讨AI行业现状与未来发展。
十年间,商汤与行业一同成长。行业已历经两个发展阶段:一是感知智能时代,涵盖智慧城市、智能手机、自动驾驶等技术,依赖摄像头进行感知;二是随着2018年后AI大模型的研发与2023年ChatGPT的兴起,进入AI 2.0时期。
当前2.0阶段分为上下两部分,上半场聚焦知识工程,需大量高质量数据喂养大模型,涵盖人文社科、医疗、法律等领域;下半场则是具身智能驱动的工业革命,商汤正处在这一阶段的初期。
具身智能将实现AI与物理世界深度融合,赋予AI感知、记忆、决策等综合能力,与机器人等执行体协作。这标志着AI将从数字世界的数智生产力转变为改造物理世界的强大生产力。
围绕算力,讨论从未停歇。算力的提升加速了行业发展,影响着人类生活。每一代大模型对AI算力的需求呈指数级增长,推动了算力技术的快速发展。
商汤于2018年开始研究大模型,注意到算力的巨大缺口后,于2020年在临港新区建设新一代人工智能计算与赋能平台,开发新型人工智能基础设施SenseCore商汤大装置。此举使商汤成为最早布局AI智算中心的公司,并发布首个过千亿参数级大模型。
商汤临港AIDC项目实现了全连接万卡的AI超算集群,适配多种国产GPU芯片,但算力需求依然旺盛。为应对挑战,商汤采用端云一体融合的大模型架构,通过优化资源配置,显著提升了用户体验与服务质量。
大模型的进阶需关注知识、推理与执行能力的提升。商汤致力于构建无所不知的大模型,使其具备广泛的知识储备与精准的逻辑分析能力。未来目标是使模型达到人类顶尖水平,实现理论知识的实践转化。
数据是模型生命线,高质量数据至关重要。商汤通过合作获得各行业龙头的高质量数据集与领域顶尖专家的思维链数据,确保模型性能与应用效果。合成数据能力在训练中日益重要,成为数据竞争的关键技术。
商汤具备全栈自研模式,包括底层AI算力基础设施、数据管线工具与基础大模型,形成了自闭环的创新价值体系。展望未来,商汤期待实现人机共智、开放共享与普惠向善的理想状态,推动AI技术与社会福祉的和谐发展。
通过深入交流与讨论,商汤与时代周报共同探讨了人工智能行业的现状与未来,揭示了技术创新与应用背后的挑战与机遇。