刚刚过去的2024年,企业和技术领域发生了许多新变化。企业在阐述其发展战略时,常用“降本增效”、“出海创收”和“高质量发展”等关键词。与此同时,o1与智能体成为了AI技术发展中的热门话题。如今,即便是体育赛事也更加重视高级数据分析。对于企业而言,无论是转型还是AI赋能,都离不开对数据资源的有效开发。
在告别粗放式发展的过程中,企业更加注重“降本增效”,而不是单纯增加人员和设备投入。创新技术在其中起到了关键作用。例如,中国制造业企业正朝着提高技术含量和附加值的方向发展,智能制造、自动化和机器人技术成为重点。数据在企业中的角色也从生产环节的数据转向分析数据。这些数据会在公有云和私有平台上分配,并最终通过SaaS模式服务于客户。
随着数据量的不断增加,企业正从传统的数据仓库转向数据湖仓一体化。以前的数据分析主要依赖报表系统和数据仓库,但随着业务需求的增长,数据的实时性、完整性和结构化与非结构化数据的支持变得更为重要。数据管理的重点逐渐转向数据湖仓一体化。
此外,数据网格或数据编织技术作为企业数据治理的重要工具,整合了各种数据格式和语言,为企业提供了新的沟通和协作模式。特别是对于拥有复杂股权结构的企业,数据网格理念在解决跨部门、跨架构的数据协作问题方面尤为有效。
AI应用的成功很大程度上取决于数据的信任度。企业需要从零开始积累数据资产和相关文化。例如,许多企业在大语言模型流行前已经建立了成熟的OCR系统和智能客服。这些基础是企业实现真正突破的关键。数据不仅是技术的基础,更是企业建立独特竞争优势的核心。
展望2025年,Cloudera预测生成式AI的热度将有所降温,企业将采取更为实际的AI策略。企业将不再被生成式AI的炒作所迷惑,而是专注于与企业整体目标相一致的技术投资计划。生成式AI应用将从简单的内部知识库问答系统逐步扩展到外部服务,这对准确性提出了更高要求。
AI智能体将在商业决策中扮演重要角色,特别是在实时问题解决和决策过程中。这将促使企业构建事件驱动型架构,以支持AI快速响应现实事件,从而改变电信和物流等行业。
例如,某家制造业企业将电池信息的收集频率从每小时一次提升到每几分钟一次,大大提高了数据的实时性和精确性。然而,数据量的激增也带来了存储和分析方面的挑战。企业需要高效的存储解决方案,同时还要优化算法和数据管理,以最大化数据的价值。
AI的广泛应用使得企业需要处理大量的AI生成数据。如何从中提取有价值的信息成为了一个迫切需要解决的问题。企业必须从不断增长且种类繁多的数据中获取洞察力,避免因糟糕的数据管理而陷入信息过载。
随着企业致力于生成式AI的全面生产和规模化部署,单一的混合云架构已无法满足需求。企业需要能够跨云访问数据的算法与分析算法,同时追求经济性。由于数据传输成本高昂,企业需要在分布算力和数据之间找到平衡,以构建AI算法。
德勤研究指出,合规风险和治理问题是企业采用生成式AI的主要障碍。混合数据管理平台因其灵活性和广泛的数据访问能力,越来越受到企业的青睐。这些平台能够集成本地与云数据源,提供更高的安全性和治理水平。
预计到2025年,私有大语言模型将逐渐取代公有大语言模型,成为企业的首选。这主要是因为私有大语言模型能够更好地满足合规和隐私需求。越来越多的企业将采用企业级大语言模型,这对GPU性能提出了更高要求,以确保数据管理系统具有更高的安全性和隐私保护。RAG技术将得到更广泛的应用,将通用大语言模型转化为行业或组织专属的数据仓库,从而为现场支持、人力资源和供应链等领域提供更加精准、可靠的数据支持。