梅宏院士“五问”大数据

图灵汇官网

7月5日,中国科学院院士梅宏在2023全球数字经济大会主论坛上发表了主旨演讲。他认为,数字经济时代已经到来,这是一种继农业经济和工业经济之后的新经济形态。数据技术体系、数字治理体系以及数据要素市场是推动数字经济发展的三大支柱,数据作为生产要素是这一时期的关键特征。

梅宏从五个角度探讨了大数据技术面临的挑战,并分析了大数据技术未来的发展趋势。首先,他提到构建以数据为中心的计算体系的重要性。随着数据处理需求呈指数级增长,现有的线性增长的数据处理能力已无法满足需求。因此,需要寻找新的性能提升方法,如采用新硬件技术和人工智能技术。此外,大规模数据处理带来的高能耗也是一个重要问题。

其次,梅宏强调了管理大规模数据的重要性。数据已经成为数字经济活动中不可或缺的一部分,需要对其进行高效管理和组织。然而,数据管理面临着从单一域到跨域管理的挑战,同时也需要解决数据可用性和安全性的问题。

第三,梅宏指出了大数据高效处理的需求。新型数据处理需求对现有的大数据处理系统提出了新的挑战。例如,实时数据的动态倾斜和超大容量特性使得处理过程更加复杂。此外,图数据的不规则访问和复杂的依赖关系也增加了处理难度。

第四,他谈到了多源异构大数据的多模态融合分析和可解释性分析。随着数据量的增加,数据融合分析变得更加复杂。同时,模型的可解释性、稳定性和公平性也变得尤为重要。

最后,梅宏讨论了系统化大数据治理框架和技术。数据要素化需要有效的治理技术体系支持,涵盖数据汇聚融合、质量保证、安全与隐私保护、开放流通等方面。此外,他还强调了形成大数据标准规范和推进开源社区建设的重要性。

关于大数据技术的未来发展趋势,梅宏认为数据与应用将进一步分离,以促进数据要素化。为了实现可持续发展,高能效大数据技术栈的构建至关重要。同时,需要建立全国一体化的高能效大数据中心,推动低碳发展。此外,数据管理将从单域转向跨域,促进数据共享和协同服务。在数据分析方面,将从单一域单模态分析转向多域多模态融合分析,实现广谱关联计算。在数据治理方面,数联网将成为重要的基础设施,推动数据驱动的服务质量保障和保护机制的研究。

本文来源: 图灵汇 文章作者: 华为终情