图灵汇 2 月 15 日消息,科技媒体 marktechpost 昨日报道了微软 Microsoft Research 团队的一项创新——Data Formulator,该工具通过一种概念驱动的方式有效应对了数据转换的难题。
目前,许多现代可视化工具如 Charticulator、Data Illustrator 和 Lyra,以及库如 ggplot2 和 VegaLite,通常要求输入“整洁数据”。这意味着每种可视化变量应单独成列,每个观察值应单独成行。如果数据不符合这种格式,用户需要进行转换,这通常需要编程技能和专门的工具,如 tidyverse、pandas 或 Wrangler。这样的过程会导致工作流程低效,频繁切换数据转换和可视化步骤。
Data Formulator 引入了一种新的方法,称为“概念绑定”。用户可以将数据的概念绑定到可视化通道。这些概念可以来自现有的数据列,也可以根据需求创建。Data Formulator 提供了两种创建新概念的方法:一是通过自然语言提示来推导数据,二是通过示例输入来重塑数据。用户选定图表类型并映射所需概念后,Data Formulator 的 AI 后端会自动推断出必要的数据转换并生成候选的可视化结果。
系统为这些候选结果提供了详细的反馈,用户可以在一个直观的界面上检查、优化和迭代这些可视化结果。通过结合自然语言和编程示例,用户可以利用熟悉的配置工具,同时也能访问强大的数据转换功能。
用户测试显示,Data Formulator 在任务完成度和可用性方面表现优异。参与者平均在 20 分钟内完成了所有分配的可视化任务,其中一项任务因为涉及到 7 天移动平均值计算而花费了较长时间。展望未来,这种概念驱动的可视化方法有望推动下一代可视化数据探索和创作工具的发展,从而可能消除长期存在的数据转换障碍。