在2024发展论坛上,蚂蚁数科AI科技技术负责人李哲强调了高质量数据在AI产业化中的重要性。他将AI数据服务的发展分为三个阶段:数据闭环、高效数据标注和多模态数据合成。
在弱人工智能时代,数据闭环是关键,蚂蚁数科通过自动化系统不断优化算法,提高人脸识别的安全性。这一系统已广泛应用在安卓手机的人脸识别安全评估中。
进入生成式AI阶段,数据标注变得尤为重要。蚂蚁数科利用自动化标注能力,为医疗、出行、社交、金融等多个领域提供高效的专业标注服务。这使得AI模型能够更好地理解和掌握人类知识。
随着AI技术向AGI时代迈进,多模态数据合成成为新的焦点。为了提升AI的泛化能力和适应性,蚂蚁数科运用仿真技术和强化学习方法,生成高质量的长尾数据,如自动驾驶中的极端天气数据和具身智能数据。
在数据管理和流通方面,蚂蚁数科推出了“DataFab”数据处理解决方案,实现了数据的可信、可控流通,显著提高了大模型训练效率。该系统已成功应用于蚂蚁集团内部的多个业务场景。
此外,蚂蚁数科还在AI安全领域进行了探索。针对人脸识别安全问题,蚂蚁天玑实验室联合多家机构制定了国内首个金融场景“AI换脸”检测标准。对于大模型的安全性和伦理问题,蚂蚁数科推出了“蚁鉴”和“天鉴”服务,为大模型的应用提供了全面的安全保障。
李哲表示,蚂蚁数科将继续在AI数据服务和技术创新上发力,与更多产业伙伴合作,共同推动AI技术在各行业的广泛应用。