Google Research 最近展示了一种利用人工智能读取手写内容的新技术——InkSight。这一系统可以直接从手写文字的图片中提取出数字文本,而无需借助任何中间设备。
传统的手写文字识别技术主要依靠光学字符识别(OCR)。然而,在复杂背景、模糊不清或低光照条件下,这种技术的表现往往不尽如人意。InkSight 采用了一种全新的方法,它模仿人类学习阅读的过程,通过不断重写文本来学习整个单词的外观和含义。
InkSight 在处理复杂场景方面表现尤为出色,例如光线昏暗、文本部分被遮挡或背景干扰严重的情况。研究显示,人类能够准确阅读 InkSight 生成的文本描摹,准确率高达 87%,其中三分之二的结果几乎无法与真实手写区分开来。
对于喜欢手写的人而言,InkSight 具有巨大的潜力。只需将手写笔记拍照,就可以立即将其转换为可搜索的数字文本。而对于那些字迹潦草的人来说,InkSight 可以将难以辨认的手写内容转化为清晰、准确的打印文本。
从更广泛的角度来看,这项技术对于破译和将几个世纪以来的手写文本转换为数字形式具有重要意义。即使对于那些数字化程度较低的语言,InkSight 也能帮助保护手写遗产,并为这些语言的数字化训练提供更多资源。
值得注意的是,谷歌并不是唯一一家致力于开发手写识别 AI 工具的公司。例如,亚马逊的 Kindle Scribe 电子阅读器也具备将手写笔记转换为可读文本的功能。此外,Goodnotes 等数字笔记应用也推出了手写识别和编辑功能,可以将手写文字转换为可编辑的数字文本。