2023年8月21日,谷歌公司通过其官方博客宣布了一项重大进展——已通过Google Cloud API向科研人员开放了其AI模型“健康声学表征”(Health Acoustic Representations, 缩写为HeAR)。此举措旨在加速医疗诊断领域的技术创新,特别是利用声音数据来辅助疾病识别。
谷歌在此次公告中强调,HeAR AI模型能够通过分析个体的咳嗽声和呼吸模式,协助人类诊断疾病。这一突破性功能尤其在医疗资源相对匮乏的地区展现出显著价值,有望成为早期检测和预防疾病的有力工具。
谷歌指出,HeAR模型在识别健康相关声学数据中的关键特征方面表现出色,优于其他现有模型。其特别设计使得模型即使在数据量有限的情况下也能高效运行,这在医疗研究中尤为重要,因为获取大量高质量数据往往面临挑战。
为了实现这一目标,谷歌研究团队采用了包含3亿条音频数据的多样化、匿名化数据集进行HeAR模型的训练。其中,针对咳嗽声的训练数据量达到了惊人的1亿条,为模型提供了丰富的学习基础。
HeAR模型的应用潜力广泛,特别是在医疗保健领域。例如,印度的呼吸健康科技公司Salcit Technologies正利用HeAR增强其AI模型Swaasa,以早期检测肺结核,尤其是在医疗资源有限的地区,此举具有深远的社会影响。
除了肺结核,HeAR还展示了在不同麦克风环境下的通用性,意味着它能够用于筛查多种呼吸系统疾病,推动声学健康研究进入新阶段。谷歌致力于将这项技术推向市场,以支持全球医疗界开发创新解决方案,降低早期诊断和治疗的门槛。
谷歌通过开放HeAR模型给科研人员,不仅促进了医疗诊断技术的发展,还为解决全球医疗资源分配不均的问题提供了一个创新途径。这项技术的普及有望在全球范围内促进公共卫生事业的进步,实现更广泛的健康福祉。