图像识别领域四大天王谁最强？谷歌实力碾压微软IBM亚马逊

中新经纬

2022-07-14 08:37:09

图像识别是衡量AI智能程度的重要指标之一。在这一领域，微软、IBM、谷歌和亚马逊这四家科技巨头均投入了大量资源进行研发。那么，究竟哪一家在图像识别方面表现更为出色呢？

Perficient Digital的研究团队发布了一份针对这四家公司在图像识别方面的研究报告。报告显示，谷歌在图像识别方面取得了81.7%的准确率，位居第一；IBM的准确率为55.6%，位列最后。

此次研究涵盖了亚马逊AWS Rekognition、谷歌Vision、IBM Watson和微软Azure Computer Vision四大图像识别引擎。研究共使用了2000张图像，分为图表、风景、人物和产品四大类。

在准确度评估中，研究团队对500张图像进行了标签准确性判断，得出以下结论：

除了准确率外，各引擎还会提供置信度分数，以表示其对标签的信心程度。研究发现，当置信度达到90%或以上时，三个引擎（亚马逊、谷歌和微软）的准确率超过了人类手动标记。而在80%置信度的情况下，四个引擎的表现与人类手动标记相差无几。

研究还考察了图像识别引擎能否与人类想法匹配。研究人员向用户展示了每个引擎为2000张图像提供的前五个最高置信度标签，然后让用户选出最符合图像的标签。结果显示，尽管谷歌Vision表现最佳，但手动标记的图像依然优于所有引擎。

研究还分析了各引擎返回的标签词汇，发现不同平台在词汇选择上有显著差异。例如，IBM Watson在描述色彩方面表现出色，而谷歌Vision和微软Azure Computer Vision则更善于识别动物，尤其是猫。

总体而言，谷歌Vision在图像识别方面表现最为出色，不仅准确率高，还能在高置信度情况下取得更好的成绩。IBM Watson虽然在某些方面表现出色，但在整体表现上略显逊色。尽管如此，图像识别技术仍在不断发展，未来仍有巨大的进步空间。

亚马逊碾压微软四大天王识别最强图像实力领域谷歌

本文来源：图灵汇文章作者：中新经纬

图像识别进化之路 深度学习是幕后推手