图像识别领域四大天王谁最强?谷歌实力碾压微软IBM亚马逊

图灵汇官网

图像识别哪家强?谷歌、微软、IBM、亚马逊谁更胜一筹?

图像识别是衡量AI智能程度的重要指标之一。在这一领域,微软、IBM、谷歌和亚马逊这四家科技巨头均投入了大量资源进行研发。那么,究竟哪一家在图像识别方面表现更为出色呢?

Perficient Digital的研究团队发布了一份针对这四家公司在图像识别方面的研究报告。报告显示,谷歌在图像识别方面取得了81.7%的准确率,位居第一;IBM的准确率为55.6%,位列最后。

此次研究涵盖了亚马逊AWS Rekognition、谷歌Vision、IBM Watson和微软Azure Computer Vision四大图像识别引擎。研究共使用了2000张图像,分为图表、风景、人物和产品四大类。

图像识别引擎标签准确度

在准确度评估中,研究团队对500张图像进行了标签准确性判断,得出以下结论:

  • 谷歌Vision以81.7%的准确率拔得头筹;
  • 亚马逊AWS Rekognition以77.7%的准确率紧随其后;
  • 微软Azure Computer Vision以75.8%的准确率位列第三;
  • IBM Watson以55.6%的准确率垫底。

置信水平

除了准确率外,各引擎还会提供置信度分数,以表示其对标签的信心程度。研究发现,当置信度达到90%或以上时,三个引擎(亚马逊、谷歌和微软)的准确率超过了人类手动标记。而在80%置信度的情况下,四个引擎的表现与人类手动标记相差无几。

与人类想法的匹配度

研究还考察了图像识别引擎能否与人类想法匹配。研究人员向用户展示了每个引擎为2000张图像提供的前五个最高置信度标签,然后让用户选出最符合图像的标签。结果显示,尽管谷歌Vision表现最佳,但手动标记的图像依然优于所有引擎。

图像识别引擎的词汇表

研究还分析了各引擎返回的标签词汇,发现不同平台在词汇选择上有显著差异。例如,IBM Watson在描述色彩方面表现出色,而谷歌Vision和微软Azure Computer Vision则更善于识别动物,尤其是猫。

总结

总体而言,谷歌Vision在图像识别方面表现最为出色,不仅准确率高,还能在高置信度情况下取得更好的成绩。IBM Watson虽然在某些方面表现出色,但在整体表现上略显逊色。尽管如此,图像识别技术仍在不断发展,未来仍有巨大的进步空间。

本文来源: 图灵汇 文章作者: 中新经纬