随着机器学习在过去几年中的广泛讨论,这一技术逐渐变得更为普及。然而,当人们讨论或思考机器学习及其对经济和社会的影响时,仍有不少陈词滥调和误解,如“数据是新的石油”或“人工智能将接管所有工作”等。最近,A16Z的合伙人兼知名分析师Benedict Evans撰写了一篇文章,探讨了如何更深入地理解机器学习及其影响。这篇文章标题为“Ways to Think About Machine Learning”,由36氪翻译,希望能为你提供一些启示。
近年来,机器学习已经发展到一个新的阶段,几乎每个人都有所耳闻。其影响不仅体现在新兴企业的涌现,也体现在大型科技公司对其的重视,以及主流媒体对相关话题的关注。可以说,机器学习已成为下一个重大趋势。
虽然我们已经对神经网络有所了解,但机器学习的核心在于从数据中提取模式和结构,这些模式和结构往往是隐含且概率性的,而非显而易见。机器学习解决了许多过去难以用计算机解决的问题,或是那些难以用语言描述的问题。同时,我们也看到了一些有趣的展示和演示。
然而,对于机器学习到底意味着什么,我们尚未形成清晰的认识。具体而言,机器学习对科技公司或更广泛经济体系中的公司意味着什么?它如何推动新事物的发展?又或者,机器学习对我们所有人意味着什么?它能解决哪些重要的问题?
“人工智能”这个词并不能提供太多帮助,因为它常常引发不必要的争论。当我们提到“人工智能”时,往往会联想到电影《2001太空漫游》中的场景,这让我们陷入一种混乱的状态。因此,我们不能简单地对“人工智能”进行分析。
事实上,我们可以提出一些对理解机器学习并无实际帮助的观点,例如: - 数据是新的石油 - Google和中国(或Facebook、亚马逊、BAT)拥有所有数据 - 人工智能将接管所有工作
相比之下,更有意义的话题包括: - 自动化 - 支持技术层 - 关系数据库
为什么选择关系数据库?关系数据库是一种新的基础支持层,改变了计算的能力。在20世纪70年代末关系数据库出现之前,要查询数据库(如“所有购买此产品的客户”)通常需要定制工程。数据库结构无法轻松支持任意查询,而关系数据库的出现改变了这一点,将数据库从简单的记录系统转变为商业智能系统。
关系数据库的引入不仅改变了数据库的用途,还催生了新的应用和价值数十亿美元的公司。它带来了Oracle,也带来了SAP,后者推动了全球即时供应链的发展,使得苹果和星巴克这样的公司得以成长。到20世纪90年代,几乎所有企业软件都依赖于关系数据库,如PeopleSoft、CRM和SuccessFactors等。
因此,我们可以将机器学习视为一种类似的关系数据库,它将改变我们使用计算机的方式。机器学习将成为不同公司不同产品的一部分,最终几乎所有东西都会包含机器学习,而人们不再关注这一点。
值得注意的是,尽管关系数据库具有规模经济效应,但网络效应或“赢家通吃”效应并不显著。购买相同数据库软件的不同公司不会互相影响。机器学习也是如此,它依赖于特定的数据集,这些数据集对特定应用有效,但对其他应用无用。数据不可替代。
这正是讨论机器学习时常见的误解的核心——机器学习并非单一的、通用的东西。它并非一条通往HAL 9000的道路,而是一个不断演进的过程。机器学习不会创造HAL 9000,但它也不是简单的统计数字。它更像是关系数据库,是一种支持层。
谈到机器学习的挑战,就是如何在数学解释和对通用人工智能的幻想之间找到平衡。机器学习不会创造HAL 9000,但它确实可以帮助解决计算机以前无法有效解决的问题。每个问题都需要不同的实现方式、数据和方法,往往需要不同的公司参与。它们都是自动化的一部分。
因此,我们需要思考两个方面:一是从数据类型和问题类型的视角;二是从自动化过程的视角。
从数据类型和问题类型的视角来看: - 机器学习可以优化现有问题,只需有相关数据。例如,Instacart使用机器学习优化超市路线,提升了50%的效率。 - 机器学习可以让你对已有数据提出新的问题。例如,律师可以使用机器学习搜索有关“愤怒”或“焦虑”的电子邮件或文档。 - 机器学习可以分析新的数据类型,如音频、图像或视频。
从自动化过程的视角来看,机器学习提供了无限的实习生或10岁的孩子的力量。机器学习不需要数十年经验的专家,而是通过处理大量数据,发现人类无法识别的模式和规律。
总的来说,机器学习不仅解决了人类已知的问题,还发现了人类无法识别的模式和规律。它通过自动化过程,让计算机完成过去难以实现的任务,从而推动技术的发展。
原文链接:https://www.ben-evans.com/benedictevans/2018/06/22/ways-to-think-about-machine-learning-8nefy
编译组出品。编辑:郝鹏程