Nature刊文:“open”AI的实际作用非常有限

图灵汇官网

导读:

Meta 一直坚持开源,但在业内仍饱受批评。开放源代码促进会负责人 Stefano Maffulli 曾公开指责 Meta,认为用“开放”来形容 Llama 模型是在误导用户和污染“开放”的概念。在大众认知中,“开放”通常意味着透明、共享和合作,尤其是在开源软件领域。然而,在人工智能(AI)领域,“开放”一词却引发了诸多模糊性和争议。

事实上,AI 行业资源高度集中,“开放”的真正意义和影响值得深入探讨。本文将详细解读“开放”AI 的定义、实质特征与局限性,以及它对资源共享、技术创新和市场竞争的影响。

“开放”AI 的含义

在权威科学期刊《自然》上发表的一篇文章中,科学家们系统地剖析了“开放”AI 的定义、实质特征与局限性。研究人员指出,尽管“开放”AI 这个术语被广泛使用,但其实际内涵并不明确。当代 AI 系统的开发和应用依赖于高度集中的资源,即便标榜“开放”的 AI,其透明性、可重用性和可扩展性仍受到资源垄断的限制。

“开放”AI 的定义与挑战

“开放”这一概念在 AI 领域被频繁误用和扩展。传统意义上的“开放”源于开源软件运动,具有透明性、可重用性和公平性的理念特征。然而,将这些理念直接应用于现代 AI,尤其是生成式 AI,面临着以下挑战:

  • 模型复杂性与黑箱性:现代 AI 系统由庞大的神经网络组成,仅公开模型权重和代码,不足以完全揭示其运作机制。
  • 资源依赖性:这些模型的开发和训练需要昂贵的计算力和数据,这些资源通常由少数大公司控制。
  • 技术应用的不对等性:“开放”的模型可能会被滥用,而原开发者在这些问题上难以施加影响。

“开放”AI 的优势与局限

文章作者也对“开放”AI 带来的三个关键优势进行了逐一剖析,并客观阐明了其潜力与局限性。尽管“开放”AI 提供了关键优势,特别是在资源共享、技术创新和数据使用方面,但这些优势并未能真正打破由少数大公司主导的行业格局。

  • 透明性:透明性是“开放”AI 最受关注的特性之一。一些 AI 模型会公开训练数据、权重或相关文档,允许研究人员验证系统行为。但透明性本身无法完全解答系统的复杂行为。
  • 可重用性:“开放”AI 通常允许第三方在已有的模型或数据基础上进行再利用。公开许可的数据和模型权重,以及经常使用传统的开源许可来提供这些数据,为“开放”AI 将对市场竞争产生固有积极影响的说法提供了依据。然而,市场访问仍然是一种受限制的资源。
  • 可扩展性:“开放”AI 的可扩展性表现在其支持用户基于基础模型进行微调,从而将模型适配于特定领域或任务。这是公司支持“开放”AI 的关键特征。

资源与权力分配问题

尽管“开放”AI 这个概念充满潜力,但 AI 系统的开发和应用依赖于一系列高度集中的关键资源,包括模型、数据、劳动力、算力和开发框架。这些资源不仅决定了技术的可用性,也深刻影响着市场竞争和权力分配的格局。

具体而言,在“开放”AI 的讨论中,AI 模型是最直观的焦点。许多模型仅提供 API 接口,并不能让用户真正了解其内部机制或进行修改。即便是那些较为透明的模型,也依赖于企业独占的训练资源,其他开发者难以复制这些资源,从而无法平等参与竞争。

结论

总而言之,“开放”AI 虽然在透明度与共享方面具有一定价值,但无法单独解决 AI 领域权力集中与资源不平等的问题。当前的开放性讨论更多地被大公司用作规避监管和争夺市场的工具,如果想要真正改变现状,则需要有更强有力的措施介入,包括反垄断执法和数据隐私保护,否则仅仅追求开放性不太可能带来多大益处。

未来,各方应更加关注 AI 的实际影响,而非仅局限于开放与封闭的概念之间,只有开展多维度的政策和技术实践才能构建出更公平、更负责任的 AI 生态系统。

本文来源: 互联网 文章作者: 每日咖啡资讯
    下一篇

导读:尽管大语言模型已经在许多任务中表现出色,但它们在超出训练集分布泛化方面的能力仍然未被充分理解。例如,在自然语言处理中,大语言模型在某些泛化任务中的确表现优异,但在其他任务中可能会产生事实性错误或