自从大语言模型如ChatGPT风靡全球以来,人们也开始关注如何在去中心化网络上部署类似的机器学习模型。然而,去中心化网络缺乏像OpenAI这样有信誉的公司的保障,因此需要对这些模型的运行结果进行验证。为了保护数据隐私,零知识机器学习(zkML)成为了一种可行的选择。本文将介绍zkML的基本概念、值得关注的项目以及其局限性和替代方案。
零知识机器学习(zkML)是一种在计算过程中保护隐私的方法。它包含两个关键部分:首先,使用机器学习(ML)模型完成任务;其次,证明任务已正确完成,而不透露具体细节。
运行任务:有人使用ML模型处理数据并得出结果,类似于厨师根据食谱制作蛋糕,却不透露食材的具体信息。
证明任务:任务完成后,他们会提供一个证明,比如“我使用特定的输入并在特定的模型中得到了这个结果”。这实际上是在证明他们遵循了正确的步骤。
保守秘密:zkML的亮点在于,在证明任务正确完成的同时,可以保留某些细节的私密性,如输入数据、模型运作方式或结果。简而言之,zkML可以让证明者说“相信我,我做对了”,同时保持他们的方法和数据的私密性。
在过去的一年里,许多与zkML相关的项目已经启动,其中一些还发行了代币。以下是一些值得关注的项目:
Spectral致力于为Web3构建链上代理经济。他们的旗舰产品SYNTAX是一种专有的大型语言模型(LLM),可以生成Solidity代码。Spectral允许用户创建链上自主代理,并利用去中心化的ML推断来改进智能合约。此外,通过zkML,Spectral能够提供证据证明特定预测是由特定的ML模型生成的,从而确保流程中的信任和真实性。
Spectral已发行代币SPEC,市值约为1.19亿美元。
Worldcoin正在开发一个开源系统,旨在让每个人都能参与全球经济。zkML的一个潜在用途是提高虹膜识别技术的安全性和隐私性。代币WLD市值目前约为10.7亿美元。
生物识别自托管:World ID的用户可以将自己的生物特征数据(如虹膜扫描)安全地存储在他们的移动设备上。
本地处理:用户可以从虹膜扫描中生成唯一的代码。
隐私保护证明:使用zkML,用户可以在自己的设备上直接创建证明,证实虹膜代码是使用正确的模型通过扫描准确生成的,且不会暴露用户的实际数据。
Risc Zero的目标是通过提供无需互相信任的计算服务来增强互联网的信任和效率。
扩展区块链:它使用Bonsai证明服务来执行复杂操作,从而增强区块链的安全性。Bonsai在链下管理复杂的计算和隐私数据,提高效率。
与Spice AI的合作:Spice AI提供可组合、即用型数据和AI基础设施,包括托管的云级Spice.ai OSS。此次合作旨在为开发者提供全面的zkML工具包。
机器学习服务:开发者可以使用Risc Zero安全地访问和查询数据、私密训练ML模型,并提供数据被正确处理的证明。本质上,Risc Zero为开发者提供MLaaS服务,同时确保数据和执行过程保持私密和安全。
Giza是一个在Starknet网络上运行的机器学习平台。
主要目标:Giza旨在直接在区块链上扩展ML操作。
技术基础:其使用支持零知识(ZK)证明的Starknet来验证ML操作,确保计算的准确性和安全性,并且不会泄露基础数据。
应用:在Starknet上,Giza启用“Giza Agents”来自动执行各种财务策略,包括跨协议收益聚合、资产配置、无风险做市。利用zkML的优势,Giza允许在区块链上安全、自动地执行金融策略。
Vanna是一个模块化AI推理网络,不仅与EVM链兼容,而且提供灵活的安全性,用户可以选择多种验证方式,如zkML、optimistic ZK、opML、teeML等。结合Vanna的未来应用场景,包括使用LLM生成链上GameFi游戏对话、链上智能合约漏洞检测、DeFi协议的风险预警引擎、用于标记空投中的女巫账户信誉系统。
尽管理论上zkML具有吸引力,但它目前并不太实用。AI计算本身就很耗资源,而zkML中的加密方法使其变得更加缓慢。据Modulus Labs报告,zkML可能比常规计算慢1000倍。对于大多数用户来说,这样的延迟是难以接受的。因此,目前zkML可能只适用于非常小的ML模型。在这种情况下,许多AI项目不得不考虑其他验证方法,主要有两种替代方案:
opML(Optimistic ML):这是一种乐观验证方法,假设计算是正确的,除非有证据证明其错误。
teeML(Trusted Execution Environment ML):这是一种基于可信执行环境的技术,可以在隔离的环境中执行计算,确保数据的安全性。
下图展示了三者的区别:
希望以上内容能帮助您更好地了解zkML及其相关项目。