一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

图灵汇官网

引言

9月26日,网络巨头Cloudflare发布了一系列旨在对抗人工智能(AI)爬虫的创新工具,其中包括AI审计和全面封禁AI爬虫功能。此举旨在协助网站管理员有效管理网站内容,避免其被用于AI机器人的训练过程中,从而保护网站免受异常流量冲击和敏感信息泄露的风险。

网站爬虫现象日益普遍,它们自动在网络上搜集信息,多用于构建大型语言模型的训练集,如OpenAI的GPT模型和谷歌的Bard。然而,这种自动化信息收集方式有时会导致网站流量激增,迫使管理员支付高额网络带宽费用,甚至引发隐私泄露问题。

Cloudflare推出的解决方案融合了签名对比、启发式算法、机器学习与行为分析技术,能精准识别AI爬虫的活动。用户能详细查看爬虫行为,如类型、访问频率及扫描内容,从而实现对“善意”的AI爬虫的区分和放行,这类爬虫遵循robots.txt规则,对网站无额外负担,且不会直接用于模型的全面训练。

对于不确定如何应对AI爬虫的情况,Cloudflare还提供了一键操作的封禁功能,允许网站管理员轻松屏蔽所有AI爬虫,确保网站资源的安全与隐私不受侵犯。

随着大型语言模型的兴起,网络爬虫已成为获取训练数据的主要手段之一,导致原本合作式的数据收集过程变得复杂化。面对这一挑战,Cloudflare等网络服务提供商推出禁用AI爬虫服务,旨在维护网络环境的公平与秩序,促进健康的数据共享生态。

本文来源: 互联网 文章作者: 长江商学院
    下一篇

导读:智东西(公众号:zhidxcom) 作者 | 程茜 编辑 | 心缘 今年,人形机器人仿佛被按下了加速器!27款人形机器人扎堆亮相,跳舞、书法、做咖啡样样全能;数十笔亿元大额融资涌向人形机器人,银