科技媒体 analyticsindiamag 在 5 月 7 日发布了一篇文章,提到 Hugging Face 推出了一个名为 Open Computer Agent 的新工具。这个工具可以在云端运行,允许用户通过简单的文本命令来操作基于 Linux 的虚拟机。例如,用户可以用它来启动 Firefox 等应用程序。
文章中提到,Open Computer Agent 使用了多种技术,包括 smolagents 和 Qwen2-VL-72B(一种视觉语言模型),以及 E2B Desktop。这些技术支持用户执行一些基本任务,比如打开软件。此外,该工具内置了常用的浏览器如 Firefox,能够快速响应一些简单的英文指令,比如访问特定网站或者查询路线。不过,在处理更复杂的任务时,它的表现还有提升空间。
在初期测试中,有些用户反映工具的反应速度不够快,有时会出现性能波动的问题,特别是在处理验证码时容易出现问题。尽管如此,Hugging Face 表示推出这款工具的主要目的是展示开源模型在云端部署的可能性及其成本效益。
目前,该工具已经面向大众开放,但由于申请人数较多,感兴趣的用户可能需要排队等候使用的机会。Hugging Face 强调,这款工具并不是要达到尽善尽美的状态,而是希望借此展现开源解决方案的优势所在。