当地时间12月3日,亚马逊云科技(AWS)在年度re:Invent大会上正式发布了Nova系列AI模型,标志着亚马逊在前沿基础大模型领域的重大突破。亚马逊CEO安迪·贾西亲自宣布了这一消息,彰显了公司在AI领域的雄心。
(来源:亚马逊)
“我们一直在开发前沿模型,过去四到五个月里取得了显著进展。我相信这些模型能为客户带来巨大价值。”贾西的讲话表达了对Nova系列模型的信心。
目前,在云服务与自研AI大模型的竞争中,微软、谷歌和亚马逊已形成“三足鼎立”的格局。微软凭借GPT+Azure、谷歌的Gemini+Google Cloud以及亚马逊的Nova+AWS展开正面竞争。
Nova系列包含六个模型,涵盖文本、图像和视频生成等多个领域。其中,Micro、Lite、Pro和Premier模型专注于文本处理,而Canvas和Reel模型则致力于创意内容生成。尽管相比谷歌和Meta,亚马逊的大模型起步较晚,但一口气发布六个模型展示了其后发优势,力求通过一站式解决方案满足各类客户需求。
在文本处理领域,Nova系列设定了明确的梯度布局。Micro模型专注于纯文本处理,具有超低延迟,适用于文本总结、翻译等任务;Lite模型则在文本处理基础上增加了对图像和视频的理解能力,适用于文档分析和客户互动;Pro模型则在多模态处理能力上实现了“精度、速度和成本的最佳平衡”;Premier模型作为旗舰版本,将于2025年初推出,专注于复杂推理任务,并可作为“教师模型”训练定制化模型。
在创意内容生成方面,Nova Canvas和Nova Reel模型的加入使产品线更加完善。Canvas模型能够生成并编辑高质量图像,用户可精确控制配色方案和布局;Reel模型则提供视频生成功能,支持镜头平移、360度旋转和变焦等高级摄影技巧,且在视频质量和一致性方面表现优异。
Nova系列模型支持超过200种语言,并针对15种主要语言进行了优化。此外,亚马逊强调了Nova系列模型的安全性和负责任的AI应用,内置内容审核和水印等安全措施,以防止有害内容传播。
亚马逊高级副总裁罗希特·普拉萨德指出,Nova系列设计充分考虑了开发者面临的问题,显著提升了延迟、成本效益和信息基础等方面的性能。未来,亚马逊计划推出更多功能,包括2025年推出的语音到语音模型和“任意到任意”模型,实现文本、语音、图像和视频之间的无缝转换。
对于企业用户而言,Nova系列的一大亮点是与AWS基础设施的无缝集成。通过Amazon Bedrock平台,企业能够微调和蒸馏模型,以适应特定业务需求。亚马逊公开表示,有企业在广告领域使用Nova工具后,实现了广告产品数量增加5倍、每个产品图片数量翻倍的效果,展示了Nova系列在商业应用中的巨大潜力。
随着Nova系列的发布,亚马逊正式加入了生成式AI的竞争舞台,而这场云服务与AI大模型的“三足鼎立”竞争才刚刚开始。