谷歌Gemini 2.5 Pro震撼发布：单次处理百万token，多模态推理能力再进化

43:00

3月26日，谷歌发布了新一代人工智能推理模型Gemini 2.5系列，其中首发版本Gemini 2.5 Pro因其卓越的技术表现受到广泛关注。这款模型在多个基准测试中达到了领先水平，尤其以能够一次性处理100万token（大约75万单词）的上下文窗口容量，重新定义了长文本和多模态推理的标准。

Gemini 2.5系列的一大亮点是其思维链推理功能。不同于传统的直接输入输出模式，该模型在解决复杂问题时，会模仿人类的思考过程，先进行系统的分析和推导，再给出最终答案。这种方法大幅提高了模型在数学和科学领域的问题解决能力和逻辑准确性。举例来说，Gemini 2.5 Pro在不需要额外计算开销的情况下，在GPQA和2025年AIME等测试中取得了优异成绩。

此外，Gemini 2.5 Pro拥有百万token的上下文窗口，这使得它能够轻松解析像《指环王》这样的长篇作品，或者同时处理几小时的视频、音频以及代码文件。谷歌计划未来将这一能力提升到200万token，以便更好地处理复杂的跨模态任务。

Gemini 2.5 Pro继承了Gemini系列的多模态处理优势，可以无缝处理文本、图像、音频、视频和代码等多种格式的内容。这种灵活性让它在智能客服、内容制作和数据分析等领域具有广阔的应用前景。比如，用户可以直接上传一段视频并提问，模型会综合画面、语音和字幕信息，提供精确的答案。

目前，Gemini 2.5 Pro已经可以通过谷歌AI Studio和Gemini Advanced用户区供开发者和企业使用，支持多种设备访问。开发者能利用其API快速开发智能应用程序，而企业则可以用它来完成自动化报告生成和跨模态数据分析等高级任务。谷歌承诺将继续改进模型性能，降低大规模使用的成本。

利空

利好

首页 - 快讯 - 快讯详情

登录

微信扫一扫：分享