为了进一步探索 Gemini 的思考能力,Google 开始测试一种名为 Deep Think 的增强推理模式。这种模式通过新的研究技术,使模型在回应前能够考虑多种假设。
从效果上看,Gemini 2.5 Pro Deep Think 版本在多个高难度基准上表现出色,超越了 OpenAI o3 和 o4-mini。其中包括:
* 在 2025 年 USAMO(美国数学奥林匹克) 测试中取得了优异成绩;
* 在面向竞赛级编程能力的高难度基准 LiveCodeBench 上领先;
* 在 MMMU(多模态推理测试)中取得 84.0% 的高分,展现出卓越的多模态推理能力。
Ginimi 教程
此外,Gemma 3 系列也迎来更新,为满足移动设备端的 AI 需求,Google 联合高通、联发科、三星等厂商提出了一个全新的前沿框架 Gemma 3n,其借助 Google DeepMind 的一项创新技术——逐层嵌入(Per-Layer Embeddings, 简称 PLE),实现了显著的内存使用优化。尽管模型的原始参数量分别为 50 亿(5B)和 80 亿(8B),但借助 PLE 技术,这些更大的模型可以在移动设备上运行或从云端实时推理时,内存开销仅相当于 20 亿(2B)或 40 亿(4B)参数模型,即只需 2GB 或 3GB 的动态内存即可运行。
发布者:Ai探索者,转载请注明出处:https://javaforall.net/236034.html原文链接:https://javaforall.net
