更强的 Gemini 3 Flash 模型正式登场,所有人都能免费使用

谷歌 最近更新 AI 的速度实在有够快,继 Gemini 3 Pro、Gemini 3 Deep Think、Disco、CC 之后,稍早再度推出全新「Gemini 3 Flash」,这也代表说 Gemini 3 全家族成员都登场了。 根据官方分享的测试数据,即便是Flash,其表现也只有输Gemini 3 Pro一点,这也是所有人都能免费用的模型,目前Gemini变得更强了。

更强的 Gemini 3 Flash 模型正式登场,所有人都能免费使用 -

谷歌 表示,即日起 Gemini 3 Flash 就会陆续推送给全球用户,包括 谷歌 AI Studio 平台、谷歌 Antigravity、大家最常用的 Gemini 和搜索中的 AI 模型。 在 Gemini 中,「快捷」模式就是基于 Gemini 3 Flash,取代原本的 2.5 Flash,代表说所有人都能免费使用。

企业用户部分,则可以通过 Vertex AI 和 Gemini Enterprise 中使用。

再来看测试成绩,Gemini 3 Flash 真的蛮强。

下方是 谷歌 官方分享的测试数据,最左侧是 Gemini 3 Flash 的成绩。 可以明显看到,许多测试中都非常接近Gemini 3 Pro,还有一些表现差不多的,像多语言理解能力的「MMMLU」一样获得91.8%的准确率,测试代理工具的「t2-bench」也拿到90.2%,仅输0.5%。

更重要是,测试多模态理解与推理能力的MMMU-Pro,其81.2%的成绩还赢过Gemini 3 Pro,也击败ChatGPT最新GPT-5.2,这对一般使用来说真的是大加分。

另外还有一个「Toolathlon」测试也相当猛,大幅领先 Gemini 3 Pro 和 GPT-5.2,拿到 49.4% 的成绩。 这是一个用来评估 AI「长时间、真实世界工具任务能力」。

更强的 Gemini 3 Flash 模型正式登场,所有人都能免费使用 -

谷歌 还分享一个「帕雷托前沿(Pareto frontier)」的成绩,这是用来评估「质量、成本与速度」三者权衡最佳状态,Gemini 3 Flash 在处理日常任务时,平均使用的词符数比 2.5 Pro 减少 30%,但同时维持更高的效能与准确度。

简单来说,Gemini 3 Flash突破了效能、成本与速度的帕雷托前沿。

如下图所示,图中左下角有很多密密麻麻的其他竞品模型,Gemini 3 Flash 位于上方,可以看成「在同样价格下,没有别人比它更强」、或是「在同样能力下,没有别人比它更便宜」,是在这成本区间的最划算的模型:
更强的 Gemini 3 Flash 模型正式登场,所有人都能免费使用 -

有些人会问,那跟上一代专业的 Gemini 2.5 Pro 比呢? 当然 Gemini 3 Flash 表现更强,甚至速度也提升 3 倍。

(0)
打赏 微信扫一扫 微信扫一扫

相关推荐

发表回复

登录后才能评论