Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

堆友AI

Gemini 3.5 Flash是什么

Géminis 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型,是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位,在保持每秒约 289 个 ficha 极速输出的同时,编码和智能体能力全面超越上一代旗舰 Gemini 3.1 Pro:Terminal-Bench 达 76.2%,MCP Atlas 达 83.6%,均领先 GPT-5.5 和 Claude Opus 4.7。模型支持 100 万 token 超长上下文,API 定价极具竞争力,输入 $1.50/百万 token。

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash的功能特色

  • 极速文本生成:每秒输出约 289 个 token,比 GPT-5.5 和 Claude Opus 4.7 快 4 倍,实现真正的低延迟实时响应。
  • 顶级编码能力:Terminal-Bench 2.1 基准测试得分 76.2%,超越上一代旗舰 Gemini 3.1 Pro(70.3%),适合终端编码循环和 IDE 集成。
  • 智能体协调中枢:MCP Atlas 得分 83.6%,支持多工具调用、子智能体并行执行,是构建 MCP 协议智能体的首选模型。
  • 原生多模态输入:支持文本、图像、音频、视频、PDF 等多种格式输入,可处理复杂的多模态图表推理(CharXiv Reasoning 84.2%)。
  • Ventana contextual extralarga:支持 100 万 token(1,048,576)输入和 65,536 token 输出,可一次性处理整本书籍或大型代码库。
  • 内置 Thinking 模式:默认启用 medium effort 级别的深度思考,在质量与速度之间取得最佳平衡。
  • 极具竞争力的 API 定价:输入 $1.50/百万 token,输出 $9.00/百万 token,缓存输入仅需 $0.15/百万 token(90% 折扣)。
  • 稳定生产级 API:提供稳定的 API 标识符 gemini-3.5-flash,支持 Google AI Studio、Vertex AI、Android Studio 等多平台接入。
  • 广泛渠道覆盖:已作为默认模型免费推送给 Gemini App 和 Google Search AI Mode 的全球超 9 亿月活用户,同时支持企业级 Gemini Enterprise 平台。

Gemini 3.5 Flash的核心优势

  • 速度碾压同级竞品:每秒生成约 289 个 token,比 GPT-5.5 和 Claude Opus 4.7 快 4 倍en Análisis artificial 的"智能 vs 速度"指数中独占最优象限。
  • Flash 首次击败自家 Pro 旗舰:编码(Terminal-Bench 76.2%)和智能体协调(MCP Atlas 83.6%)全面超越 Gemini 3.1 Pro,终结"速度换质量"的妥协时代。
  • 智能体任务全球领先:MCP Atlas 得分 83.6%,大幅领先 GPT-5.5(75.3%),是构建多工具调用和子智能体并行系统的首选模型。
  • 极致性价比:输入 $1.50/百万 token、输出 $9.00/百万 token,比 GPT-5.5 便宜约 70%,缓存输入更享 90% 折扣($0.15/百万 token)。
  • 百万级超长上下文:支持 100 万 token 输入和 65,536 token 输出,可一次性处理整本书籍、大型代码库或海量文档。
  • 免费触达十亿级用户:已作为默认模型向 Gemini App 和 Google Search AI Mode 的全球超 9 亿月活用户免费开放。
  • 深度融入 Google 生态:原生支持 Gmail、Docs、Sheets、Slides,并可通过 Vertex AI、Android Studio、Antigravity 2.0 等企业级平台无缝接入。
  • 稳定生产级服务:提供固定 API 标识符 gemini-3.5-flash,无需频繁更换版本号,保障企业应用稳定性。

Gemini 3.5 Flash官网是什么

  • Página web del proyecto:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/#gemini-3-5-flash

Gemini 3.5 Flash的操作步骤

  • 普通用户免费体验:打开 Gemini App 或 Google Search AI Mode,3.5 Flash 已作为默认模型自动推送,直接输入问题即可使用,无需额外设置。
  • 通过 Google AI Studio 快速上手:访问 Google AI Studio,在模型选择器中选择 gemini-3.5-flash,输入提示词即可测试多模态能力(支持上传图片、PDF、音频、视频)。
  • API 接入开发:使用稳定 API ID gemini-3.5-flash 调用 Gemini API,支持 REST 和 SDK 方式接入,输入价格 $1.50/百万 token,输出 $9.00/百万 token。
  • 启用缓存降低成本:对于有稳定语料库的场景,使用缓存输入功能($0.15/百万 token,享 90% 折扣),适合重复查询或固定知识库问答。
  • 构建 MCP 协议智能体:利用其 83.6% 的 MCP Atlas 得分,通过多工具调用和子智能体并行执行,搭建自动化工作流(如同时调用搜索、代码执行、数据库等工具)。
  • 集成终端编码工具:在 Antigravity 2.0、Aider、Copilot CLI 等 IDE 或终端工具中配置 gemini-3.5-flash 作为默认模型,进行代码生成、重构和调试。
  • 企业级 Vertex AI 部署:通过 Google Cloud Vertex AI 平台接入,结合 Gemini Enterprise 实现与 Gmail、Docs、Sheets、Slides 的深度集成,构建企业内部 AI 工作流。

Gemini 3.5 Flash的适用人群

  • 软件开发者与工程师:编码基准测试 Terminal-Bench 达 76.2%,且支持 Antigravity 2.0、Aider、Copilot CLI 等终端工具链,适合进行代码生成、重构、调试和自动化编程。
  • AI 智能体开发者:MCP Atlas 得分 83.6% 全球领先,支持多工具调用和子智能体并行执行,是构建 MCP 协议智能体、自动化工作流的首选模型。
  • 普通消费者与知识工作者:已作为默认模型免费推送给 Gemini App 和 Google Search AI Mode 的全球超 9 亿用户,适合日常问答、内容创作、信息检索和办公辅助。
  • 长文档处理者:支持 100 万 token 超长上下文,适合律师、研究员、编辑等需要一次性处理整本书籍、大型代码库或海量 PDF 文档进行摘要、分析和对比的人群。
  • 初创企业与独立开发者:API 定价有 90% 折扣的缓存输入机制,适合预算有限但需要高性能 AI 能力的项目。
  • 企业级用户:可通过 Google Cloud Vertex AI 和 Gemini Enterprise 平台接入,原生集成 Gmail、Docs、Sheets、Slides,适合构建内部 AI 工作流和自动化办公系统。

Gemini 3.5 Flash的常见问题

Q:为什么 Flash 系列突然比 Pro 还强?

A: Google 在 3.5 世代彻底重构了模型架构,打破了"Flash 牺牲性能换速度"的传统定位。3.5 Flash 是 Gemini 3.5 家族的首个成员,通过更高效的架构设计实现了"速度和质量兼得"。


Q:Gemini 3.5 Flash 的 API 定价是多少?
A: 输入 $1.50 / 百万 token,输出 $9.00 / 百万 token,缓存输入 $0.15 / 百万 token(享 90% 折扣)。非全球区域为 $1.65 / $9.90。比 GPT-5.5 便宜约 70%,比 3.1 Pro 便宜约 40%。

Q:普通用户能免费使用吗?

A: 可以。3.5 Flash 已作为默认模型免费推送给 Gemini App 和 Google Search AI Mode 的全球超 9 亿月活用户,无需额外付费或订阅。

Q:支持哪些输入和输出模态?

A: 支持文本、图像、音频、视频、PDF 输入,输出为文本。暂不支持音频生成、图像生成、计算机使用(Computer Use)和 Live API。

Q:上下文窗口有多大?

A: 输入上下文窗口为 100 万 token(1,048,576),最大输出窗口为 65,536 token。知识截止时间为 2026 年 1 月。

Q:Thinking 模式是什么?如何设置?

A: Thinking 是内置的深度思考功能,3.5 Flash 默认启用 medium effort 级别,在质量和速度之间取得平衡。开发者可通过 API 参数调整思考深度。
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...