Gemini 3.5 Flash是什么
쌍둥이자리 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型,是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位,在保持每秒约 289 个 토큰 极速输出的同时,编码和智能体能力全面超越上一代旗舰 Gemini 3.1 Pro:Terminal-Bench 达 76.2%,MCP Atlas 达 83.6%,均领先 GPT-5.5 和 Claude Opus 4.7。模型支持 100 万 token 超长上下文,API 定价极具竞争力,输入 $1.50/百万 token。

Gemini 3.5 Flash的功能特色
- 极速文本生成:每秒输出约 289 个 token,比 GPT-5.5 和 Claude Opus 4.7 快 4 倍,实现真正的低延迟实时响应。
- 顶级编码能力:Terminal-Bench 2.1 基准测试得分 76.2%,超越上一代旗舰 Gemini 3.1 Pro(70.3%),适合终端编码循环和 IDE 集成。
- 智能体协调中枢:MCP Atlas 得分 83.6%,支持多工具调用、子智能体并行执行,是构建 MCP 协议智能体的首选模型。
- 原生多模态输入:支持文本、图像、音频、视频、PDF 等多种格式输入,可处理复杂的多模态图表推理(CharXiv Reasoning 84.2%)。
- 매우 긴 컨텍스트 창:支持 100 万 token(1,048,576)输入和 65,536 token 输出,可一次性处理整本书籍或大型代码库。
- 内置 Thinking 模式:默认启用 medium effort 级别的深度思考,在质量与速度之间取得最佳平衡。
- 极具竞争力的 API 定价:输入 $1.50/百万 token,输出 $9.00/百万 token,缓存输入仅需 $0.15/百万 token(90% 折扣)。
- 稳定生产级 API:提供稳定的 API 标识符
gemini-3.5-flash,支持 Google AI Studio、Vertex AI、Android Studio 等多平台接入。 - 广泛渠道覆盖:已作为默认模型免费推送给 Gemini App 和 Google Search AI Mode 的全球超 9 亿月活用户,同时支持企业级 Gemini Enterprise 平台。
Gemini 3.5 Flash的核心优势
- 速度碾压同级竞品:每秒生成约 289 个 token,比 GPT-5.5 和 Claude Opus 4.7 快 4 倍in 인공 분석 的"智能 vs 速度"指数中独占最优象限。
- Flash 首次击败自家 Pro 旗舰:编码(Terminal-Bench 76.2%)和智能体协调(MCP Atlas 83.6%)全面超越 Gemini 3.1 Pro,终结"速度换质量"的妥协时代。
- 智能体任务全球领先:MCP Atlas 得分 83.6%,大幅领先 GPT-5.5(75.3%),是构建多工具调用和子智能体并行系统的首选模型。
- 极致性价比:输入 $1.50/百万 token、输出 $9.00/百万 token,比 GPT-5.5 便宜约 70%,缓存输入更享 90% 折扣($0.15/百万 token)。
- 百万级超长上下文:支持 100 万 token 输入和 65,536 token 输出,可一次性处理整本书籍、大型代码库或海量文档。
- 免费触达十亿级用户:已作为默认模型向 Gemini App 和 Google Search AI Mode 的全球超 9 亿月活用户免费开放。
- 深度融入 Google 生态:原生支持 Gmail、Docs、Sheets、Slides,并可通过 Vertex AI、Android Studio、Antigravity 2.0 等企业级平台无缝接入。
- 稳定生产级服务:提供固定 API 标识符
gemini-3.5-flash,无需频繁更换版本号,保障企业应用稳定性。
Gemini 3.5 Flash官网是什么
- 프로젝트 웹사이트:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/#gemini-3-5-flash
Gemini 3.5 Flash的操作步骤
- 普通用户免费体验:打开 Gemini App 或 Google Search AI Mode,3.5 Flash 已作为默认模型自动推送,直接输入问题即可使用,无需额外设置。
- 通过 Google AI Studio 快速上手:访问 Google AI Studio,在模型选择器中选择
gemini-3.5-flash,输入提示词即可测试多模态能力(支持上传图片、PDF、音频、视频)。 - API 接入开发:使用稳定 API ID
gemini-3.5-flash调用 Gemini API,支持 REST 和 SDK 方式接入,输入价格 $1.50/百万 token,输出 $9.00/百万 token。 - 启用缓存降低成本:对于有稳定语料库的场景,使用缓存输入功能($0.15/百万 token,享 90% 折扣),适合重复查询或固定知识库问答。
- 构建 MCP 协议智能体:利用其 83.6% 的 MCP Atlas 得分,通过多工具调用和子智能体并行执行,搭建自动化工作流(如同时调用搜索、代码执行、数据库等工具)。
- 集成终端编码工具:在 Antigravity 2.0、Aider、Copilot CLI 等 IDE 或终端工具中配置
gemini-3.5-flash作为默认模型,进行代码生成、重构和调试。 - 企业级 Vertex AI 部署:通过 Google Cloud Vertex AI 平台接入,结合 Gemini Enterprise 实现与 Gmail、Docs、Sheets、Slides 的深度集成,构建企业内部 AI 工作流。
Gemini 3.5 Flash的适用人群
- 软件开发者与工程师:编码基准测试 Terminal-Bench 达 76.2%,且支持 Antigravity 2.0、Aider、Copilot CLI 等终端工具链,适合进行代码生成、重构、调试和自动化编程。
- AI 智能体开发者:MCP Atlas 得分 83.6% 全球领先,支持多工具调用和子智能体并行执行,是构建 MCP 协议智能体、自动化工作流的首选模型。
- 普通消费者与知识工作者:已作为默认模型免费推送给 Gemini App 和 Google Search AI Mode 的全球超 9 亿用户,适合日常问答、内容创作、信息检索和办公辅助。
- 长文档处理者:支持 100 万 token 超长上下文,适合律师、研究员、编辑等需要一次性处理整本书籍、大型代码库或海量 PDF 文档进行摘要、分析和对比的人群。
- 初创企业与独立开发者:API 定价有 90% 折扣的缓存输入机制,适合预算有限但需要高性能 AI 能力的项目。
- 企业级用户:可通过 Google Cloud Vertex AI 和 Gemini Enterprise 平台接入,原生集成 Gmail、Docs、Sheets、Slides,适合构建内部 AI 工作流和自动化办公系统。
Gemini 3.5 Flash的常见问题
Q:为什么 Flash 系列突然比 Pro 还强?
A: Google 在 3.5 世代彻底重构了模型架构,打破了"Flash 牺牲性能换速度"的传统定位。3.5 Flash 是 Gemini 3.5 家族的首个成员,通过更高效的架构设计实现了"速度和质量兼得"。
Q:Gemini 3.5 Flash 的 API 定价是多少?
A: 输入 $1.50 / 百万 token,输出 $9.00 / 百万 token,缓存输入 $0.15 / 百万 token(享 90% 折扣)。非全球区域为 $1.65 / $9.90。比 GPT-5.5 便宜约 70%,比 3.1 Pro 便宜约 40%。
Q:普通用户能免费使用吗?
A: 可以。3.5 Flash 已作为默认模型免费推送给 Gemini App 和 Google Search AI Mode 的全球超 9 亿月活用户,无需额外付费或订阅。
Q:支持哪些输入和输出模态?
A: 支持文本、图像、音频、视频、PDF 输入,输出为文本。暂不支持音频生成、图像生成、计算机使用(Computer Use)和 Live API。
Q:上下文窗口有多大?
A: 输入上下文窗口为 100 万 token(1,048,576),最大输出窗口为 65,536 token。知识截止时间为 2026 年 1 月。
Q:Thinking 模式是什么?如何设置?
A: Thinking 是内置的深度思考功能,3.5 Flash 默认启用 medium effort 级别,在质量和速度之间取得平衡。开发者可通过 API 参数调整思考深度。
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...




