从我们专为推理和训练打造的 Inferentia 和 Trainium 芯片,到提供业界最佳的基础模型(Foundation Models)于 Amazon Bedrock ,以及由 AI 驱动的体验,如 Rufus 和 Alexa ,我们致力于交付具有实际价值的生成式 AI(Gen AI)解决方案,为消费者创造真正的意义。我们的目标是通过 AI 简化购物者、卖家、广告商、企业以及各方人士的生活。
作为我们 AI 之旅的下一步,我们构建了 Amazon Nova,这是一代全新的基础模型(Foundation Models)。具备处理文本、图像和视频作为输入的能力,用户可以利用 Amazon Nova 驱动的生成式 AI 应用来理解视频、图表和文档,或者生成视频和其他多媒体内容。
“在 Amazon 内部,我们有大约 1,000 个生成式 AI 应用正在运行,我们对应用开发者仍在面临的挑战有着全面了解,”Amazon 人工通用智能部门高级副总裁 Rohit Prasad 表示。“我们的新 Amazon Nova 模型旨在帮助内部和外部开发者应对这些挑战,提供引人注目的智能与内容生成,同时在延迟、成本效益、定制化、信息溯源和代理能力等方面取得显著进展。”
Amazon Nova 模型现已在 Amazon Bedrock 中提供,包括:
- Amazon Nova Micro,一个仅支持文本的模型,能够以极低的成本提供最低延迟的响应。
- Amazon Nova Lite,一个低成本的多模态模型,能够以极快的速度处理图像、视频和文本输入。
- Amazon Nova Pro,一个高度能力的多模态模型,在准确性、速度和成本之间提供最佳平衡,可应对多种任务。
- Amazon Nova Premier,Amazon 最强大的多模态模型,用于复杂推理任务,并可作为蒸馏自定义模型的最佳教师(预计于 2025 年第一季度推出)。
- Amazon Nova Canvas,一个顶尖的图像生成模型。
- Amazon Nova Reel,一个顶尖的视频生成模型。
Amazon Nova Reel 通过输入单张图片和提示 “dolly forward” 将其转化为一个简短的视频。
Amazon Nova 模型将如何惠及客户
所有 Amazon Nova 模型都具备卓越的能力、快速响应、高性价比,并被设计为易于与客户的系统和数据集成。它们支持多模态和 200 多种语言的多种任务。Amazon Nova Micro、Amazon Nova Lite 和 Amazon Nova Pro 的成本至少比 Amazon Bedrock 中同类最佳性能模型低 75%。在各自的智能类别中,它们也是 Amazon Bedrock 中速度最快的模型。
这些模型已与 Amazon Bedrock 集成。Amazon Bedrock 是一项完全托管的服务,通过一个 API 提供来自领先 AI 公司和 Amazon 的高性能基础模型。借助 Amazon Bedrock,客户可以轻松试验和评估 Amazon Nova 模型以及其他基础模型,以确定最适合应用的模型。
这些模型还支持定制微调,客户可以将模型指向自身标记过的专有数据示例,以提高准确性。Amazon Nova 模型从客户自身数据中学习重要内容(包括文本、图像和视频),然后 Amazon Bedrock 训练出一个私有的微调模型,以提供定制化响应。
除了支持微调外,这些模型还支持蒸馏技术,可以将更强大的“大型教师模型”的特定知识转移到一个更小、更高效的模型中,使其在保持高准确性的同时,运行更快、更经济。
Amazon Nova 模型还与 Amazon Bedrock 知识库集成,擅长检索增强生成(RAG),允许客户通过组织自身的数据为响应提供信息溯源,以确保最佳准确性。
Amazon Nova 模型已优化为易于使用,且能在需要通过多个 API 交互完成多步骤任务的代理型应用中表现出色。
创意内容生成
通过高质量的输出、直观的 API 平台以及先进的自定义功能,Amazon Nova 创意生成模型(Amazon Nova Canvas 和 Amazon Nova Reel)正在帮助 Amazon Ads 消除卖家和广告商的障碍,激发前所未有的创造力与创新。例如,首次使用视频广告,为产品目录中的更多产品创建展示和视频活动,以及尝试诸如关键词级创意等新策略。平均来看,使用这些工具的品牌能够推广五倍于以往数量的产品,以及每种推广产品中双倍数量的图片,同时将预算转向效果最佳的策略。
在此示例中,Amazon Ads 使用 Amazon Nova Reel 为虚构的盒装意大利面品牌制作了一则视频广告。在富有想象力的“意大利面城市”中,高耸的通心粉管雕刻成建筑物,社区点缀着意大利香料的景观,街道上铺满了美味的番茄酱、螺旋意大利面和嫩滑的肉丸。该广告展示了广告商如何通过 Amazon Nova 模型赋予其产品生命并创造高质量内容。
视频理解
为了测试 Amazon Nova Pro 的视频理解能力,我们要求模型审阅并描述一段无声的足球比赛视频剪辑。结果包含有关比赛场景、球队制服、球员动作以及比赛最终结果的详细描述。
视频提示: “描述视频。”
输出: “视频展示了一场正在绿茵场上进行的足球比赛。两支球队分别穿着黄色和白色队服。黄色队的四分卫传球给一名接球手,接球手接住球并开始向前跑动。白色队的防守队员试图追赶并将其拦截。这场比赛最终以接球手被擒抱倒地结束。”
展望未来
我们将在 2025 年推出两款新的 Amazon Nova 模型,其中包括语音到语音模型和本地多模态到多模态(即“任意到任意”模态)模型。我们的语音到语音模型将能够理解以自然语言流式输入的语音,解析语言和非语言线索(如语调和语速),并提供自然的人类式交互。而我们的任意到任意模型将能够处理文本、图像、音频和视频作为输入和输出。这将简化应用程序的开发,使同一个模型能够执行多种任务,例如将内容从一种模态翻译为另一种、编辑内容以及支持能够理解和生成所有模态的 AI 代理。
负责任的 AI
Amazon Nova 模型内置了安全措施和保护机制。公司已为 Amazon Nova 模型推出了 AWS AI 服务卡,为用户提供关于使用案例、局限性和负责任 AI 实践的透明信息。
这仅仅是 Amazon Nova 的起点,我们很高兴能够继续创新,为每位 Amazon 客户提供实际价值。 了解更多 并开始体验 Amazon Nova。