ベースモデルのAmazon Novaファミリー：包括的なジェネレーティブ人工知能（Gen AI）サービスの提供

43.6K 00

Amazon Nova系列基础模型：提供全面的生成式人工智能（Gen AI）服务

アマゾンの最新の最先端基盤モデルは、最先端のインテリジェンスと業界をリードする価格/パフォーマンスを実現する。

推論とトレーニングのために開発されたInferentiaとTrainiumチップから、業界最高のファウンデーション・モデルを以下のサイトで提供しています。アマゾンの岩盤といったAI主導の体験を提供する。ルーファス歌で応えるアレクサ私たちは、真の価値を持ち、消費者にとって真の意味を生み出すジェネレーティブAI（Gen AI）ソリューションの提供に取り組んでいます。私たちの目標は、AIを通じて買い物客、販売者、広告主、企業、その他すべての人々の生活を簡素化することです。

AIの旅における次のステップとして、私たちは新世代のFoundation ModelsであるAmazon Novaを構築しました。テキスト、画像、ビデオを入力として処理する能力を持つため、ユーザーはAmazon Novaを搭載したジェネレーティブAIアプリケーションを活用して、ビデオ、チャート、ドキュメントの意味を理解したり、ビデオやその他のマルチメディアコンテンツを生成したりすることができます。

「アマゾン社内で約1,000のジェネレーティブAIアプリが稼働しており、アプリ開発者が直面している課題を包括的に理解しています。「当社の新しいAmazon Novaモデルは、社内外の開発者がこれらの課題に対処できるように設計されており、レイテンシー、コスト効率、カスタマイズ性、情報のトレーサビリティ、エージェント機能を大幅に向上させながら、魅力的なインテリジェンスとコンテンツ生成を提供します。

アマゾン・ノヴァのモデルがアマゾン・ベッドロックで利用可能になった：

アマゾン・ノヴァ・マイクロテキストのみのモデルで、わずかなコストで最短のレイテンシー応答を提供する。
アマゾン・ノヴァ・ライト画像、ビデオ、テキスト入力を非常に高速に処理できる低価格のマルチモーダルモデル。
アマゾン・ノヴァ・プロこの高性能マルチモーダルモデルは、さまざまなタスクに対して精度、スピード、コストの最適なバランスを提供する。
アマゾン・ノヴァ・プレミア属複雑な推論タスクのためのアマゾンの最も強力なマルチモーダルモデルであり、カスタムモデルを抽出するための最良の教師として機能する（2025年第1四半期予定）。
アマゾン・ノヴァ・キャンバス一流の画像生成モデル。
アマゾン・ノヴァ・リールトップ・ビデオ・ジェネレーション・モデルである。

アマゾンのノバ・リールは、画像を入力して「ドリー・フォワード」と指示すると、1枚の画像を短いビデオに変える。

アマゾン・ノヴァ・モデルは顧客にどのような利益をもたらすか

Amazon Nova Micro、Amazon Nova Lite、Amazon Nova Proは、Amazon Bedrockの最高クラスの性能のモデルより、75%以上低価格です。Amazon Nova Micro、Amazon Nova Lite、Amazon Nova Proは、Amazon Bedrockのクラス最高のパフォーマンス・モデルより少なくとも75%安い。また、それぞれのインテリジェンス・カテゴリーにおいて、Amazon Bedrockで最速のモデルでもあります。

これらのモデルは、Amazon Bedrockと統合されました。Amazon Bedrockは、主要なAI企業とAmazonが提供する高性能なベースモデルを1つのAPIを通じて提供するフルマネージドサービスです。Amazon Bedrockを利用することで、顧客はAmazon Novaモデルや他のベースモデルを簡単に試して評価し、アプリケーションに最適なものを判断することができます。

Amazon Novaモデルは、顧客自身のデータ（テキスト、画像、動画を含む）から何が重要かを学習し、次にAmazon Bedrockがカスタマイズされた応答を提供するために、プライベートで微調整されたモデルを訓練する。

微調整をサポートするだけでなく、これらのモデルは、より強力な "大教師モデル "から特定の知識を、高い精度を維持しながら、より速く、より経済的に動作する、より小さく、より効率的なモデルに移すことができる蒸留技術もサポートしている。

Amazon Novaのモデルは、Amazon Bedrockのナレッジベースとも統合されており、RAG（Retrieval Augmented Generation：検索拡張ジェネレーション）に特化している。

アマゾン・ノヴァ・モデルは、使いやすさのために最適化されており、複数のAPIインタラクションを通じて完了するマルチステップ・タスクを必要とするエージェントベースのアプリケーションに優れている。

クリエイティブなコンテンツ制作

高品質な出力、直感的なAPIプラットフォーム、高度なカスタマイズ機能を備えたAmazon Novaのクリエイティブ生成モデル（Amazon Nova CanvasとAmazon Nova Reel）は、Amazon Adsが販売者と広告主の両方の障壁を取り除き、これまでにない創造性と革新性を刺激するのに役立っています。例えば、初めて動画広告を使用したり、商品カタログのより多くの商品に対してディスプレイや動画キャンペーンを作成したり、キーワードレベルのクリエイティブのような新しい戦術を試したりしています。平均して、これらのツールを使用するブランドは、最も効果的な戦術に予算をシフトしながら、プロモーションする商品数を5倍、プロモーションする商品あたりの画像数を2倍にすることができます。

この例では、Amazon AdsがAmazon Nova Reelを使って架空の箱入りパスタブランドの動画広告を制作した。想像力豊かな「Spaghetti City」では、そびえ立つマカロニチューブがビルに刻まれ、近隣にはイタリアンスパイスの風景が点在し、通りには美味しいトマトソース、らせん状のスパゲッティ、柔らかいミートボールが並んでいる。このキャンペーンは、広告主がアマゾン・ノヴァ・モデルを通じていかに商品に命を吹き込み、質の高いコンテンツを制作できるかを示している。

ビデオ理解

Amazon Nova Proの映像理解能力をテストするために、サッカーの試合の無音ビデオクリップをレビューし、説明するようモデルに求めた。その結果、試合シーン、チームのユニフォーム、選手の動き、最終的な試合結果などが詳細に説明された。

ビデオ・キュー："ビデオについて説明してください"。

出力：「ビデオには、緑のフィールドで行われるサッカーの試合が映っている。2つのチームが黄色と白のユニフォームを着ている。黄色チームのクオーターバックがレシーバーにボールをパスし、レシーバーがボールをキャッチして前方に走り出す。白チームのディフェンスはボールに追いつきインターセプトしようとする。このプレーはレシーバーが地面にタックルされて終わった。"

首を長くして

私たちは2025年に、音声対音声モデルとネイティブ・マルチモーダル対マルチモーダル（つまり "any-to-any "モダリティ）モデルを含む、2つの新しいアマゾン・ノヴァ・モデルを導入する予定です。私たちの音声合成モデルは、自然言語としてストリーミングされた音声を理解し、言語的・非言語的な手がかり（イントネーションや発話速度など）を解析し、人間のような自然なインタラクションを提供できるようになります。また、私たちのany-to-anyモデルは、テキスト、画像、音声、動画を入出力として処理できるようになります。これにより、あるモダリティから別のモダリティへのコンテンツの翻訳、コンテンツの編集、すべてのモダリティを理解し生成できるAIエージェントのサポートなど、複数のタスクを同じモデルで実行できるようになり、アプリケーション開発が簡素化されます。