AIパーソナル・ラーニング
と実践的なガイダンス
豆包Marscode1
全55記事

タグ: AIテキストからビデオへ

基于Wan2.1为ComfyUI提供视频生成能力的插件-首席AI分享圈

Wan 2.1に基づくビデオ生成機能を提供するComfyUI用プラグイン

包括的な紹介 ComfyUI-WanVideoWrapperは、ComfyUIプラットフォーム用に設計された、開発者kijaiによって作成されたオープンソースのプラグインです。WanVideoのWan2.1モデルに基づいており、強力なビデオ生成と処理機能を提供します。

Wan2.1:在消费级 GPU 上生成高质量视频-首席AI分享圈

Wan2.1:民生用GPUで高画質ビデオを生成する

概要 Wan2.1は、Wan-Videoチームによって開発され、GitHubでオープンソース化されたビデオ生成ツールスイートで、AI技術によってビデオ作成の限界を押し広げることに焦点を当てています。Wan2.1は、先進的な拡散コンバーターアーキテクチャに基づき、独自の時変セルフエンコーダ(Wan-VAE)を統合しています。

Mobius Diffusion:文本提示生成无缝循环视频-首席AI分享圈

メビウス・ディフュージョン:テキスト・プロンプトがシームレスなループ映像を生成

はじめに メビウス・ディフュージョンは、テキスト入力からシームレスにループするビデオコンテンツを生成することに特化した革新的なオンラインツールです。事前にトレーニングされたビデオ拡散モデルに基づいており、ユーザーのトレーニングやアノテーションデータを必要とせず、すぐに使い始めることができます。このサイトのコアテクノロジーは、潜在空間ループを...

SkyReels:AI视频短剧创作平台,擅长生成动作自然的全景人像-首席AI分享圈

SkyReels:自然な動きのあるパノラマポートレートの生成に特化したAI動画スキット作成プラットフォーム

概要 SkyReelsは、AIによる動画作成に特化したオンラインプラットフォームで、ユーザーがテキストスクリプトやクリエイティブなアイデアを、高品質なショートビデオに素早く変換できるように設計されています。コンテンツ制作者、マーケティング担当者、一般ユーザーに関わらず、テキストを入力するだけで、リアルな音声、...

SkyReels-V1:生成高品质人体动作视频的开源视频模型-首席AI分享圈

SkyReels-V1: 高品質のヒューマンアクション動画を生成するオープンソースビデオモデル

概論 SkyReels-V1は、SkyworkAIチームによって開発されたオープンソースプロジェクトで、人間中心の高品質なビデオコンテンツの生成に焦点を当てている。このプロジェクトはHunyuanVideoモデルに基づいており、何千万もの高品質な映画やテレビクリップを微調整することで、世界初のヒューマンアクションビデオベースを作成します。

Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型-首席AI分享圈

Step-Video-T2V:多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。VAE(可変オートエンコーダ)により、16x16の空間圧縮と8xの時間圧縮を実現しています。

Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频-首席AI分享圈

Magic 1-For-1:1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論レイテンシを削減するように設計された効率的なビデオ生成モデルである。このモデルは、テキストからビデオへの生成タスクを、テキストから画像への生成と画像からビデオへの生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。

Goku:  生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频-首席AI分享圈

悟空:詳細で一貫性のある動画を生成します。詳細なキャラクターやオブジェクトを使用したコマーシャルの作成に最適です。

包括的な紹介 Gokuは、ストリーム変換技術に基づく連携型画像・動画生成モデルであり、業界トップクラスのパフォーマンスを達成するよう設計されています。Gokuは、きめ細かなデータ照合、モデル設計、ストリーム変換の定式化など、高度で高品質な映像生成技術を統合しています。

HiDream(智象大模型):基于视觉多模态基础模型的AIGC创作平台-首席AI分享圈

HiDream:視覚的マルチモーダルベースモデルに基づくAIGCオーサリングプラットフォーム

HiDream.aiは、世界をリードする視覚的マルチモーダルベースモデルとアプリケーションの構築に焦点を当てた生成人工知能スタートアップです。同社が自社開発した「HiDream.ai」は、世界初の拡散トランスフォーマー(DiT...

LTX Video(LTXV):生成高质量视频的实时视频生成开源模型-首席AI分享圈

LTX Video (LTXV): 高品質ビデオを生成するリアルタイムビデオ生成のオープンソースモデル

概要 LTX-Videoは、Lightricksが開発したDiT(Diffusion Transformer)をベースとした初のリアルタイムビデオ生成モデルです。このモデルは、768x512の解像度で24フレーム/秒の高画質ビデオを生成することができ、ビデオを見る時間よりも速く生成することができます。

可灵 AI:快手推出的生成创意图片和视频的AI工具-首席AI分享圈

Keling AI:クリエイティブな画像や動画を生成するAIツール、シャッターストックが提供開始

包括的な紹介 クリングAI(Kling AI)は、Shutterstockが発表した新世代のAIクリエイティブ生産性プラットフォームで、高度なジェネレーティブAI技術により、ユーザーが高品質な画像や動画コンテンツを簡単に作成できることを目指している。このプラットフォームは、Shutterstockが自社開発したKetu Big ModelとKoling Big Model(Kolors)に基づいており、強力な...

即梦AI:一站式AI创作平台, 图像生成, 智能画布, 视频生成, 音乐生成-首席AI分享圈

インスタントドリームAI:ワンストップAI作成プラットフォーム、画像生成、スマートキャンバス、ビデオ生成、音楽生成

概論 Instant Dream AIは、多彩で強力な創作ツールをユーザーに提供するために設計された、ワンストップのAI創作プラットフォームです。画像生成、スマートキャンバス、ビデオ生成、音楽生成など、Instant Dream AIはユーザーの創造性を簡単に実現することができます。このプラットフォームは、AIドローイング、AIビデオ...を含む様々な作成モードをサポートしています。

VideoFX(Veo2):AI生成创意视频,高物理状态还原,输出原生4K视频-首席AI分享圈

VideoFX(Veo2):高い物理的状態の再現性とネイティブ4Kビデオ出力を備えたAI生成クリエイティブビデオ

概要 VideoFX は、クリエイティブで視覚的に魅力的な動画コンテンツを簡単に作成できるように設計された、Google Labs の革新的な動画生成ツールです。先進のVeo 2.0テクノロジーを活用したこのツールは、さまざまなクリエイティブなニーズに適した幅広いビデオエフェクトと編集機能を提供します。個人的な使用にも...

混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型-首席AI分享圈

ハイブリッドVincennesビデオ:高品質のビデオのリアルな映像を生成し、テンセントは、大規模なモデルのオープンソースのビデオ生成

総合紹介 テンセント混元テキスト生成動画(Yuanbao APPで利用可能)は、テンセントが立ち上げたAI技術に基づく動画生成プラットフォームである。このプラットフォームは、強力なクロスドメイン知識と自然言語理解を持つテンセントのハイブリッドビッグモデルを利用し、ユーザーのテキスト記述に基づいて高品質のビデオコンテンツを生成することができます...

Sora:文字生成AI视频,视频编辑创意套件-首席AI分享圈

Sora: テキストからAIビデオへ、ビデオ編集クリエイティブスイート

一般的な紹介 Soraは、OpenAIによる先進的なビデオ生成ツールで、人工知能技術によってユーザーが簡単に高品質なビデオコンテンツを作成できるように設計されています。Soraは、拡散モデルを使用して、静的ノイズから始まる多段階のノイズ除去プロセスによって完全なビデオを生成します。Soraは、拡散モデルを使用して、静的ノイズから始まる多段階のノイズ除去プロセスにより、完全な動画を生成します。ユーザーは、テキスト、画像、...

ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成-首席AI分享圈

ConsisID:キャラクタ一貫性のある映像を生成するポートレート参照マップ、迅速な多端末統合

包括的な紹介 ConsisIDは、北京大学のYuan Rongのグループによって開発されたオープンソースプロジェクトであり、周波数分解技術によってID一貫性のあるテキストからビデオへの生成(IPT2V)を実現することを目的としている。このプロジェクトの中核は、DiT(拡散変換)ベースのモデルであり、IPT2Vを維持しながらビデオを生成することができる。

Pictory:简化内容营销的视频创作平台|博客文章转视频-首席AI分享圈

ピクトリー:コンテンツマーケティングを簡素化する動画作成プラットフォーム|ブログ記事から動画へ

はじめに Pictoryは、人工知能技術を使って素早く動画を作成・編集できるプラットフォームです。YouTubeのホスト、コンテンツマーケター、ビジネスユーザーなど、Pictoryを使えば、スクリプト、ブログ記事、長い動画を数分でプロ品質の動画に変換することができます。このプラットフォームは豊富な...

Video Ocean:文本或图片中生成保持人物面部一致的视频-首席AI分享圈

ビデオ・オーシャン:テキストや画像からビデオを生成し、並んでいる人々の顔を映し続ける。

概要 Video Oceanは、誰もが簡単に高品質な動画コンテンツを作成できるように設計された、人工知能技術に基づく動画生成ツールです。高度なアルゴリズムと深いリソースの統合を活用することで、Video Oceanは、イノベーションを促進し、創造性を刺激するフレンドリーなコンテンツ作成エコシステムを提供します。

Google Vids:从提示指令和文档开始创作营销讲解视频-首席AI分享圈

Google Vids:プロンプトの指示と文書から始めるマーケティング説明ビデオの作成

概要 Google Vidsは、Google WorkspaceスイートのAIを活用した動画作成ツールで、仕事関連の動画コンテンツを簡単に作成・共有できるように設計されています。簡単なプロンプトとクリップの統合により、ユーザーはストーリーボードを作成し、動画を編集することができます。このツールには豊富なビルトイン...

ja日本語