AIパーソナル・ラーニング
と実践的なガイダンス
豆包Marscode1
全61記事

Tags: AI デジタルピープル 2ページ目

AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端-首席AI分享圈

AIGCPanel: デジタルマンインテグレーションシステムのオープンソースクローン。

総合的な紹介 AigcPanelはすべてのユーザーのためのワンストップAIデジタル人間生産システムであり、electron+vue3+typescript技術スタックで開発され、Windowsシステム上でワンクリックデプロイメントをサポートしています。AigcPanelはユーザーフレンドリーな設計を核心としており、技術的基礎の弱いユーザーでも簡単に使いこなすことができます。主な特徴 ...

LiveImage AI:人物肖像图片转换为会说话的肖像视频(付费)-首席AI分享圈

LiveImage AI:ポートレート画像をしゃべるポートレート動画に変換(有料)

概要 LiveImage AIは、静止画像をブラウザから直接、鮮やかな動画コンテンツに変換する革新的なジェネレーティブAIプラットフォームです。ユーザーはメッセージを録音し、任意のポートレート写真をアップロードするだけで、高度なAI技術が画像に自然な表情や感情を与えます。バイラルを作るにせよ...

Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频-首席AI分享圈

ソニック:音声でポートレート画像を生成し、生き生きとした表情のデジタルデモ映像を制作

概要 Sonicは、グローバルな音声認識に特化した革新的なプラットフォームで、音声を駆動源とした鮮やかなポートレートアニメーションを生成するように設計されています。テンセントと浙江大学の研究チームによって開発されたこのプラットフォームは、音声情報を使って表情や頭の動きを制御し、自然で滑らかなアニメーション動画を生成する。

悦动人像EMO:基于人物肖像图片和人声音频生成高质量人物肖像动态视频-首席AI分享圈

EMO: 似顔絵画像と人の声の音声をもとに、高品質な似顔絵動画を生成。

総合紹介 YUE似顔絵EMOは、阿里雲大型モデルサービスプラットフォーム百精(モデルスタジオ)が提供する高品質似顔絵ダイナミック動画生成ツールです。このツールは、肖像画像と人の声の音声ファイルに基づいて、リアルな肖像ダイナミック動画を生成します。YUE Portrait EMOは、2つの独立したモデ...

DHライブ: 30/40シリーズグラフィックスカードでスムーズなリアルタイムインタラクションを実現するAIデジタルピープル

一般的な紹介 DH_liveは、サンプルレスラーニングに基づいたリアルタイムのライブデジタルヒューマンプロジェクトで、スムーズでインタラクティブなライブストリーミング体験をユーザーに提供することを目的としています。このプロジェクトは、NVIDIA 30および40シリーズのグラフィックカードをサポートし、25fps以上でリアルタイムに実行することができます。ユーザーは、簡単なステップでデジタルを作成し、使用することができます...

如影AI视频合成:生成AI视频,提供数字人直播服务-首席AI分享圈

如意AIビデオ合成:AIビデオを生成し、ライブデジタルピープルサービスを提供する

如英AI動画合成は、上海如意科技有限公司が発表したAI動画生成プラットフォームである。このプラットフォームは、SenseNovaの「SenseNova」ビッグモデル機能に依存しており、様々なデジタル人間のイメージとトーンのオプションを提供し、ユーザーはテキストを入力するだけで、リアルなAIビデオを生成することができます。これは...

蝉镜:数字人视频创作平台,拥有数百款数字人模板以及克隆专属数字人形象(付费)-首席AI分享圈

Cicada Mirror:何百ものデジタル人体テンプレートと専用デジタル人体イメージのクローンを備えたデジタル人体ビデオ作成プラットフォーム(有料)

概論 Cicadaはデジタル人体映像制作に特化したプラットフォームで、AI技術を利用して映像制作プロセスを簡素化する。ユーザーは、さまざまなデジタル人物の画像を選択し、コピーを入力し、多言語ダビング付きのビデオを生成することができます。また、豊富なテンプレートや素材ライブラリが用意されており、広告やマーケティング、教育やトレーニングなど、様々な分野に適しています。

EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)-首席AI分享圈

EchoMimic: 音声駆動ポートレートによるトーキングビデオ生成 (EchoMimicV2 アクセラレータ)

一般的な紹介 EchoMimicは、音声駆動型生成によってリアルな肖像画アニメーションを生成するように設計されたオープンソースプロジェクトです。Ant GroupのTerminal Technologies部門によって開発されたこのプロジェクトは、音声と顔のマーカーポイントを組み合わせた編集可能なマーカー条件を使用して、ダイナミックなポートレートビデオを生成します。

VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案-首席AI分享圈

VideoChat:カスタムイメージとトーンクローニングによるリアルタイムの音声対話型デジタルパーソンは、エンドツーエンドの音声ソリューションとカスケードソリューションをサポートします。

包括的な紹介 VideoChatは、オープンソース技術に基づくリアルタイム音声対話デジタルヒューマンプロジェクトで、エンドツーエンドの音声スキーム(GLM-4-Voice - THG)とカスケードスキーム(ASR-LLM-TTS-THG)の両方をサポートしています。このプロジェクトでは、ユーザがデジタル・ヒューマンのイメージと音色をカスタマイズすることができ、音色のクローニングとリップ・シンクロをサポートしています...

Hallo2:音频驱动生成口型/表情同步的肖像视频(Windows一键安装)-首席AI分享圈

Hallo2: リップシンク/表情シンクされたポートレートビデオのオーディオ駆動型生成 (Windows用ワンクリックインストール)

一般的な紹介 Hallo2は復旦大学と百度によって共同開発されたオープンソースプロジェクトで、音声駆動型生成によって高解像度のポートレートアニメーションを生成します。このプロジェクトでは、先進的なGenerative Adversarial Networks (GAN)とタイムアライメント技術を利用して、4K解像度と最長1時間の動画生成を実現しています。

UltraLight Digital Human:开源端侧实时运行的超轻量级数字人,附一键安装包-首席AI分享圈

UltraLight Digital Human: ワンクリックでインストールできるオープンソースのエンドサイドリアルタイムランニング超軽量デジタルヒューマン

概要 Ultralight Digital Humanは、モバイルデバイス上でリアルタイムに動作する超軽量デジタル人体モデルを開発するオープンソースプロジェクトです。このプロジェクトでは、モバイルデバイス上でのスムーズな動作を実現するためのアルゴリズムとモデル構造の最適化を通して、ソーシャルアプリケーション、ゲーム、バーチャルアプリケーションに適しています。

TalkingAvatar:创建和编辑AI虚拟形象视频平台,基于本地算力Windows客户端-首席AI分享圈

TalkingAvatar:AIアバターを作成・編集するためのAIアバター・ビデオ・プラットフォーム。

はじめに TalkingAvatarは、完全なAIデジタルパーソン・ソリューションを提供する、業界をリードするAIアバター・プラットフォームです。ビデオコンテンツを作成、編集、パーソナライズする画期的な方法をユーザーに提供します。高度なAI技術により、ユーザーは動画の書き換え、声のクローン、唇の同期、カスタムの作成などを簡単に行うことができます。

Hedra:免费将照片生成会说话、会唱歌的人物角色视频-首席AI分享圈

ヘドラ:写真をしゃべって歌うキャラクターに変身させる無料動画

はじめに Hedraは、人工知能技術により、表情豊かなおしゃべりや歌のキャラクター動画を生成することに特化した革新的なデジタルクリエイションプラットフォームです。ユーザーは専門知識がなくても、簡単なテキストと画像からプロ品質の動画を作成することができます。

RenderNet:锁定面部特征,创建人物一致性的图像、视频运镜到口播视频-首席AI分享圈

RenderNet:顔の特徴をターゲットにして、キャラクターと一致する画像を作成する。

概 要 RenderNetは、人工知能技術に基づき、キャラクターの一貫性を保った画像や映像の作成に特化したジェネレーターツールです。簡単なテキストプロンプトを入力するだけで、キャラクターを主体とした画像や動画を生成することができます。このツールは様々な画像や映像の生成オプションをサポートしており、ユーザは独自の...

TANGO:语音生成协调手势人像视频的工具,全身像数字人-首席AI分享圈

TANGO:全身デジタル人物の協調ジェスチャーポートレート映像を音声で生成するツール

概論 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusion Interpolation) は、東京大学とサイバーエージェントAI研究所が共同開発したオープンソースの協調型音声ジェスチャー動画生成フレームワークです。東京大学とサイバーエージェントAI研究所が共同開発したオープンソースの協調音声ジェスチャー動画生成フレームワークです。その ...

即创:依托巨量引擎生成电商营销物料,快速发布适合抖音推广的商品讲解视频-首席AI分享圈

それは作成することです:電子商取引のマーケティング資料を生成するために巨大なエンジンに依存して、ビデオを説明するのジッタ音声プロモーションに適した製品の急速なリリース

Instant Creationの紹介 Instant CreationはJitterbugが立ち上げたワンストップのインテリジェントなクリエイティブ制作・管理プラットフォームで、クリエイターに効率的で便利なプロフェッショナルなコンテンツ制作サービスを提供することを目的としています。このプラットフォームは、インテリジェント撮影、AIビデオスクリプト、グラフィックツール、商品カードツール、AIライブ背景、AIライブスクリプトなどの様々なAI機能を統合しています。

Arcads:AI驱动创意视频广告生成器-首席AI分享圈

Arcads:AIによるクリエイティブ動画広告ジェネレーター

概要 ArcadsはAIを搭載した動画広告作成プラットフォームで、ユーザーが入力したテキストや商品リンクを、高品質で感情を揺さぶる短編動画広告に素早く変換します。ArcadsにはAIアクターが多数在籍しており、テキストスクリプトを魅力的で本格的な魅惑的動画広告に変換することができます。

SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人-首席AI分享圈

SadTalker: 写真にしゃべらせる|口パク音声|合成口パク動画|無料デジタルピープル

はじめに SadTalkerは、1枚の静止画と音声ファイルを組み合わせて、パーソナライズされたメッセージや教育コンテンツなど、幅広いシナリオに対応するリアルなトーキングヘッドビデオを作成するオープンソースツールです。ExpNetやPoseVAEなどの3Dモデリング技術の革命的な使用により、微妙なファセットを捉えることに優れています。

MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步-首席AI分享圈

MuseV+Muse Talk:完全なデジタルヒューマンビデオ生成フレームワーク|ポートレートからビデオへ|ポーズからビデオへ|リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画の生成を可能にすることを目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Videoなどの様々な機能を提供します。モデル構造、ユースケース、クイックスタート...

ja日本語