Vidéo MOFA : la technologie d'adaptation du champ de mouvement convertit les images fixes en vidéo

Dernières ressources sur l'IAPosté il y a 8 mois Cercle de partage de l'IA

11.8K 00

Introduction générale

MOFA-Video est un outil de génération d'animations d'images de pointe qui utilise des techniques génératives d'adaptation du champ de mouvement pour convertir des images statiques en vidéo dynamique. Développé en collaboration avec l'Université de Tokyo et le Tencent AI Lab, et qui sera présenté à l'ECCV 2024, MOFA-Video prend en charge une variété de signaux de contrôle, y compris les trajectoires, les séquences de points clés et leurs combinaisons, permettant une animation d'image de haute qualité. Les utilisateurs peuvent accéder au code et aux ressources connexes via le dépôt GitHub pour démarrer facilement.

Landmark Control peut faire parler des personnes dans des images, mais n'est pas adapté pour être utilisé comme clone d'une personne numérique.

Liste des fonctions

Génération d'animations d'images : conversion d'images fixes en vidéos animées
Signaux de commande multiples : trajectoires de soutien, séquences de points clés et combinaisons de ces signaux
Adaptation du champ de mouvement : animation grâce à la génération de mouvements clairsemés à denses et à l'adaptation du mouvement basée sur le flux
Scripts de formation et d'inférence : fournir un code complet pour la formation et l'inférence
Démonstrations de Gradio : démonstrations en ligne et téléchargements de points de contrôle
Open source : mise à disposition du public du code et des ressources sur GitHub

Utiliser l'aide

Paramètres environnementaux

entrepôt de clones

git clone https://github.com/MyNiuuu/MOFA-Video.git
cd ./MOFA-Video

Créer et activer un environnement Conda

conda create -n mofa python==3.10
conda activate mofa

Installation des dépendances

pip install -r requirements.txt
pip install opencv-python-headless
pip install "git+https://github.com/facebookresearch/pytorch3d.git"

Télécharger les points de contrôle Télécharger les points de contrôle du référentiel HuggingFace et les placer dans le répertoire ./MOFA-Video-Hybrid/models/cmp/experiments/semiauto_annot/resnet50_vip+mpii_liteflow/checkpoints Catalogue.

Démonstration avec Gradio

L'audio au service de l'animation faciale

cd ./MOFA-Video-Hybrid
python run_gradio_audio_driven.py

Animation faciale avec vidéo de référence

cd ./MOFA-Video-Hybrid
python run_gradio_video_driven.py

L'interface Gradio affichera des instructions, veuillez suivre les instructions de l'interface pour effectuer l'opération de raisonnement.

Formation et raisonnement

MOFA-Video fournit des scripts de formation et d'inférence complets, qui peuvent être personnalisés selon les besoins. Pour des instructions détaillées, veuillez vous référer au fichier README dans le dépôt GitHub.

Principales fonctions

Génération d'animations d'images : téléchargez une image statique, sélectionnez les signaux de contrôle (trajectoire, séquence de points clés ou une combinaison de ceux-ci) et cliquez sur le bouton Générer pour générer une vidéo dynamique.
Signaux de commande multiples : les utilisateurs peuvent choisir différentes combinaisons de signaux de commande pour obtenir des effets d'animation plus riches.
Adaptation du champ de mouvement : assure des effets d'animation fluides et naturels grâce à des techniques de génération de mouvement clairsemé à dense et d'adaptation de mouvement basée sur le flux.

MOFA-Video offre des fonctions riches et des instructions détaillées permettant aux utilisateurs de générer des animations d'images et de personnaliser la formation en fonction de leurs besoins, et d'obtenir facilement des effets d'animation d'images de haute qualité.

Dernières ressources sur l'IA # AI Image to Video # AI Java Open Source Projecct

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Jan：开源离线AI助手，ChatGPT 替代品，运行本地AI模型或连接云端AI

Jan : Assistant IA hors ligne open source, remplacement de ChatGPT, exécution de modèles d'IA locaux ou connexion à l'IA en nuage

Dernières ressources sur l'IA # AI Localised Chat Application

Il y a 9 mois

020.6K

BISHENG : Plateforme LLM DevOps open source pour la création d'applications d'IA d'entreprise.

Dernières ressources sur l'IA # Flux de travail à code bas # Cadre de développement de l'organisme intelligent

Il y a 9 mois

015.8K

Chromox : générateur de vidéo IA avec plusieurs modes de contrôle du mouvement vidéo pour créer une variété de styles vidéo.

Dernières ressources sur l'IA # AI Image to Video # AI text to video

Il y a 11 mois

011.8K

Gemini Playground : Déploiement sans serveur d'un site de dialogue multimodal Gemini

Dernières ressources sur l'IA # AI Java Open Source Projecct # Free Large Model API

Il y a 7 mois

012.5K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Vidéo MOFA : la technologie d'adaptation du champ de mouvement convertit les images fixes en vidéo

Introduction générale

Liste des fonctions

Utiliser l'aide

Paramètres environnementaux

Démonstration avec Gradio

Formation et raisonnement

Principales fonctions

Qwen Chat : utilisation de tous les modèles de la famille Qwen, génération d'images, traitement de documents et recherche sur le web

Fay Digital Human Framework : intégration de modèles linguistiques et de personnages numériques en 3D pour soutenir une variété de scénarios d'application.

Articles connexes

Jan : Assistant IA hors ligne open source, remplacement de ChatGPT, exécution de modèles d'IA locaux ou connexion à l'IA en nuage

BISHENG : Plateforme LLM DevOps open source pour la création d'applications d'IA d'entreprise.

Chromox : générateur de vidéo IA avec plusieurs modes de contrôle du mouvement vidéo pour créer une variété de styles vidéo.

Gemini Playground : Déploiement sans serveur d'un site de dialogue multimodal Gemini

Pas de commentaires

Dernières collections

Derniers articles

Vidéo MOFA : la technologie d'adaptation du champ de mouvement convertit les images fixes en vidéo

Introduction générale

Liste des fonctions

Utiliser l'aide

Paramètres environnementaux

Démonstration avec Gradio

Formation et raisonnement

Principales fonctions

Qwen Chat : utilisation de tous les modèles de la famille Qwen, génération d'images, traitement de documents et recherche sur le web

Fay Digital Human Framework : intégration de modèles linguistiques et de personnages numériques en 3D pour soutenir une variété de scénarios d'application.

Articles connexes

Jan : Assistant IA hors ligne open source, remplacement de ChatGPT, exécution de modèles d'IA locaux ou connexion à l'IA en nuage

BISHENG : Plateforme LLM DevOps open source pour la création d'applications d'IA d'entreprise.

Chromox : générateur de vidéo IA avec plusieurs modes de contrôle du mouvement vidéo pour créer une variété de styles vidéo.

Gemini Playground : Déploiement sans serveur d'un site de dialogue multimodal Gemini

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles