DH live: pessoas digitais com IA com interação suave em tempo real em placas de vídeo da série 30/40

Recursos mais recentes de IAPublicado há 8 meses Círculo de compartilhamento de IA

2.2K 00

Introdução geral

O DH_live é um projeto humano digital ao vivo em tempo real baseado em aprendizado sem amostragem, com o objetivo de oferecer aos usuários uma experiência de transmissão ao vivo suave e interativa. O projeto é compatível com as placas gráficas NVIDIA das séries 30 e 40 e é capaz de ser executado em tempo real a mais de 25 fps. Os usuários podem criar e usar humanos digitais em etapas simples, permitindo a geração de vídeo com áudio e a interação em tempo real.

Lista de funções

Desempenho em tempo real: compatível com as placas de vídeo NVIDIA das séries 30 e 40 para uma experiência interativa suave em tempo real.
Aprendizado com poucas tentativas: o sistema é capaz de aprender com um pequeno número de exemplos para gerar respostas realistas.
Preparação do vídeo: use o script data_preparation para preparar os dados do vídeo.
Driver de áudio: suporta a condução de pessoas digitais por meio de arquivos de áudio para gerar vídeo sincronizado.
Entrada de microfone em tempo real: suporta operação em tempo real por meio de microfone.

Usando a Ajuda

Criação de ambiente e descompressão de arquivos de modelo

Crie um ambiente virtual e ative-o:

conda create -n dh_live python=3.12
conda activate dh_live

Instale a dependência:

pip install torch --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

Descompacte os arquivos do modelo:
- Linux.
```
cd checkpoint
cat render.pth.gz.001 render.pth.gz.002 > render.pth.gz
gzip -d -c render.pth.gz > render.pth
```
- Windows: extraia o arquivo de ponto de verificação usando o 7zip ou o WinRAR.

Preparação de vídeo

fazer uso de data_preparation.py Vídeo de preparação do roteiro:
```
python data_preparation.py YOUR_VIDEO_PATH
```
Os resultados serão armazenados no ./video_data Catálogo.

Execução com arquivos de áudio

Certifique-se de que o arquivo de áudio esteja no formato .wav com uma taxa de amostragem de 16 kHz, mono de 16 bits.

Execute o script de demonstração:

python demo.py video_data/test video_data/audio0.wav 1.mp4

operação em tempo real

Use o microfone para operação em tempo real:
```
python demo_avatar.py
```

problemas comuns

Falha ao descompactar o arquivo de modeloObservação: Certifique-se de que todos os arquivos de subvolume estejam completos e descompactados corretamente.
Formato de arquivo de áudio incorretoUse um arquivo .wav em conformidade.

Instalador de um clique do DH live

Link: https://pan.quark.cn/s/5a34bc9c2f76
Código de extração: sZT4

O artigo é protegido por direitos autorais e não deve ser reproduzido sem permissão.

Fish Agent: assistente de clonagem de voz de IA de ponta a ponta, assistente de diálogo de voz em tempo real, projeto derivado do Fish Speech

Recursos mais recentes de IA # Projeto de código aberto AI Java Clonagem de voz do # AI # Produtos multimodais interativos em tempo real

7 meses atrás

02.1K

Funções de IA: um serviço (API) para converter conteúdo de entrada em saídas estruturadas

Recursos mais recentes de IA # Serviços abertos de IA # Extração e limpeza de documentos

6 meses atrás

01.6K

eCommercePrompts: crie instruções do ChatGPT para comércio eletrônico em tempo real!

Recursos mais recentes de IA # PROMPTS Aids

12 meses atrás

01.8K

Future You: Diálogo com seu eu futuro, explorando possibilidades futuras, autorreflexão com diálogo de IA

Recursos mais recentes de IA # Ferramentas educacionais de IA

6 meses atrás

02.1K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

DH live: pessoas digitais com IA com interação suave em tempo real em placas de vídeo da série 30/40

Introdução geral

Lista de funções

Usando a Ajuda

Criação de ambiente e descompressão de arquivos de modelo

Preparação de vídeo

Execução com arquivos de áudio

operação em tempo real

problemas comuns

Instalador de um clique do DH live

CatVTON-FLUX: Combinação dos modelos de reparo CATVTON e Flux Fill para esquemas de ajuste virtual

Galaxy.ai: uma plataforma multifuncional que integra mais de 1.700 bibliotecas de ferramentas de IA para compreender todos os tipos de ferramentas de IA generativas do mercado (pago)

Artigos relacionados

Fish Agent: assistente de clonagem de voz de IA de ponta a ponta, assistente de diálogo de voz em tempo real, projeto derivado do Fish Speech

Funções de IA: um serviço (API) para converter conteúdo de entrada em saídas estruturadas

eCommercePrompts: crie instruções do ChatGPT para comércio eletrônico em tempo real!

Future You: Diálogo com seu eu futuro, explorando possibilidades futuras, autorreflexão com diálogo de IA

Sem comentários

Últimas coleções

Artigos mais recentes

DH live: pessoas digitais com IA com interação suave em tempo real em placas de vídeo da série 30/40

Introdução geral

Lista de funções

Usando a Ajuda

Criação de ambiente e descompressão de arquivos de modelo

Preparação de vídeo

Execução com arquivos de áudio

operação em tempo real

problemas comuns

Instalador de um clique do DH live

CatVTON-FLUX: Combinação dos modelos de reparo CATVTON e Flux Fill para esquemas de ajuste virtual

Galaxy.ai: uma plataforma multifuncional que integra mais de 1.700 bibliotecas de ferramentas de IA para compreender todos os tipos de ferramentas de IA generativas do mercado (pago)

Artigos relacionados

Fish Agent: assistente de clonagem de voz de IA de ponta a ponta, assistente de diálogo de voz em tempo real, projeto derivado do Fish Speech

Funções de IA: um serviço (API) para converter conteúdo de entrada em saídas estruturadas

eCommercePrompts: crie instruções do ChatGPT para comércio eletrônico em tempo real!

Future You: Diálogo com seu eu futuro, explorando possibilidades futuras, autorreflexão com diálogo de IA

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes