Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1
Total de 61 artigos

Tags: ai digital pessoas Página 2

AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端-首席AI分享圈

AIGCPanel: clone de código aberto do sistema de integração digital man, implantação com um clique do cliente digital man gratuito

Introdução abrangente O AigcPanel é um sistema completo de produção humana digital de IA para todos os usuários, desenvolvido com a pilha de tecnologia electron+vue3+typescript, com suporte à implementação com um clique em sistemas Windows. O sistema foi projetado para ser fácil de usar como núcleo, até mesmo usuários com uma base técnica fraca podem dominá-lo facilmente. Principais recursos ...

LiveImage AI:人物肖像图片转换为会说话的肖像视频(付费)-首席AI分享圈

LiveImage AI: imagens de retratos convertidas em vídeos de retratos falantes (pago)

Introdução geral O LiveImage AI é uma plataforma inovadora de IA generativa que transforma imagens estáticas em conteúdo de vídeo vívido diretamente de seu navegador. Os usuários simplesmente gravam uma mensagem, carregam qualquer foto de retrato e a avançada tecnologia de IA dá à imagem expressões faciais e emoções naturais. Seja para criar vídeos virais...

Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频-首席AI分享圈

Sonic: Imagens de retrato com áudio geram vídeos de demonstração digital com expressões faciais vívidas

Introdução geral O Sonic é uma plataforma inovadora focada na percepção global de áudio, projetada para gerar animações de retratos vívidos impulsionadas pelo áudio. Desenvolvida por uma equipe de pesquisadores da Tencent e da Universidade de Zhejiang, a plataforma usa informações de áudio para controlar expressões faciais e movimentos da cabeça para gerar vídeos animados naturais e suaves.

悦动人像EMO:基于人物肖像图片和人声音频生成高质量人物肖像动态视频-首席AI分享圈

EMO: gerar vídeo de retrato de alta qualidade com base em imagens de retrato e áudio de voz humana.

Introdução abrangente O YUE Portrait EMO é uma ferramenta de geração de vídeo dinâmico de retrato de alta qualidade fornecida pela plataforma de serviços de modelos grandes da Aliyun, a Hundred Refine (Model Studio). A ferramenta é baseada em imagens de retratos e arquivos de áudio de voz humana para gerar vídeos dinâmicos de retratos realistas. O YUE Portrait EMO contém dois mod...

DH live: pessoas digitais com IA com interação suave em tempo real em placas de vídeo da série 30/40

Introdução geral O DH_live é um projeto humano digital ao vivo em tempo real baseado em aprendizado sem amostragem, com o objetivo de oferecer aos usuários uma experiência de transmissão ao vivo suave e interativa. O projeto é compatível com as placas gráficas NVIDIA das séries 30 e 40 e é capaz de ser executado em tempo real a mais de 25 fps. Os usuários podem criar e usar...

如影AI视频合成:生成AI视频,提供数字人直播服务-首席AI分享圈

Composição de vídeo de IA da Ruyi: geração de vídeos de IA e fornecimento de serviços de pessoas digitais ao vivo

A Ruying AI Video Synthesis é uma plataforma de geração de vídeo de IA lançada pela Shanghai Yuyi Technology Co. A plataforma se baseia no grande recurso de modelo "SenseNova" da SenseNova, fornecendo uma variedade de opções de imagem e tom humanos digitais, e os usuários só precisam inserir o texto para gerar um vídeo de IA realista. Isso...

蝉镜:数字人视频创作平台,拥有数百款数字人模板以及克隆专属数字人形象(付费)-首席AI分享圈

Cicada Mirror: plataforma de criação de vídeo humano digital com centenas de modelos humanos digitais e clonagem de imagens humanas digitais exclusivas (pago)

Introdução geral A Cicada é uma plataforma que se concentra na criação de vídeos humanos digitais, usando a tecnologia de IA para simplificar o processo de produção de vídeos. Os usuários podem escolher diferentes imagens humanas digitais, inserir cópias e gerar vídeos com dublagem em vários idiomas. A plataforma oferece uma rica biblioteca de modelos e materiais, que são adequados para uma variedade de campos, como publicidade e marketing, educação e treinamento...

EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)-首席AI分享圈

EchoMimic: retratos orientados por áudio para gerar vídeos falados (instalador acelerado do EchoMimicV2)

Introdução geral O EchoMimic é um projeto de código aberto criado para gerar animações de retratos realistas acionadas por áudio. Desenvolvido pela divisão Terminal Technologies do Ant Group, o projeto gera vídeos de retratos dinâmicos usando condições de marcadores editáveis que combinam áudio e pontos de marcadores faciais. O EchoMimic está disponível em vários conjuntos de dados públicos...

VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案-首席AI分享圈

VideoChat: pessoa digital interativa por voz em tempo real com clonagem personalizada de imagens e tons, com suporte a soluções de voz de ponta a ponta e soluções em cascata

Introdução abrangente O VideoChat é um projeto humano digital de interação de voz em tempo real baseado em tecnologia de código aberto, compatível com esquemas de voz de ponta a ponta (GLM-4-Voice - THG) e esquemas em cascata (ASR-LLM-TTS-THG). O projeto permite que os usuários personalizem a imagem e o timbre do humano digital, além de oferecer suporte à clonagem de timbre e à sincronização labial...

Hallo2:音频驱动生成口型/表情同步的肖像视频(Windows一键安装)-首席AI分享圈

Hallo2: geração orientada por áudio de vídeos de retratos sincronizados com os lábios e com a expressão (instalação com um clique para Windows)

Introdução geral O Hallo2 é um projeto de código aberto desenvolvido em conjunto pela Universidade de Fudan e pelo Baidu para gerar animações de retratos de alta resolução por meio de geração orientada por áudio. O projeto utiliza redes adversárias geradoras (GAN) avançadas e técnicas de alinhamento de tempo para obter resolução de 4K e geração de vídeos de até 1 hora de duração.

UltraLight Digital Human:开源端侧实时运行的超轻量级数字人,附一键安装包-首席AI分享圈

UltraLight Digital Human: humano digital ultraleve de código aberto com execução em tempo real no lado final e pacote de instalação com um clique

Introdução geral O Ultralight Digital Human é um projeto de código aberto para desenvolver um modelo humano digital ultraleve que possa ser executado em tempo real em dispositivos móveis. O projeto consiste na otimização de algoritmos e da estrutura do modelo para obter uma operação tranquila em dispositivos móveis, adequada para aplicativos sociais, jogos e aplicativos virtuais.

TalkingAvatar:创建和编辑AI虚拟形象视频平台,基于本地算力Windows客户端-首席AI分享圈

TalkingAvatar: plataforma de vídeo de avatar de IA para criar e editar avatares de IA, com base no cliente Windows aritmético nativo

Introdução geral O TalkingAvatar é uma plataforma líder de avatar de IA que oferece uma solução completa de IA para pessoas digitais. Oferece aos usuários uma maneira revolucionária de criar, editar e personalizar o conteúdo de vídeo. Com a avançada tecnologia de IA, os usuários podem facilmente reescrever vídeos, clonar vozes, sincronizar lábios e criar...

RenderNet:锁定面部特征,创建人物一致性的图像、视频运镜到口播视频-首席AI分享圈

RenderNet: direcionamento de recursos faciais para criar imagens consistentes com o personagem, drible de vídeo para vídeo de palavras faladas

Introdução geral O RenderNet é uma ferramenta de geração que se concentra na criação de imagens e vídeos que mantêm a consistência dos caracteres com base na tecnologia de inteligência artificial. Os usuários podem gerar imagens e vídeos orientados por caracteres com simples comandos de texto. A ferramenta oferece suporte a uma ampla gama de opções de geração de imagens e vídeos, e os usuários podem criar suas próprias...

TANGO:语音生成协调手势人像视频的工具,全身像数字人-首席AI分享圈

TANGO: uma ferramenta para vídeo de retrato gestual coordenado gerado por voz de um ser humano digital de corpo inteiro

Introdução geral O TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusion Interpolation) é uma estrutura de geração de vídeo de gestos de fala colaborativa de código aberto desenvolvida pela Universidade de Tóquio e pelo CyberAgent AI Labs Uma estrutura de geração de vídeo de gestos de fala colaborativa de código aberto desenvolvida em conjunto pela Universidade de Tóquio e pelo CyberAgent AI Lab. O ...

即创:依托巨量引擎生成电商营销物料,快速发布适合抖音推广的商品讲解视频-首席AI分享圈

Ou seja, criar: contar com um grande mecanismo para gerar materiais de marketing de comércio eletrônico, lançamento rápido de produtos adequados para a promoção de voz trêmula para explicar o vídeo

Instant Creation Introdução O Instant Creation é uma plataforma de gerenciamento e produção criativa inteligente e completa lançada pela Jitterbug, com o objetivo de fornecer serviços de criação de conteúdo eficientes, convenientes e profissionais para criadores. A plataforma integra uma variedade de funções de IA, como filmagem inteligente, scripts de vídeo de IA, ferramentas gráficas, ferramentas de cartões de mercadorias, fundos ao vivo de IA, scripts ao vivo de IA...

SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人-首席AI分享圈

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Introdução geral O SadTalker é uma ferramenta de código aberto que combina fotos de retratos únicos e arquivos de áudio para criar vídeos realistas de cabeças falantes para uma ampla variedade de cenários, como mensagens personalizadas, conteúdo educacional e muito mais. O uso revolucionário de tecnologias de modelagem 3D, como ExpNet e PoseVAE, é excelente para capturar as facetas sutis...

MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步-首席AI分享圈

MuseV+Muse Talk: Estrutura completa de geração de vídeo humano digital | Retrato para vídeo | Pose para vídeo | Sincronização labial

Introdução geral O MuseV é um projeto público no GitHub que tem como objetivo permitir a geração de vídeos de avatar com duração ilimitada e alta fidelidade. Ele se baseia na tecnologia de difusão e oferece Image2Video, Text2Image2Video, Video2Video e muitos outros recursos. Fornece estrutura de modelo, casos de uso, início rápido...

pt_BRPortuguês do Brasil