Aprendizagem pessoal com IA
e orientação prática
Total de 480 artigos

Tags: ai projetos de código aberto Página 45

SadTalker: Faça as fotos falarem | Áudio de sincronização da boca | Vídeo de sincronização da boca sintetizado | Pessoas digitais gratuitas - Círculo de compartilhamento de IA principal

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Introdução geral O SadTalker é uma ferramenta de código aberto que combina fotos estáticas e arquivos de áudio para criar vídeos de avatares falantes realistas para uma ampla variedade de cenários, como mensagens personalizadas, conteúdo educacional e muito mais. O uso revolucionário de tecnologias de modelagem 3D, como ExpNet e PoseVAE, excelente captura...

VideoReTalking: sistema de edição de vídeo e sincronização labial acionado por áudio - Chief AI Sharing Circle

VideoReTalking: sincronização labial acionada por áudio e sistema de edição de vídeo

Introdução geral O VideoReTalking é um sistema inovador que permite aos usuários gerar vídeos faciais sincronizados com os lábios com base no áudio de entrada, produzindo vídeos de saída de alta qualidade e sincronizados com os lábios, mesmo com emoções diferentes. O sistema divide esse objetivo em três tarefas sucessivas: geração de vídeos faciais com expressões típicas...

MuseV+Muse Talk: Estrutura completa de geração de vídeo humano digital | Retrato para vídeo | Gesto para vídeo | Sincronização labial - Círculo de compartilhamento de IA principal

MuseV+Muse Talk: Estrutura completa de geração de vídeo humano digital | Retrato para vídeo | Pose para vídeo | Sincronização labial

Introdução geral O MuseV é um projeto público no GitHub que tem como objetivo permitir a geração de vídeos de avatar com duração ilimitada e alta fidelidade. Ele se baseia na tecnologia de difusão e oferece Image2Video, Text2Image2Video, Video2Video e muitos outros recursos. Fornece estrutura de modelo, casos de uso, início rápido...

Não estruturado: documentos não estruturados de pré-processamento de código aberto, ferramentas de processamento de dados não estruturados - Chief AI Sharing Circle

Não estruturado: documentos não estruturados de pré-processamento de código aberto, ferramentas de processamento de dados não estruturados

Introdução abrangente O Unstructured-IO fornece um conjunto de componentes de código aberto para processamento e pré-processamento de imagens e documentos de texto, como PDF, HTML, documentos do Word etc. O Unstructured-IO fornece um conjunto de componentes de código aberto para processamento e pré-processamento de imagens e documentos de texto, como PDF, HTML, documentos do Word etc. Seu principal objetivo é simplificar e otimizar os fluxos de trabalho de processamento de dados, especialmente para aplicativos de modelo de linguagem grande (LLM), para fornecer suporte. Seu principal objetivo é simplificar e otimizar os fluxos de trabalho de processamento de dados, especialmente para aplicativos de modelo de linguagem grande (LLM) para fornecer suporte.

magic-html: extrai dados do corpo do URL HTML, produz texto simples/markdown

Introdução geral magic-html é uma biblioteca Python projetada para simplificar o processo de extração do conteúdo da região do corpo do HTML. Seja lidando com estruturas complexas de HTML ou com páginas da Web simples, essa biblioteca tem como objetivo fornecer uma interface conveniente e eficiente para os usuários. Ela oferece suporte à extração multimodal, extração de vários layouts...

WebPilot: ferramenta inteligente de processamento de informações da Web, API gratuita para rastreamento de conteúdo da Web - Chief AI Sharing Circle

WebPilot: ferramenta inteligente de processamento de informações da Web, API gratuita para captura de conteúdo da Web

WebPilot Introdução geral O Webpilot é um "assistente da Web" gratuito e de código aberto que permite que você se comunique livremente com qualquer página da Web ou execute tarefas automatizadas. Em vez de alternar entre páginas ou copiar e colar, basta selecionar o texto ou digitar comandos, e o Webpilot fornecerá informações em tempo real e tarefas inteligentes...

DB-GPT: Criação de uma estrutura de desenvolvimento de aplicativos de dados nativos de IA, integrando gerenciamento de vários modelos e processamento inteligente de dados - Círculo de compartilhamento de IA principal

DB-GPT: criação de uma estrutura de desenvolvimento de aplicativos de dados nativos de IA, integrando gerenciamento de vários modelos e processamento inteligente de dados

Introdução abrangente O DB-GPT é uma estrutura de desenvolvimento de aplicativos de dados nativos de IA de código aberto criada usando AWEL (Agentic Workflow Expression Language) e tecnologias de corpo inteligente. O projeto tem como objetivo criar uma infraestrutura no campo de modelos grandes por meio do desenvolvimento de vários recursos técnicos, incluindo um sistema de gerenciamento de vários modelos (SMMF),...

DreamTalk: gere vídeos de conversação expressivos usando uma única imagem de avatar - Chief AI Sharing Circle

DreamTalk: Gere vídeos de conversação expressivos com uma única imagem de avatar!

DreamTalk Introdução abrangente O DreamTalk é uma estrutura de geração de talking head de expressão orientada por modelo de difusão, desenvolvida em conjunto pela Universidade de Tsinghua, pelo Grupo Alibaba e pela Universidade de Ciência e Tecnologia de Huazhong. Ele consiste principalmente em três partes: uma rede de redução de ruído, um especialista em lábios com reconhecimento de estilo e um preditor de estilo, e é capaz de gerar uma variedade de entradas de áudio com base em...

GPT Crawler: rastreamento de arquivos de base de conhecimento de sites para criar GPTs personalizados - Chief AI Sharing Circle

GPT Crawler: rastreamento de documentos da base de conhecimento de sites para criar GPTs personalizados

Introdução geral O GPT Crawler é uma ferramenta de código aberto que permite aos usuários gerar arquivos de conhecimento por meio do rastreamento do conteúdo de um site específico, o que, por sua vez, cria modelos GPT personalizados. O projeto é usado principalmente para rastrear e organizar informações da Web e suporta a execução via API e implantação local. Os usuários podem configurar o rastreador de forma flexível para se adequar...

InstantID: Carregue uma imagem e migre os recursos de retrato para gerar imagens de estilos diferentes-Chief AI Sharing Circle

InstantID: carregue uma imagem e migre os recursos de retrato para gerar diferentes estilos de imagens

Introdução abrangente O InstantID é uma tecnologia avançada voltada para a geração de imagens com estilos ou poses personalizados em segundos, garantindo um alto nível de fidelidade com o uso de uma única imagem de identificação de referência. A tecnologia usa uma solução baseada em modelo de difusão, integrando imagens faciais, imagens de...

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil