Total de 458 artigos
Tags: ai projetos de código aberto Página 4
Introdução abrangente O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, comprometido com a criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0 e integra várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de fluxo de áudio e vídeo em tempo real, sincronização labial e assim por diante. O sistema oferece suporte a ...
Introdução geral O Aider é uma poderosa ferramenta de assistente de programação de IA de código aberto que ajuda os desenvolvedores a escrever, editar e refatorar códigos por meio de diálogo em linguagem natural. Como uma ferramenta interativa de programação de pares de IA, o Aider é compatível com muitas das principais linguagens de programação, integra-se perfeitamente aos fluxos de trabalho do Git e pode...
Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução em 3D e métodos de extração de recursos de áudio para capturar com precisão os recursos de identidade e os coeficientes de expressão do locutor...
Introdução abrangente O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas e marcas d'água de texto de vídeos. A ferramenta usa uma variedade de modelos de algoritmos de IA (STTN, LAMA, PROPAINTER) para identificar de forma inteligente...
Introdução abrangente O TimesFM 2.0 - 500M PyTorch é um modelo de base de série temporal pré-treinado desenvolvido pela Google Research e projetado para previsão de série temporal. O modelo é capaz de lidar com comprimentos de contexto de até 2048 pontos de tempo e suporta intervalos de previsão arbitrários.
Introdução abrangente O WeChat Video No. Downloader é um projeto de código aberto criado para ajudar os usuários a baixar rapidamente o conteúdo de vídeo dos números de vídeo do WeChat. A ferramenta é compatível com vários formatos e plataformas de vídeo, e os usuários podem usá-la facilmente nos sistemas Windows e macOS. O projeto foi desenvolvido pela ltaoo e hospedado no GitHub, os usuários...
Introdução geral O Riona-AI-Agent é uma ferramenta inovadora de automação baseada em IA, projetada especificamente para gerenciar e otimizar as operações das principais plataformas de mídia social. Ela utiliza modelos avançados de IA para fornecer geração inteligente de conteúdo e recursos de gerenciamento de contas para plataformas como Instagram, Twitter e GitHub. O sistema...
Introdução abrangente O NV Ingest (NVIDIA Ingest) é um conjunto de microsserviços de acesso antecipado projetado para analisar centenas de milhares de PDFs não estruturados complexos e confusos e outros documentos corporativos. Ele pode converter esses documentos em metadados e texto para incorporação em sistemas de recuperação.
Introdução abrangente O Always-On AI Assistant é um projeto inovador de assistente de IA que cria um sistema de assistente de IA avançado e permanentemente on-line por meio da integração de tecnologias avançadas, como Deepseek-V3, RealtimeSTT e Typer. O projeto é especialmente otimizado para cenários de desenvolvimento de engenharia, fornecendo um...
Introdução abrangente O STAR (Spatial-Temporal Augmentation with Text-to-Video Models) é uma estrutura inovadora de super-resolução de vídeo desenvolvida em conjunto pela Nanjing University, ByteDance e Southwest University. O projeto se dedica a resolver os principais problemas no processamento de super-resolução de vídeo do mundo real...