Aprendizagem pessoal com IA
e orientação prática
Total de 472 artigos

Tags: ai projetos de código aberto Página 20

Sonic: Imagens de retratos com áudio geram vídeos pop-up digitais com expressões faciais vívidas - Chief AI Sharing Circle

Sonic: Imagens de retrato com áudio geram vídeos de demonstração digital com expressões faciais vívidas

Introdução geral O Sonic é uma plataforma inovadora focada na percepção global de áudio, projetada para gerar animações de retratos vívidos impulsionadas pelo áudio. Desenvolvida por uma equipe de pesquisadores da Tencent e da Universidade de Zhejiang, a plataforma usa informações de áudio para controlar expressões faciais e movimentos da cabeça para gerar vídeos animados naturais e suaves.

Ultravox: um macromodelo multimodal de áudio para diálogo de voz de ponta a ponta em tempo real, uma implementação de código aberto da interação de voz GPT-4o - Chief AI Sharing Circle

Ultravox: um macromodelo multimodal de áudio para diálogo de voz de ponta a ponta em tempo real, uma implementação de código aberto da interação de voz GPT-4o

Introdução abrangente O Ultravox é um inovador modelo multimodal de linguagem grande (LLM) projetado para processamento de fala em tempo real. Ao contrário dos sistemas tradicionais de reconhecimento de fala, o Ultravox elimina a necessidade de um estágio separado de reconhecimento de fala em áudio (ASR) e é capaz de converter diretamente o áudio em texto em um espaço de alta dimensão. Esse recurso torna...

infinite-zoom-stable-diffusion: gerando vídeos com loop de zoom infinito - Chief AI Sharing Circle

infinite-zoom-stable-diffusion: gerar vídeo em loop com zoom infinito

Introdução abrangente O Infinite Zoom Stable Diffusion (Difusão estável de zoom infinito) é um projeto de código aberto desenvolvido para criar vídeos com zoom infinito usando técnicas de difusão estável. O projeto oferece um notebook Colab fácil de usar, em que os usuários podem gerar um loop infinito de vídeo por meio de vários prompts. Projeto ...

Easy-Wav2Lip: uma ferramenta para sincronização labial de vídeo de alta qualidade, versão otimizada do Wav2Lip - Chief AI Sharing Circle

Easy-Wav2Lip: ferramenta para sincronização labial de vídeo de alta qualidade, otimizada para Wav2Lip

Introdução geral O Easy-Wav2Lip é uma ferramenta aprimorada baseada no Wav2Lip, projetada para simplificar o processo de sincronização labial de vídeo. A ferramenta oferece configuração e implementação mais simples, suporta o Google Colab e a instalação local. Ao otimizar o algoritmo, o Easy-Wav2Lip aumenta significativamente a velocidade de processamento e corrige...

AgentClientDemo: um cliente Python que demonstra o processo de execução de um corpo inteligente, fornecendo uma interface gráfica de usuário intuitiva

Introdução abrangente O AgentClientDemo é um projeto Python abrangente que integra a funcionalidade inteligente (Agente) e cliente (Cliente). O projeto é baseado na estrutura PyQt e oferece uma interface gráfica do usuário (GUI) intuitiva e fácil de usar. Com esse projeto, os usuários podem experimentar o corpo inteligente...

HelloMeme: gere uma imagem ou vídeo consistente com a ação de expressão local de alta fidelidade, Runway Act, um círculo de compartilhamento de IA de código aberto de ping-pong

HelloMeme: gere imagens ou vídeos consistentes com ações de expressão local de alta fidelidade, Runway Act one open source ping pong!

Introdução abrangente O HelloMeme é um projeto de código aberto desenvolvido pela HelloVision, com o objetivo de gerar imagens e vídeos de alta qualidade por meio da integração do Spatial Knitting Attentions para incorporar condições de alto nível e alta fidelidade em modelos de difusão. O código e a modelagem do projeto ...

Chunkr: um serviço completo para ingestão de documentos e fragmentação inteligente com base na hierarquia de parágrafos de texto usando modelos visuais - Chief AI Sharing Circle

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução abrangente O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). Ela foi desenvolvida pela Lumina AI Inc. e usa modelos visuais avançados para a ingestão de documentos...

GitIngest: transforme rapidamente os repositórios de código do Github em texto adequado para compreensão do LLM - Chief AI Sharing Circle

GitIngest: Converta rapidamente repositórios de código do Github em texto adequado para compreensão do LLM

Introdução geral O GitIngest é uma ferramenta de código aberto projetada para transformar repositórios de código do GitHub em texto adequado para dicas do Modelo de Linguagem Grande (LLM). Com uma operação simples, os usuários podem extrair e formatar o conteúdo de qualquer repositório do GitHub em texto adequado para o uso do LLM. A ferramenta oferece análise com um clique...

CodeArena: arena de comparação de potência de programação LLM de código aberto, visualização em tempo real dos melhores modelos de geração de código - Chief AI Sharing Circle

CodeArena: Arena de comparação de recursos de programação LLM de código aberto, visualização em tempo real dos melhores modelos de geração de código

Introdução geral A CodeArena é uma plataforma exclusiva projetada para apresentar os melhores modelos de geração de código-fonte aberto (LLMs) por meio de confrontos em tempo real. Os usuários podem assistir a diferentes LLMs competindo nas mesmas tarefas de programação e ver os modelos com melhor desempenho por meio de tabelas de classificação em tempo real. A plataforma utiliza a Together AI para gerar código...

NSFW Detector: detecte se o arquivo contém conteúdo incômodo (NSFW) e proteja a segurança dos dados - Chief AI Sharing Circle

NSFW Detector: detecta se um arquivo contém conteúdo NSFW para proteger a segurança dos dados.

Introdução abrangente O NSFW Detector é uma ferramenta de detecção de conteúdo incômodo baseada em IA, usada principalmente para detectar se imagens, vídeos, arquivos PDF etc. contêm conteúdo incômodo. A ferramenta adota o modelo Falconsai/nsfwimagedetection e usa o vit-base-patch16-224-in do Google...

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil