Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1
Total de 914 artigos

Tags: ai projetos de código aberto Página 46

PaddleOCR: uma biblioteca de ferramentas de OCR multilíngue baseada no Flying Paddle, com suporte ao reconhecimento de mais de 80 idiomas

Introdução geral O PaddleOCR é um kit de ferramentas de OCR multilíngue baseado no PaddlePaddle, projetado para fornecer um sistema de OCR prático e ultraleve. Ele é compatível com o reconhecimento em mais de 80 idiomas e oferece ferramentas de anotação e síntese de dados para suporte em servidores, dispositivos móveis, dispositivos incorporados e de IoT...

Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播-首席AI分享圈

Deep Live Cam: ferramenta de troca de rosto de IA em tempo real de código aberto, uma foto para troca de rosto em tempo real

Introdução geral O Deep Live Cam é uma ferramenta de IA de código aberto projetada para permitir a substituição de rostos em tempo real e a geração de vídeos falsos profundos a partir de uma única foto. Usando algoritmos avançados de aprendizagem profunda, a ferramenta é capaz de substituir rostos em tempo real durante transmissões ao vivo ou chamadas de vídeo, protegendo a privacidade do usuário e acrescentando interesse.Deep Liv...

NarratoAI:文本生成影视解说与自动化剪辑神器-首席AI分享圈

NarratoAI: ferramenta de edição automatizada e narração de filmes e TV gerada por texto

Introdução geral O NarratoAI é uma ferramenta totalmente automatizada que integra narração de filmes e TV, edição automatizada, dublagem e geração de legendas. Ele se baseia na tecnologia de modelagem de linguagem em larga escala (LLM) para gerar automaticamente cópias e editar automaticamente vídeos com locuções e legendas correspondentes, oferecendo aos usuários uma solução completa para narração de filmes e TV...

Babelfish.ai:浏览器运行的语音实时转录与翻译应用-首席AI分享圈

Babelfish.ai: aplicativo de tradução e transcrição de fala em tempo real executado pelo navegador

Introdução geral O Babelfish.ai é um aplicativo de transcrição e tradução em tempo real desenvolvido com base no Huggingface Transformer.js e no Supabase Realtime. O aplicativo pode carregar modelos grandes no navegador e executá-los localmente para a funcionalidade de tradução e conversão de fala em texto em tempo real. Os usuários podem usar o...

Vector Vein(向量脉络):无代码AI工作流构建平台-首席AI分享圈

Vector Vein: plataforma de criação de fluxo de trabalho de IA sem código

Introdução geral O Vector Vein é uma plataforma de criação de fluxos de trabalho de IA sem código, projetada para ajudar os usuários a criar facilmente fluxos de trabalho inteligentes e automatizados. Sem a necessidade de conhecimento de programação, os usuários podem criar fluxos de trabalho de IA complexos simplesmente conectando vários módulos funcionais por meio de operações de arrastar e soltar. A plataforma combina...

LivePortrait:静态图像、视频生成动态肖像动画工具-首席AI分享圈

LivePortrait: ferramenta de animação para gerar retratos dinâmicos a partir de imagens estáticas e vídeos

Introdução geral O LivePortrait é uma ferramenta avançada de animação de retratos dinâmicos com IA desenvolvida pela Racer Technology. Ele utiliza a inovadora tecnologia de IA para transformar imagens estáticas em animações de vídeo vívidas. Independentemente de você usar fotos reais, estilos animados ou retratos artísticos, o LivePortrait oferece movimentos de alta qualidade...

PhiData:构建拥有记忆、知识和工具的AI智能体-首席AI分享圈

PhiData: criando inteligências de IA com memória, conhecimento e ferramentas

Introdução abrangente O PhiData é uma estrutura projetada para desenvolver assistentes de IA inteligentes. Ele permite que os assistentes de IA conduzam conversas de longo prazo, forneçam um contexto comercial preciso e executem várias operações, aprimorando a memória, a integração do conhecimento e os recursos de invocação de ferramentas.

ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)-首席AI分享圈

ChatTTS: um modelo de geração de fala que imita a voz de uma pessoa real falando (pacote de aceleração de um clique do ChatTTS)

Introdução geral O ChatTTS é um modelo de fala generativo projetado para cenários de diálogo. Ele gera fala natural e expressiva, suporta vários idiomas e vários falantes e é adequado para diálogos interativos. O modelo vai além do grande, prevendo e controlando recursos prosódicos de granulação fina, como risos, pausas e interjeições...

MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪-首席AI分享圈

MoneyPrinterPlus: ferramenta de IA para gerar vídeos curtos com um clique, mixagem em lote gratuita

Introdução abrangente O MoneyPrinterPlus é um projeto de código aberto que visa gerar e misturar todos os tipos de vídeos curtos com um clique por meio da tecnologia de IA e publicá-los automaticamente em várias plataformas de vídeo, como Jieyin, Shutterbugs, Xiaohongshu e Video Number. A ferramenta oferece suporte a modelos de voz locais e baseados em nuvem, incluindo chatTTS, fasterwhisper, G...

Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序-首席AI分享圈

Chatbot UI: um aplicativo de bate-papo com IA de código aberto que imita a interface e a funcionalidade do ChatGPT

Introdução geral O Chatbot UI é um projeto de código aberto criado para ajudar os desenvolvedores a criar interfaces de conversação personalizadas e inteligentes. O projeto fornece uma série de componentes de interface e recursos interativos que podem ser facilmente integrados ao sistema de Chatbot existente para oferecer aos usuários uma experiência de diálogo mais suave e inteligente.

GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面-首席AI分享圈

GUI GLIGEN: controle preciso da posição dos elementos da imagem, interface gráfica intuitiva baseada no ComfyUI

Introdução geral O GLIGEN GUI é uma interface gráfica intuitiva baseada no ComfyUI, projetada para simplificar o uso do modelo GLIGEN, um novo modelo de texto para imagem que permite a especificação precisa da posição dos objetos em uma imagem. Com o GLIGEN GUI, o usuário é solicitado a desenhar caixas e inserir texto...

Easy Voice Toolkit:本地部署的AI语音工具箱-首席AI分享圈

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Introdução abrangente O Easy-Voice-Toolkit é um kit de ferramentas multifuncional baseado no Open Source Speech Project que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva ou sequencial, conforme necessário...

FaceFusion:视频换脸增强工具|语音同步视频嘴型动作-首席AI分享圈

FaceFusion: Ferramenta de aprimoramento de troca de rosto em vídeo | Movimentos de boca em vídeo com sincronização de voz

Introdução geral O FaceFusion é uma plataforma de nuvem de última geração com recursos integrados de troca e aprimoramento facial que otimiza o processo de troca de imagem para vídeo e imagem para imagem com 5 modelos profissionais para garantir um resultado impecável. Além disso, ele executa o aprimoramento facial com 7 modelos, usando 3 modelos diferentes para...

Kotaemon:简单部署的开源多模态文档问答工具-首席AI分享圈

Kotaemon: uma ferramenta de questionário de documentos multimodais de código aberto simples de implantar

Introdução geral O Kotaemon é uma ferramenta de perguntas e respostas de documentos de código aberto projetada para fornecer aos usuários finais e desenvolvedores recursos de perguntas e respostas com base no Retrieval Augmented Generation (RAG). Desenvolvido pela Cinnamon, o projeto oferece suporte a vários provedores de API LLM (por exemplo, OpenAI, AzureOpenAI, Cohere etc.), bem como a...

HivisionIDPhotos:开源智能AI证件照制作工具-首席AI分享圈

HivisionIDPhotos: ferramenta de código aberto para a criação de IDs com fotos inteligentes com IA

Introdução abrangente O HivisionIDPhotos é uma ferramenta de produção de fotos de documentos com IA leve e de código aberto, capaz de identificar de forma inteligente a cena da foto do usuário e a codificação, para gerar uma foto de documento padrão de acordo com uma variedade de especificações. A ferramenta suporta cor e tamanho de fundo personalizados e, no futuro, também introduzirá a função de beleza e mudança inteligente de trajes formais. Com...

Marker:快速将PDF转换为Markdown的开源工具-首席AI分享圈

Marker: converta rapidamente PDF em ferramentas de código aberto Markdown

Introdução geral O Marker é uma ferramenta de processamento de documentos baseada em aprendizagem profunda, projetada para converter arquivos PDF para o formato Markdown com rapidez e precisão. Ele oferece suporte a uma ampla variedade de tipos de documentos e é especialmente otimizado para a conversão de livros e artigos científicos. O Marker é capaz de remover conteúdo redundante, como cabeçalhos e rodapés, formatar tabelas e...

SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人-首席AI分享圈

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Introdução geral O SadTalker é uma ferramenta de código aberto que combina fotos de retratos únicos e arquivos de áudio para criar vídeos realistas de cabeças falantes para uma ampla variedade de cenários, como mensagens personalizadas, conteúdo educacional e muito mais. O uso revolucionário de tecnologias de modelagem 3D, como ExpNet e PoseVAE, é excelente para capturar as facetas sutis...

pt_BRPortuguês do Brasil