Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 992 artigos

Tags: ai projetos de código aberto Página 48

Cloudflare Serverless Registry: um registro de contêineres sem servidor baseado em Cloudflare Workers

Introdução geral O Cloudflare Serverless Registry é um registro de contêineres sem servidor baseado no Cloudflare Workers e no armazenamento R2. Ele suporta push e pull de imagens e fornece autenticação JWT baseada em nome de usuário, senha e chave pública. O projeto é fácil de implantar e compatível com as operações do Docker...

AIHawk: assistente inteligente de busca de emprego, colocação automatizada de currículos (somente em inglês)

Introdução geral O Auto_Jobs_Applier_AIHawk é uma ferramenta para automatizar a busca de empregos usando tecnologia de inteligência artificial. Ela ajuda os usuários a enviar automaticamente um grande número de currículos em um curto período de tempo e personalizá-los de acordo com suas informações pessoais e intenções de busca de emprego. O objetivo da ferramenta é aumentar a eficiência da busca de emprego e reduzir o envio manual...

simple-one-api: integração com um clique de uma variedade de APIs de modelos grandes e gratuitos, interface OpenAI externa unificada

Introdução abrangente simple-one-api é um projeto de código aberto desenvolvido para simplificar a integração de várias APIs de modelo grande. Ele é compatível com modelos compatíveis com interfaces OpenAI, como Chifan Big Model Platform, Xunfei Starfire Big Model, Tencent Hybrid, MiniMax e Deep-Seek. O projeto requer apenas um arquivo executável, uma configuração...

Voice Changer: Um trocador de voz em tempo real para fazer seus personagens de anime favoritos cantarem!

Introdução geral O Voice Changer é uma ferramenta de transformação de voz em tempo real e de código aberto que oferece suporte a uma ampla variedade de modelos de fala de IA, como MMVC, so-vits-svc, RVC, DDSP-SVC e Beatrice. A ferramenta é compatível com várias plataformas, incluindo Windows, Mac, Linux e Google Colab, e permite que os usuários ...

VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度-首席AI分享圈

VoAPI: sistema de gerenciamento de interface de encaminhamento de modelo de IA de alto valor, o site oficial oferece cota de API gratuita diariamente

Introdução abrangente O VoAPI é um novo sistema de gerenciamento e distribuição de interface de modelo de IA de alto perfil e alto desempenho, usado principalmente para canais de distribuição e gerenciamento interno pessoal ou empresarial. Desenvolvido com base na NewAPI, o sistema oferece módulos funcionais avançados e interface de usuário otimizada, com o objetivo de aprimorar a experiência do usuário e a eficiência operacional...

MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音-首席AI分享圈

MockingBird: clonagem rápida de voz e treinamento de modelos, conversão de texto em fala com base no xtts v2

Introdução abrangente O MockingBird é um projeto de código aberto que visa à clonagem rápida de fala e à conversão de texto em fala por meio da tecnologia de IA. Os usuários só precisam fornecer 5 segundos de amostras de voz para gerar qualquer conteúdo de voz. O projeto é compatível com uma variedade de conjuntos de dados chineses e funciona bem em sistemas Windows e Linux ...

Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包-首席AI分享圈

Clone Voice: ferramenta de clonagem de voz sem amostras em vários idiomas baseada em xtts_v2 para Windows com instalador de um clique.

Descrição geral O Clone Voice é uma ferramenta de clonagem de som de código aberto que fornece uma interface baseada na Web que permite aos usuários clonar vozes usando qualquer som ou gravação de voz pessoal. A ferramenta é simples de usar e pode ser executada localmente com um aplicativo pré-compilado, mesmo sem uma GPU NVIDIA. Ela é compatível com...

StreamingT2V:从文本到长视频的动态且可扩展的生成技术-首席AI分享圈

StreamingT2V: geração dinâmica e dimensionável de texto para vídeo longo

Introdução geral O StreamingT2V é um projeto público desenvolvido pela equipe de pesquisa de IA da Picsart, focado na geração de vídeos longos coerentes, dinâmicos e dimensionáveis com base em descrições textuais. Essa tecnologia usa uma abordagem autorregressiva avançada que garante a consistência temporal do vídeo, corresponde de perto ao texto da descrição e mantém a alta qualidade dos quadros...

Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器-首席AI分享圈

Text2Video-Zero: gerador de amostras zero de texto para vídeo lançado pela equipe de pesquisa de IA da Picsart

Descrição geral O Text2Video-Zero é uma implementação oficial de um gerador de texto para vídeo com amostra zero para o GitHub, desenvolvido pela equipe de pesquisa de IA da Picsart. O projeto oferece uma nova maneira de usar dicas de texto para gerar vídeos com consistência temporal e dicas de texto seguidas corretamente. A equipe também lançou...

Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声-首席AI分享圈

WebUI de conversão de voz com base em recuperação: uma estrutura para conversão de voz com base em recuperação e simulação de vozes cantadas na vida real

A WebUI de conversão de voz baseada em recuperação de introdução abrangente é uma estrutura de conversão de voz baseada em VITS simples e fácil de usar que permite a conversão de voz entre quaisquer alto-falantes, incluindo capas de músicas e alteração de voz em tempo real. Ela apresenta baixa latência, excelente efeito de mudança de voz, pequena quantidade de treinamento de dados...

VoiceCraft:开源零样本语音克隆与文本转语音工具-首席AI分享圈

VoiceCraft: ferramenta de clonagem de fala e conversão de texto em fala de código aberto com amostra zero

Introdução abrangente O VoiceCraft é uma ferramenta de edição de fala de código aberto e de síntese de fala de amostra zero baseada no modelo de linguagem Neural Codec. Ele emprega um método inovador de geração de sequência codificada que permite operações de inserção, exclusão e substituição em sequências de fala existentes para gerar uma fala editada natural e coerente. Ao mesmo tempo, ...

edge-tts: módulo Python de conversão de texto em fala | Serviço gratuito de conversão de texto em fala

Descrição geral edge-tts é um módulo Python de código aberto que permite aos usuários usar o serviço de conversão de texto em fala on-line do Microsoft Edge no código Python sem a necessidade de um navegador Microsoft Edge, sistema operacional Windows ou chave de API. Fornece o uso direto do edge-tts a partir da linha de comando e do edge-...

CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式-首席AI分享圈

CoAI.Dev (Chat Nio): solução completa de B/C para aplicativos de agregação de IA com faturamento flexível e suporte ao modelo de plano de assinatura

Introdução geral O CoAI.Dev (antigo Chat Nio) é uma plataforma de bate-papo que integra vários modelos de IA e oferece suporte a streaming distribuído, geração de imagens, sincronização e compartilhamento de conversas entre dispositivos. Ele implementa um sistema de assinatura e faturamento de token, serviço de trânsito de chaves e suporte a vários modelos, além de incluir pesquisa conectada e IA...

ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI-首席AI分享圈

ChatOllama: interface de usuário nativa de aplicativo de bate-papo em tempo real baseada em Nuxt 3 e Ollama

Introdução abrangente O ChatOllama é um projeto de aplicativo de bate-papo on-line de código aberto baseado em um modelo de linguagem em grande escala (LLM), com suporte a vários modelos de linguagem e gerenciamento de base de conhecimento. Os usuários podem usar a plataforma para gerenciamento de modelos (exibição de lista, download, exclusão), bate-papo com modelos e outras funções. O projeto usa a estrutura Nuxt 3 ...

MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描-首席AI分享圈

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

Introdução abrangente O MinerU é uma ferramenta de extração de dados de código aberto desenvolvida pela equipe do OpenDataLab no Laboratório de Inteligência Artificial de Xangai, com foco na extração eficiente de conteúdo de documentos PDF complexos, páginas da Web e eBooks. Ele pode converter documentos PDF multimodais que contenham imagens, fórmulas, tabelas e outros elementos em m...

DCT-Net:照片和视频转绘为动漫风格化的开源工具-首席AI分享圈

DCT-Net: uma ferramenta de código aberto para transpainting de fotos e vídeos para estilização de anime

Introdução geral O DCT-Net é um projeto de código aberto desenvolvido pela DAMO Academy e pelo Instituto de Tecnologia da Computação Wang Xuan, da Universidade de Pequim, com o objetivo de obter uma transformação estilizada de imagens em anime. O projeto utiliza técnicas de aprendizagem profunda por meio da tradução calibrada por domínio (DCT) para...

Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)-首席AI分享圈

Diffusers Image Outpaint: ferramenta superpotente de código aberto de extensão de imagem AI, pintura de imagem (pintura de imagem)

Introdução geral O Diffusers Image Outpaint é uma poderosa ferramenta de expansão de imagem de IA criada pelo membro da comunidade Hugging Face, fffiloni. A ferramenta usa técnicas avançadas de modelagem de difusão para expandir perfeitamente uma imagem (pintar as bordas da imagem) para produzir uma imagem de alta qualidade...

Tap4 AI WebUI:开源轻量级AI工具导航项目-首席AI分享圈

Tap4 AI WebUI: projeto de navegação de ferramenta de IA leve e de código aberto

Introdução abrangente O Tap4 AI WebUI é um projeto de site de navegação de ferramentas de IA leve e de código aberto, projetado para ajudar os usuários a criar facilmente seu próprio catálogo de ferramentas de IA. O projeto usa a pilha de tecnologia Next.js e Supabase, suporte para otimização de SEO em vários idiomas, para fornecer funções de filtragem de classificação de ferramentas de IA, pesquisa e exibição detalhada...

CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版-首席AI分享圈

CodeFormer: restauração facial de imagens e vídeos, restauração de fotos antigas, oferece versão de implantação com um clique

CodeFormer Introdução geral O CodeFormer é uma base de código para reparo robusto de faces cegas, desenvolvida por uma equipe de pesquisadores do S-Lab da Universidade Tecnológica de Nanyang e apresentada no NeurIPS 2022. O projeto utiliza a tecnologia Codebook Lookup Transformer, que tem como objetivo aprimorar...

pt_BRPortuguês do Brasil