Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala
Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o Ope...
Libra: um cliente para gerar inteligências de IA locais com diálogo (teste interno)
Introdução geral O Libra é uma ferramenta inovadora da Greenbit.ai cuja função principal é gerar inteligências de IA que são executadas localmente por meio do diálogo em linguagem natural. Chamado de "Vibe Agent", ele permite que os usuários descrevam suas necessidades em termos simples e criem rapidamente...
VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas
Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a compreensão humana do vídeo...
SuperCoder: assistente de código inteligente para execução em terminal de linha de comando
Introdução geral O SuperCoder é uma ferramenta inteligente que é executada no terminal e foi projetada para programadores. Ela usa a tecnologia de IA para ajudar os usuários a pesquisar códigos, visualizar a estrutura do projeto, editar arquivos e corrigir bugs.
Emigo: um assistente para tarefas de programação complexas usando IA no Emacs
Introdução geral O Emigo é um assistente de programação de IA de código aberto projetado para o Emacs, desenvolvido por MatthewZMD no GitHub. Ele ajuda os programadores a concluir a análise de código no Emacs, integrando um modelo de linguagem em grande escala (LLM)...
SegAnyMo: uma ferramenta de código aberto para segmentar automaticamente objetos móveis arbitrários em vídeos
Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou...
ChatGPT gera palavras-chave de comparação de estilo duplo de retrato
Palavra de ordem Um retrato dramático de Hayao Miyazaki, em close-up frontal. A composição é perfeitamente simbió...
Quando o Gemini 2.5 encontra o Three.js, a solução para ensinar animação de demonstração está completa!
O Three.js é uma ferramenta que permite que as páginas da Web exibam imagens "tridimensionais". Pense assim: ele fornece um conjunto de ferramentas que permite aos desenvolvedores desenhar formas 3D em páginas da Web, como cubos, esferas e assim por diante. Ele também permite que essas formas 3D se movam, de modo que...
GeminiCode: um assistente de programação de IA baseado no Gemini 2.5 em execução em terminais
Introdução geral O GeminiCode é um assistente de programação de IA executado em um terminal, desenvolvido por desenvolvedores em seu tempo livre nos fins de semana. Ele é baseado no modelo Gemini 2.5 Pro do Google e pode ler e modificar arquivos no diretório atual do seu computador. Esse...
GenXD: estrutura de código aberto para gerar vídeos de cenas arbitrárias em 3D e 4D
Introdução geral O GenXD é um projeto de código aberto, desenvolvido pela Universidade Nacional de Cingapura (NUS) e pela equipe da Microsoft. Ele se concentra na geração de cenas arbitrárias em 3D e 4D, para resolver a geração de 3D e 4D no mundo real devido à insuficiência de dados e à complexidade do design do modelo causada pelo problema. O projeto foi desenvolvido pela ...