Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 764 artigos

Tags: ai projetos de código aberto Página 16

SynthLight: renderização de luz natural de imagens de retrato (não lançado) - Chief AI Sharing Circle

SynthLight: renderização de luz natural de imagens de retrato (não publicado)

Descrição geral O SynthLight é uma ferramenta de reiluminação de retratos baseada em um modelo de difusão. Ela aprende a renderizar novamente imagens sintéticas de rostos para obter ajustes de efeitos de iluminação em fotos de retratos reais. A ferramenta usa um mecanismo de renderização física para gerar conjuntos de dados que simulam transformações de iluminação sob diferentes condições de iluminação.

1-2-1-MNVTON: Imagens e personagens eficientes em vídeos para experimentar roupas virtualmente (a ser aberto) - Chief AI Sharing Circle

1-2-1-MNVTON: Imagens eficientes, experimentação virtual de roupas por pessoas em vídeos (a serem abertos)

Introdução geral 1-2-1 - O MNVTON é um projeto de código aberto baseado no GitHub que tem como objetivo obter um teste virtual eficiente por meio da tecnologia "Modality-specific Normalization for Virtual Try-On" (MNVTON). O projeto resolve o problema do alto custo computacional das técnicas tradicionais de teste virtual, fornecendo ...

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução geral O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido por thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, e planeja oferecer suporte a francês, japonês, coreano...

Zerox: PDF, DOCX, conversão de imagem para Markdown, modelo visual de alta precisão OCR-Chief AI Sharing Circle

Zerox: PDF, DOCX, conversão de imagem para Markdown, OCR de alta precisão de modelo visual

Introdução abrangente O Zerox é um projeto de código aberto desenvolvido para converter PDF, DOCX, imagens e outros documentos em formato Markdown por meio de modelos visuais. O projeto foi desenvolvido pela equipe getomni-ai e oferece uma solução simples e eficiente de OCR (reconhecimento óptico de caracteres). O Zerox é compatível com as linguagens de programação Node e Python, ...

Charla: uma ferramenta minimalista de bate-papo com IA baseada em endpoint com integração nativa do back-end do Ollama - Chief AI Sharing Circle

Charla: uma ferramenta minimalista de bate-papo com IA baseada em endpoint com integração nativa ao back-end do Ollama

Descrição geral O Charla é um aplicativo de bate-papo baseado em endpoint projetado para dialogar com modelos de idioma nativo. O aplicativo se integra ao back-end do Ollama, oferece suporte ao diálogo com reconhecimento de contexto e salva as sessões de bate-papo como arquivos Markdown. Os usuários podem iniciar e ativar o aplicativo por meio de operações simples de linha de comando...

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, o índice de gráfico de entidades lembra blocos de texto relevantes - Chief AI Sharing Circle

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Introdução abrangente O MiniRAG é uma estrutura extremamente simples do Retrieval Augmented Generation (RAG) que visa permitir um bom desempenho do RAG mesmo para modelos pequenos por meio de indexação de gráficos heterogêneos e recuperação leve com aprimoramento de topologia. Ele foi desenvolvido pelo Laboratório de Ciência de Dados da Universidade de Hong Kong (HKUDS) e se concentra na solução do Modelo de Linguagem Pequena (SLM)...

Omni-RGPT: um grande modelo multimodal para compreensão em nível de região de imagens e vídeos para aprimorar a análise de conteúdo visual - Chief AI Sharing Circle

Omni-RGPT: um grande modelo multimodal para compreensão em nível de região de imagens e vídeos para aprimorar a análise de conteúdo visual

Introdução abrangente O Omni-RGPT é um modelo multimodal de linguagem ampla projetado para permitir a compreensão de imagens e vídeos em nível de região. Ao introduzir a técnica Token Mark, o Omni-RGPT é capaz de destacar regiões-alvo no espaço de recursos visuais e incorporar esses tokens diretamente por meio de dicas de região (por exemplo, caixas ou máscaras), ao mesmo tempo em que...

Bailing: um assistente de diálogo de voz de código aberto de baixa latência que permite facilmente conversas e comunicações naturais - Chief AI Sharing Circle

Bailing: um assistente de diálogo de voz de código aberto de baixa latência para conversação e comunicação naturais

Introdução abrangente O Bailing (Bailing) é um assistente de diálogo de voz de código aberto projetado para se envolver em conversas naturais com os usuários por meio da fala. O projeto combina tecnologias de reconhecimento de fala (ASR), detecção de atividade de voz (VAD), modelagem de linguagem ampla (LLM) e síntese de fala (TTS) para obter uma fala semelhante à do GPT-4o...

WikiChat: uma ferramenta de bate-papo para recuperar conhecimento usando dados da Wikipédia - Chief AI Sharing Circle

WikiChat: uma ferramenta de bate-papo para recuperar conhecimento usando dados da Wikipédia

Introdução geral O WikiChat é um chatbot experimental desenvolvido na Universidade de Stanford com o objetivo de aprimorar a factualidade de modelos de linguagem grandes, recuperando dados da Wikipédia. Grandes modelos de linguagem (como o ChatGPT e o GPT-4) tendem a cometer erros ao lidar com informações atualizadas ou tópicos menos populares.

OpenAI Edge TTS: uma API gratuita de conversão de texto em fala usando o Edge TTS, compatível com o formato OpenAI - Chief AI Sharing Circle

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade.

AIEvo: uma estrutura eficiente para a criação de aplicativos colaborativos de inteligência múltipla - Chief AI Sharing Circle

AIEvo: uma estrutura eficiente para a criação de aplicativos colaborativos multiinteligentes

Introdução geral AIEvo é a estrutura multiagente de código aberto do Ant Group, projetada para criar aplicativos multiagentes com eficiência. A estrutura segue rigorosamente o gráfico de tarefas SOP para melhorar a taxa de sucesso da execução de tarefas complexas e, por meio de mecanismos de feedback e monitoramento, garante alta flexibilidade e escalabilidade.

PPTAgent: geração e avaliação automáticas de apresentações PPT, documento para PPT - Chief AI Sharing Circle

PPTAgent: geração e avaliação automáticas de apresentações PPT, documentos para PPTs

Introdução geral O PPTAgent é um sistema inovador projetado para gerar automaticamente apresentações a partir de documentos. O sistema se baseia na abordagem humana para criar apresentações, usando um processo de duas etapas para garantir a qualidade do conteúdo e o impacto visual. Além disso, o PPTAgent apresenta o PPTEval, uma estrutura de avaliação abrangente para gerar apresentações a partir de documentos...

FlowiseAI: criação de uma interface de arrastar e soltar nós para aplicativos LLM personalizados - Chief AI Sharing Circle

FlowiseAI: criação de uma interface de arrastar e soltar nós para aplicativos LLM personalizados

Introdução geral O FlowiseAI é uma ferramenta de código aberto e de baixo código projetada para ajudar os desenvolvedores a criar aplicativos LLM (Large Language Model) personalizados e agentes de IA. Com uma interface simples de arrastar e soltar, os usuários podem criar e iterar rapidamente aplicativos LLM, tornando mais eficiente o processo desde o teste até a produção.O FlowiseAI fornece...

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper - Chief AI Sharing Circle

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper

Introdução geral O RealtimeSTT é uma biblioteca de conversão de fala em texto eficiente, de baixa latência e em tempo real, com detecção avançada de atividade de fala e ativação de palavras de alerta. Ela foi desenvolvida por Kolja Beigel para dar suporte a aplicativos que exigem conversão rápida e precisa de fala para texto. Quer você seja um assistente de voz ou precise encontrar...

SemHash: implementação rápida de desduplicação de texto semântico para melhorar a eficiência da limpeza de dados

Introdução geral O SemHash é uma ferramenta leve e flexível para desduplicação de conjuntos de dados por similaridade semântica. Ele combina a rápida geração de incorporação do Model2Vec com a eficiente pesquisa de similaridade ANN (Approximate Nearest Neighbour) do Vicinity.O SemHash é compatível com a desduplicação de um único conjunto de dados (por exemplo, limpeza de...

Cognita: uma estrutura de código aberto para criar aplicativos RAG modulares e testar rapidamente diversas estratégias RAG - Chief AI Sharing Circle

Cognita: uma estrutura de código aberto para criar aplicativos RAG modulares e testar rapidamente diversas estratégias RAG

Introdução abrangente A Cognita é uma estrutura de código aberto desenvolvida pela TrueFoundry para simplificar o desenvolvimento de aplicativos baseados em RAG (Retrieval-Augmented Generation). A estrutura oferece uma solução estruturada e modular que facilita a transferência da tecnologia RAG do estágio de protótipo para a produção...

BotSharp: plataforma de desenvolvimento e gerenciamento de IA de corpo de inteligência múltipla baseada em .NET - Chief AI Sharing Circle

BotSharp: uma plataforma de desenvolvimento e gerenciamento de inteligência múltipla de IA baseada em .NET

Introdução abrangente O BotSharp é um projeto de código aberto baseado no .NET Core dedicado a fornecer uma ferramenta abrangente de criação de plataforma de chatbot de IA. Ele usa a programação C#, oferece suporte à operação entre plataformas e tem como objetivo simplificar a aplicação de algoritmos de aprendizado de máquina, permitindo que os desenvolvedores de nível empresarial integrem com eficiência a IA aos sistemas de negócios...

Weebo: um chatbot de voz em tempo real que oferece uma experiência de diálogo em linguagem natural

Introdução geral O Weebo é um chatbot de voz em tempo real de código aberto que utiliza o Whisper Small para reconhecimento de fala, o Llama 3.2 para geração de linguagem natural e o Kokoro-82M para síntese de fala. Desenvolvido por Amanvir Parhar, o projeto tem como objetivo fornecer um dispositivo nativo capaz de...

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil