Aprendizagem pessoal com IA
e orientação prática
Sapo pintado em alumínio
Total de 767 artigos

Tags: ai projetos de código aberto Página 20

Xiaozhi AI Chatbot: crie seu companheiro de bate-papo com IA, alcance facilmente o diálogo por voz e a interação inteligente - Círculo de compartilhamento de IA do chefe

Xiaozhi AI Chatbot: crie seu companheiro de bate-papo com IA, diálogo de voz fácil e interação inteligente

Introdução abrangente O Xiaozhi AI Chatbot é um projeto de código aberto baseado na placa de desenvolvimento ESP32, projetado para ajudar os usuários a criar seu próprio companheiro de bate-papo com IA. O projeto foi desenvolvido pela Shrimp e é usado principalmente para fins didáticos para ajudar mais pessoas a começar a desenvolver hardware de IA e entender como aplicar o modelo de linguagem grande a dispositivos de hardware reais...

OpenAI Realtime API Next.js: um modelo Next.js para criar aplicativos de IA de diálogo de voz em tempo real - Chief AI Sharing Circle

OpenAI Realtime API Next.js: um modelo Next.js para criar aplicativos de IA de diálogo de voz em tempo real

Introdução abrangente O OpenAI Realtime API Next.js é um projeto de código aberto baseado na estrutura Next.js, projetado para ajudar os desenvolvedores a criar rapidamente aplicativos de IA de voz em tempo real. O projeto integra a API em tempo real da OpenAI e a tecnologia WebRTC para fornecer componentes modernos de UI e chamadas de ferramentas. Ao usar esse ...

Kokoro: modelos eficientes de síntese de fala para gerar uma fala natural e suave - Chief AI Sharing Circle

Kokoro: modelos eficientes de síntese de fala para gerar uma fala natural e suave

Introdução geral O Kokoro 82M é um modelo eficiente de síntese de fala fornecido pela Hugging Face, projetado para gerar fala de alta qualidade com menos parâmetros e dados. O modelo tem 82 milhões de parâmetros, é distribuído sob a licença Apache 2.0, suporta uma ampla variedade de pacotes de voz (Voicepacks) e pode gerar...

WrenAI: assistente de IA de análise de dados de conversação com acesso direto a respostas, consultas SQL e relatórios de análise - Círculo de compartilhamento de IA principal

WrenAI: assistente de IA de análise de dados de conversação com acesso direto a respostas, consultas SQL e relatórios de análise

Introdução geral O WrenAI é um assistente de IA SQL de código aberto projetado especificamente para ajudar equipes de dados, equipes de produtos e equipes de negócios a obter insights de dados por meio de conversas em linguagem natural. Ele é capaz de converter linguagem natural em consultas SQL, gerar gráficos, planilhas e relatórios e oferecer suporte a interações multilíngues. O ...

Activepieces: automação de fluxo de trabalho de IA, ferramentas de agendamento de tarefas para usuários não técnicos, alternativas de código aberto ao Zapier - Chief AI Sharing Circle

Activepieces: automação de fluxo de trabalho com IA, ferramenta de agendamento de tarefas para usuários não técnicos, substituto de código aberto do Zapier

Introdução geral O Activepieces é uma plataforma de fluxo de trabalho de automação de código aberto, tudo em um, focada em fornecer soluções de automação intuitivas e avançadas para empresas e usuários individuais. Desenvolvida em TypeScript, a plataforma é extremamente dimensionável e oferece suporte a mais de 200 serviços integrados. Ela apresenta a capacidade de trazer IA...

SHMT: modelo hierárquico autossupervisionado de transferência de maquiagem, maquiagem virtual, migração de maquiagem para novos retratos - Chief AI Sharing Circle

SHMT: modelo hierárquico autossupervisionado de transferência de maquiagem, maquiagem virtual, migração de maquiagem para novos retratos

O Synthesis SHMT (Self-supervised Hierarchical Makeup Transfer) é um projeto de transferência de maquiagem hierárquica autossupervisionada baseado em um modelo de difusão latente, com o objetivo de obter uma transferência de alta qualidade de efeitos de maquiagem por meio de métodos de aprendizagem não supervisionados. O projeto adota um paradigma de "desacoplamento e reconstrução", que não permite ...

VITA: Modelos de linguagem grande multimodal de código aberto para interação visual e de fala em tempo real - Chief AI Sharing Circle

VITA: Modelos de linguagem multimodal de grande porte de código aberto para interação visual e de fala em tempo real

Introdução geral O VITA é um projeto líder de modelagem de linguagem grande multimodal interativa de código aberto, pioneiro na capacidade de obter uma verdadeira interação multimodal completa. O projeto lançou o VITA-1.0 em agosto de 2024, sendo pioneiro no primeiro modelo de linguagem grande totalmente modal e interativo de código aberto.

Trend Finder: rastreamento de tendências de mídia social, tópicos importantes e novos artigos em tempo real para ajudar nas decisões de marketing - Chief AI Sharing Circle

Trend Finder: rastreamento de tendências de mídia social, tópicos de tendências e novos artigos em tempo real para decisões de marketing.

Introdução geral O Trend Finder é uma ferramenta poderosa criada para ajudar os usuários a rastrear tópicos e tendências nas mídias sociais em tempo real. Ao coletar e analisar publicações dos principais influenciadores, o Trend Finder pode enviar notificações oportunas do Slack quando novas tendências ou lançamentos de produtos são detectados. Essa ferramenta é extremamente...

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução abrangente O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo em linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo o modelo de reconhecimento de fala Whisper e uma variedade de back-ends de tradução (como o Dee...

TransRouter: uma ferramenta de conversão de áudio em tempo real para tradução de chinês e inglês com base no modelo multimodal Gemini - Chief AI Sharing Circle

TransRouter: uma ferramenta de conversão de áudio em tempo real para tradução de chinês para inglês com base no modelo multimodal Gemini

O TransRouter é uma ferramenta de tradução de voz em tempo real baseada no modelo Gemini do Google, projetada para tradução de voz em tempo real entre inglês e chinês. Ele pode ser perfeitamente integrado ao software de videoconferência, como o Zoom, para oferecer suporte à tradução em tempo real para comunicação entre idiomas.

LatentSync: permitindo a sincronização labial de precisão orientada por áudio para gerar vídeos de troca de boca com IA - Chief AI Sharing Circle

LatentSync: possibilitando a sincronização labial precisa e orientada por áudio para a geração de vídeos com troca de boca por IA

Introdução abrangente O LatentSync é uma estrutura inovadora de modelagem de difusão de potencial condicional de áudio de código aberto da ByteDance, projetada especificamente para permitir a sincronização labial de vídeo de alta qualidade. Diferentemente das abordagens tradicionais, o LatentSync usa uma abordagem de ponta a ponta que elimina a necessidade de representações de ações intermediárias para gerar diretamente...

opensource_notebooklm: implementação de código aberto do NotebookLM com base no Deepseek-V3 e no PlayHT TTS - Chief AI Sharing Circle

opensource_notebooklm: implementação de código aberto do NotebookLM com base no Deepseek-V3 e no PlayHT TTS

Introdução geral O NotebookLM de código aberto é um projeto inovador de IA que combina os recursos de compreensão de linguagem do Deepseek-V3 com a tecnologia de síntese de fala do PlayHT, com o objetivo de criar um sistema inteligente de diálogo para anotações. Desenvolvido pela equipe do Build Fast with AI, o projeto transforma o conteúdo de texto em...

Open Deep Research: geração de relatórios de pesquisa de IA com base em conteúdo de pesquisa na Web - Chief AI Sharing Circle

Open Deep Research: geração de pesquisa de IA com base em conteúdo de pesquisa na Web

Introdução abrangente O Open Deep Research é uma ferramenta de geração de relatórios de pesquisa orientada por IA de código aberto que serve como uma alternativa de código aberto aos recursos de pesquisa profunda do Google Gemini. Desenvolvido em TypeScript e com base na estrutura Next.js 15, o projeto integra a API de pesquisa do Azure Bing e o Google Gemini ...

Visão é tudo o que você precisa: Criando um sistema inteligente de recuperação de documentos usando modelos de linguagem visual (Vision RAG) - Chief AI Sharing Circle

Visão é tudo o que você precisa: Criação de um sistema inteligente de recuperação de documentos usando modelos de linguagem visual (Vision RAG)

Introdução abrangente O Vision-is-all-you-need é um projeto inovador de demonstração do sistema visual RAG (Retrieval Augmented Generation) que abre novos caminhos na aplicação da Modelagem de Linguagem Visual (VLM) ao domínio de processamento de documentos. Diferentemente dos métodos tradicionais de fragmentação de texto, o sistema usa modelos de linguagem visual diretamente para processar as páginas de um arquivo PDF...

Scira (MiniPerplx): um projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica, etc. -Chief AI Sharing Circle

Scira (MiniPerplx): projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica etc.

Introdução geral O MiniPerplx (renomeado Scira) é um mecanismo de pesquisa com IA de design minimalista que integra vários recursos úteis para fornecer aos usuários uma gama completa de serviços de recuperação de informações. O projeto usa uma pilha de tecnologia moderna, incluindo Next.js, Tailwind CSS e Vercel AI SDK, e...

Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados de gráficos de conhecimento externos em tempo real - Chief AI Sharing Circle

Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados externos de gráficos de conhecimento em tempo real

Introdução abrangente O Diffbot LLM Reasoning Server é um sistema inovador de modelagem de linguagem em larga escala com otimizações e aprimoramentos especiais baseados na arquitetura do modelo LLama. O recurso mais importante do projeto é a combinação das tecnologias Knowledge Graph e Retrieval Augmented Generation (RAG) em tempo real, criando um sistema de raciocínio único...

JupyterLab Magic Wand: usando assistentes de IA no JupyterLab para aumentar a produtividade - Chief AI Sharing Circle

JupyterLab Magic Wand: usando assistentes de IA no JupyterLab para aumentar a produtividade

Introdução geral O JupyterLab Magic Wand é uma extensão experimental do JupyterLab projetada para fornecer notebooks do JupyterLab com funcionalidade de assistente de IA incorporada. A extensão foi desenvolvida pela Zsailer para aumentar a produtividade de cientistas de dados e pesquisadores que trabalham no JupyterLab. Ao instalar o Jupyte...

LuminaBrush: usando ferramentas de pintura inteligente para adicionar efeitos de iluminação às imagens - Chief AI Sharing Circle

LuminaBrush: adicionando iluminação a imagens com ferramentas de pintura inteligentes

O LuminaBrush é uma ferramenta inovadora e interativa de edição de imagens para efeitos de iluminação, com tecnologia de inteligência artificial. O projeto usa uma estrutura de dois estágios para processar imagens: o primeiro estágio transforma a imagem de entrada em uma aparência "uniformemente iluminada", enquanto o segundo estágio gera efeitos de iluminação com base nas ações de rabiscos do usuário. Isso...

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil