Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 970 artigos

Tags: ai projetos de código aberto Página 36

CrewAI:多角色扮演协作智能框架,简化复杂任务-首席AI分享圈

CrewAI: uma estrutura de inteligência colaborativa para vários papéis para simplificar tarefas complexas

Introdução abrangente O CrewAI é uma estrutura avançada projetada para orquestrar a colaboração entre agentes de IA autônomos e de interpretação de papéis. Ao facilitar a inteligência colaborativa, o CrewAI permite que os agentes trabalhem juntos sem problemas para resolver tarefas complexas. Seja para criar plataformas de assistentes inteligentes, automatizar equipes de atendimento ao cliente ou equipes de pesquisa com vários agentes, o Crew...

Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件-首席AI分享圈

Artab: mostra pinturas mundialmente famosas em uma nova guia aberta no navegador, plug-in do Chrome

Descrição geral O Artab é uma extensão de navegador projetada para exibir as maiores obras de arte do mundo sempre que você abrir uma nova guia. A extensão está disponível para os navegadores Chrome, Edge e Firefox. Com o Artab, os usuários podem desfrutar de uma ampla variedade de obras de arte clássicas em sua navegação diária, aprimorando...

Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型-首席AI分享圈

Leffa: modelo de alta fidelidade, teste virtual e ajuste de pose de personagens, modelo de geração de imagens de personagens controlados com código aberto

Introdução abrangente O Leffa é uma estrutura unificada para gerar imagens de personagens controláveis, permitindo a manipulação precisa da aparência do personagem (por exemplo, ajuste virtual) e da pose (por exemplo, transferência de pose). A estrutura reduz significativamente a distorção de detalhes refinados, direcionando a consulta de destino para focar na chave de referência correta na camada de atenção, ao mesmo tempo em que preserva...

MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具-首席AI分享圈

MMAudio: geração de efeitos sonoros e trilhas sonoras sincronizadas para filmagens de vídeo, ferramenta de treinamento conjunto multimodal de vídeo para áudio

Introdução geral O MMAudio é um projeto de código aberto que visa a gerar áudio sincronizado de alta qualidade por meio de treinamento multimodal conjunto. Desenvolvido por Ho Kei Cheng e outros na Universidade Chinesa de Hong Kong, a principal função do projeto é gerar áudio sincronizado com base na entrada de vídeo e/ou texto.

H2O GPT:灵活配置的本地AI对话与文档处理工具-首席AI分享圈

H2O GPT: configuração flexível de ferramentas nativas de diálogo e processamento de documentos de IA

Introdução geral O H2O GPT é um projeto de código aberto que tem como objetivo fornecer recursos privatizados de bate-papo e processamento de documentos. O projeto é baseado na licença Apache 2.0 e oferece suporte a vários modelos de GPT, incluindo LLaMa2, Mistral, Falcon e assim por diante. Os usuários podem usar o H2O GPT para obter documentos locais (como PDF, E...

OpenChat:快速集成多数据源的自定义聊天机器人-首席AI分享圈

OpenChat: Chatbots personalizados para integração rápida de várias fontes de dados

Introdução geral O OpenChat é um console de chatbot fácil de usar, projetado para simplificar o uso de LLMs (Large Language Models). Ao fornecer um processo de configuração em duas etapas, o OpenChat permite que os usuários criem e gerenciem facilmente vários chatbots personalizados. A plataforma é compatível com os modelos GPT-3 e GPT-4 e...

LocalGPT:在本地设备上与多文档对话,确保数据隐私-首席AI分享圈

LocalGPT: garanta a privacidade dos dados conversando com vários documentos em dispositivos locais

Introdução geral O LocalGPT é um projeto de código aberto criado para permitir que os usuários conversem com documentos em dispositivos locais, garantindo a privacidade dos dados. Ao usar vários modelos de código aberto, o LocalGPT pode processar e entender o conteúdo de documentos sem carregar dados na nuvem. O projeto é compatível com diversas plataformas, incluindo GPU, C...

PrivateGPT:完全本地化RAG处理流程的文档问答系统-首席AI分享圈

PrivateGPT: um sistema de perguntas e respostas de documentos com fluxo de processamento de RAG totalmente localizado

Introdução geral O PrivateGPT é um projeto de IA disponível para ambientes de produção que permite aos usuários fazer testes em documentos usando modelos de linguagem grandes (LLMs) sem uma conexão com a Internet. O projeto garante a privacidade dos dados para o 100%, e todos os dados são processados no ambiente de execução do usuário sem divulgação.Priv...

AutoGPT:工作流自动化与自主执行任务的智能体构建平台-首席AI分享圈

AutoGPT: plataforma inteligente de criação de corpos para automação do fluxo de trabalho e execução autônoma de tarefas

Descrição geral O AutoGPT é uma plataforma avançada projetada para ajudar os usuários a criar, implementar e gerenciar agentes de IA em execução contínua e automatizar fluxos de trabalho complexos. Desenvolvida pela Significant Gravitas, a plataforma oferece uma ampla gama de ferramentas e recursos que permitem que os usuários se concentrem em tarefas importantes sem se preocupar com questões técnicas...

DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置-首席AI分享圈

DragGAN: ferramenta interativa de edição de imagens, controle de apontar e clicar e arrastar e soltar a posição da imagem

Introdução geral O DragGAN é uma ferramenta interativa de edição de imagens baseada em Redes Adversárias Generativas (GAN). O projeto, apresentado na SIGGRAPH 2023 por Xingang Pan et al., tem como objetivo permitir que os usuários manipulem intuitivamente detalhes em imagens por meio de operações simples de apontar e clicar e arrastar e soltar.

Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。-首席AI分享圈

Qwen-Agent: uma estrutura baseada em Qwen para aplicativos de agentes inteligentes, incluindo chamadas de ferramentas, interpretadores de código, RAGs e extensões do Chrome.

Introdução abrangente O Qwen-Agent é uma estrutura de aplicativo de agente inteligente desenvolvida com base no Qwen 2.0 e superior, com recursos como acompanhamento de comandos, uso de ferramentas, planejamento e memória. A estrutura fornece uma variedade de aplicativos de amostra, como assistentes de navegador, intérpretes de código e assistentes personalizados para ajudar os desenvolvedores a construir rapidamente...

Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面-首席AI分享圈

Mini-Cover: um criador de capas on-line projetado para gerar capas personalizadas para blogs, vídeos curtos, mídias sociais e muito mais!

Introdução geral O Mini-Cover é uma ferramenta de geração de capas on-line de código aberto projetada para gerar capas personalizadas para plataformas como blogs, vídeos curtos e mídias sociais. Desenvolvida por JLinMr, a ferramenta tem como objetivo fornecer uma solução limpa e eficiente para ajudar os usuários a gerar rapidamente capas que atendam às suas necessidades.

MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式-首席AI分享圈

MarkItDown: Ferramenta de conversão inteligente de documentos da Microsoft, converte vários arquivos para o formato Markdown

Introdução geral O MarkItDown é uma ferramenta Python desenvolvida pela Microsoft e projetada para converter vários arquivos e documentos de escritório para o formato Markdown. A ferramenta oferece suporte a uma ampla variedade de tipos de arquivos, incluindo PDF, PowerPoint, Word, Excel, imagens (metadados EXIF e OCR), áudio (metadados EXIF e idioma...

Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手-首席AI分享圈

Claude Engineer: um assistente de diálogo corporal inteligente que gera e gerencia de forma autônoma ferramentas de IA usando o modelo Claude

Introdução geral O Claude Engineer é uma interface de linha de comando (CLI) interativa desenvolvida por Doriandarko que utiliza o modelo Claude-3.5-Sonnet da Anthropic para auxiliar nas tarefas de desenvolvimento de software. A estrutura permite que o Claude gere e gerencie suas próprias ferramentas, ampliando continuamente seus recursos por meio do diálogo...

Swarms:多智能体编排框架,企业级生产工具-首席AI分享圈

Swarms: estrutura de orquestração de inteligência múltipla, ferramenta de produção empresarial

Introdução geral O Swarms é uma estrutura de orquestração de vários agentes de nível empresarial pronta para produção, projetada para aumentar a produtividade dos negócios por meio do gerenciamento eficiente de agentes e do processamento de tarefas. Com suporte para vários modelos, vários sistemas de memória e criação de agentes personalizados, a estrutura oferece um design modular e recursos abrangentes de registro para garantir a...

Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频-首席AI分享圈

Sonic: Imagens de retrato com áudio geram vídeos de demonstração digital com expressões faciais vívidas

Introdução geral O Sonic é uma plataforma inovadora focada na percepção global de áudio, projetada para gerar animações de retratos vívidos impulsionadas pelo áudio. Desenvolvida por uma equipe de pesquisadores da Tencent e da Universidade de Zhejiang, a plataforma usa informações de áudio para controlar expressões faciais e movimentos da cabeça para gerar vídeos animados naturais e suaves.

Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现-首席AI分享圈

Ultravox: um macromodelo multimodal de áudio para diálogo de voz de ponta a ponta em tempo real, uma implementação de código aberto da interação de voz GPT-4o

Introdução abrangente O Ultravox é um inovador modelo multimodal de linguagem grande (LLM) projetado para processamento de fala em tempo real. Ao contrário dos sistemas tradicionais de reconhecimento de fala, o Ultravox elimina a necessidade de um estágio separado de reconhecimento de fala em áudio (ASR) e é capaz de converter diretamente o áudio em texto em um espaço de alta dimensão. Esse recurso torna...

infinite-zoom-stable-diffusion:生成无限缩放循环视频-首席AI分享圈

infinite-zoom-stable-diffusion: gerar vídeo em loop com zoom infinito

Introdução abrangente O Infinite Zoom Stable Diffusion (Difusão estável de zoom infinito) é um projeto de código aberto desenvolvido para criar vídeos com zoom infinito usando técnicas de difusão estável. O projeto oferece um notebook Colab fácil de usar, em que os usuários podem gerar um loop infinito de vídeo por meio de vários prompts. Projeto ...

Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip-首席AI分享圈

Easy-Wav2Lip: ferramenta para sincronização labial de vídeo de alta qualidade, otimizada para Wav2Lip

Introdução geral O Easy-Wav2Lip é uma ferramenta aprimorada baseada no Wav2Lip, projetada para simplificar o processo de sincronização labial de vídeo. A ferramenta oferece configuração e implementação mais simples, suporta o Google Colab e a instalação local. Ao otimizar o algoritmo, o Easy-Wav2Lip aumenta significativamente a velocidade de processamento e corrige...

pt_BRPortuguês do Brasil