Projeto de código aberto de IA

Total de 1020 artigos
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: simulação de inteligência múltipla de interações de mídia social de milhões de usuários para estudar fenômenos sociais complexos

Introdução geral O OASIS (Open Agent Social Interaction Simulations) é um simulador de mídia social de código aberto capaz de simular o comportamento de até um milhão de usuários. A plataforma combina um modelo de linguagem em grande escala com um modelo baseado em regras...
5 meses atrás
03K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly: uma plataforma de escrita de IA baseada na orquestração de processos em uma tela gratuita para geração automatizada de artigos

Introdução abrangente O Refly é um mecanismo de criação nativo de IA baseado em tela gratuito, projetado para ajudar os usuários a transformar ideias em conteúdo de alta qualidade por meio de diálogo multithread, integração de base de conhecimento, memória contextual e tecnologia de pesquisa inteligente. A plataforma abrange mais de 20 modelos de cenários profissionais, incluindo aprendizado...
6 meses atrás
03.2K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: habilite qualquer LLM para automatizar as operações do Android e do PC

Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. Atualmente, o projeto está em uma fase altamente experimental e oferece suporte a uma variedade de modelos, como...
8 meses atrás
02.6K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

light card: ferramenta geradora de cartões HTML5, crie belos cartões de conteúdo com ferramentas simples

Descrição geral O lightcard é uma ferramenta simples e elegante de geração de cartões projetada para ajudar os usuários a criar facilmente belos cartões de conteúdo. A ferramenta suporta conteúdo de texto personalizado, vários estilos de tema e códigos QR para tornar a criação mais fácil e divertida. Os usuários podem editar o título, o corpo e o autor...
8 meses atrás
02.9K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: a ferramenta clássica de código aberto para colorir fotos e vídeos em preto e branco usando técnicas de IA

Introdução abrangente O DeOldify é um projeto de código aberto baseado na tecnologia de aprendizagem profunda dedicada à coloração inteligente e à restauração de fotos e vídeos em preto e branco. O projeto usa um método inovador de treinamento NoGAN para resolver com êxito os defeitos comuns das redes GAN tradicionais no processo de coloração de imagens...
8 meses atrás
03.7K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: criação de ferramentas inteligentes de automação da Web para que os inteligentes de IA operem facilmente os navegadores

Introdução abrangente O Browser-Use é uma ferramenta inovadora de automação da Web de código aberto, projetada especificamente para permitir que os modelos de linguagem (LLMs) interajam naturalmente com os sites. Ele oferece uma estrutura avançada e flexível que suporta uma ampla variedade de modelos de linguagem convencionais, incluindo GPT-4, Claud...
8 meses atrás
03.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage: downloader do YouTube, download gratuito de vídeos do YouTube, extração de áudio, obtenção de legendas

Introdução geral O YTSage é um downloader moderno do YouTube com uma interface PyQt6 limpa. Os usuários podem usar o YTSage para fazer download de vídeos de qualquer qualidade, extrair áudio, obter legendas (inclusive legendas geradas automaticamente) e visualizar as meta...
8 meses atrás
03.2K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: uma estrutura de código aberto para otimizar projetos de prompt para melhorar o desempenho da tarefa

Introdução abrangente O PromptWizard é uma estrutura de código-fonte aberto desenvolvida pela Microsoft que usa um mecanismo autoevolutivo que permite que o modelo gere, avalie e aprimore palavras de alerta e gere exemplos por conta própria, melhorando a qualidade do resultado por meio de feedback contínuo. Ele pode otimizar de forma autônoma as palavras de alerta, gerar e selecionar exemplos apropriados e...
8 meses atrás
03.2K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: gere modelos de código aberto de imagem para vídeo que suportam controle de lente e controle de amplitude de movimento.

Introdução geral O Ruyi-Models é um projeto de código aberto criado para gerar vídeos de alta qualidade a partir de imagens. Desenvolvido pela equipe IamCreateAI, o projeto suporta a geração de vídeos cinematográficos com resolução de 768, 24 quadros por segundo, 120 quadros em 5 segundos...
8 meses atrás
02.6K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: geração de posts de blog a partir de conteúdo de voz com base no LangGraph, redação automatizada de blogs

Introdução geral O Robo Blogger é uma ferramenta inovadora de criação de blogs projetada para simplificar o processo de geração de conteúdo por meio da tecnologia de fala para texto. Os usuários podem registrar ideias por meio de qualquer aplicativo de fala para texto, e o Robo Blogger transforma essas ideias em conteúdo estruturado de blog...
8 meses atrás
03.1K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: mecanismo de física generativo de código aberto para simulação de mundo dinâmico 4D baseado em física real

Introdução geral O Genesis é um mundo de física generativa projetado para robótica de uso geral e aprendizado de IA incorporado. Ele fornece uma plataforma de simulação unificada que suporta a simulação de uma ampla gama de materiais e fenômenos físicos. O Genesis tem como objetivo desbloquear a IA generativa e a simulação física combinando...
8 meses atrás
03.5K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: modelo de texto para imagem para gerar imagens de alta qualidade, com suporte para gerar pôsteres em chinês

Introdução abrangente O Kolors é um modelo de geração de texto para imagem em grande escala desenvolvido pela equipe do Racer, com base em técnicas de difusão potencial. O modelo é treinado em bilhões de pares de dados de texto-imagem e é capaz de gerar imagens de alta qualidade, complexas e semanticamente precisas, com suporte para entradas em chinês e inglês.
8 meses atrás
03.1K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreamento de desenhos animados, sombreamento automático de imagens em preto e branco para melhorar a consistência e a qualidade da cor da imagem

Introdução abrangente O ColorFlow é uma ferramenta de coloração automática de sequências de imagens desenvolvida pela equipe do Tencent ARC para resolver o problema de coloração automática de sequências de imagens em preto e branco. A ferramenta usa um pipeline de sombreamento aprimorado por recuperação para gerar com precisão as cores de vários elementos por meio de um conjunto de imagens de referência, incluindo cores de cabelo de personagens e serviços...
8 meses atrás
02.6K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: ferramenta multifuncional para restauração e edição de imagens lançada pela Tencent ARC

Introdução abrangente O BrushEdit é uma ferramenta multifuncional de reparo e edição de imagens desenvolvida pela Tencent ARC Labs. A ferramenta é baseada na mais recente tecnologia de IA e é capaz de identificar e reparar automaticamente defeitos em imagens, além de oferecer suporte à edição interativa pelos usuários.
8 meses atrás
03K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

Contornos: gerar saída de texto estruturado por meio de expressões regulares, JSON ou modelos Pydantic

Introdução geral Outlines é uma biblioteca de código aberto desenvolvida pela dottxt-ai para aprimorar a aplicação de modelos de linguagem ampla (LLMs) por meio da geração de texto estruturado. A biblioteca oferece suporte a uma variedade de integrações de modelos, incluindo OpenAI, transformadores...
6 meses atrás
02.9K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: um modelo para gerar diretamente vocais de rap (Rap) a partir de letras e faixas de apoio (conjunto de dados atualmente aberto)

Introdução geral O RapBank é um conjunto de dados e ferramentas projetado para a geração de letras de músicas de rap. O projeto foi criado pela NZqian para fornecer a pesquisadores e desenvolvedores dados de alta qualidade sobre letras de rap, coletando e processando músicas de rap do YouTube...
8 meses atrás
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: um sistema avançado de recuperação de IA (RAG) para análise de conteúdo multimodal e combinação de gráfico de conhecimento com pesquisa híbrida

Introdução abrangente O R2R (RAG to Riches) é um sistema avançado de recuperação de IA que oferece suporte à funcionalidade Retrieval Augmented Generation (RAG) com recursos prontos para produção. Criado em uma API RESTful em contêiner, o sistema oferece análise de conteúdo multimodal, funcionalidade de pesquisa híbrida...
8 meses atrás
03K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: um modelo de compreensão multimodal do lado final que oferece suporte à compreensão e análise multimodal de texto, imagem e áudio

Introdução abrangente O Infini-Megrez é uma solução de inteligência de ponta desenvolvida pela cúpula do núcleo inquestionável (Infinigence AI), com o objetivo de obter compreensão e análise multimodais eficientes por meio de co-projeto de hardware e software. O núcleo do projeto é o modelo Megrez-3B, que oferece suporte a gráficos...
7 meses atrás
02.7K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: geração de mundos 3D exploráveis em 360° a partir de uma única imagem (código progressivamente de código aberto)

Introdução geral O GenEx é um modelo avançado de IA capaz de gerar um mundo 3D 360° totalmente explorável a partir de uma única imagem. Os usuários podem explorar interativamente esse mundo gerado. O GenEx ultrapassa os limites da IA figurativa no espaço imaginativo e tem o potencial de...
8 meses atrás
02.9K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: um mecanismo RAG de código aberto baseado na compreensão profunda de documentos, fornecendo fluxos de trabalho de geração aprimorados por recuperação eficientes

Introdução abrangente O RAGFlow é um mecanismo RAG (Retrieval Augmented Generation) de código aberto baseado na tecnologia de compreensão profunda de documentos. Ele fornece um fluxo de trabalho RAG eficiente para empresas de todos os portes, incorporando um modelo de linguagem em grande escala (LLM) que pode fornecer dados em formatos complexos com base em...
7 meses atrás
03.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: um cliente de visualização de fluxo de trabalho para modelos de IA com base na orquestração de nós

Introdução geral O NodeTool é uma plataforma inovadora de criação de IA projetada para fornecer uma interface simples e intuitiva para entusiastas de IA, desenvolvedores, cientistas de dados e criativos. Seja você um artista, desenvolvedor ou iniciante, o NodeTool o ajuda a criar protótipos criativos rapidamente...
8 meses atrás
02.6K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank: gerenciamento de orçamento diário com tecnologia de IA para facilitar o acompanhamento de orçamentos diários

Descrição geral O Porkybank é um aplicativo de gerenciamento de finanças pessoais de código aberto desenvolvido para ajudar os usuários a controlar facilmente seu orçamento diário. Com uma fórmula simples (Renda - Despesas) / Dias = Dinheiro, os usuários podem visualizar sua situação financeira. O projeto está hospedado no GitHu...
7 meses atrás
02.8K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: uma estrutura de inteligência colaborativa para vários papéis para simplificar tarefas complexas

Introdução abrangente O CrewAI é uma estrutura avançada projetada para orquestrar a colaboração entre agentes de IA autônomos e de interpretação de papéis. Ao facilitar a inteligência colaborativa, o CrewAI permite que os agentes trabalhem juntos sem problemas para resolver tarefas complexas. Não importa se você está criando uma plataforma de assistente inteligente, automatizando equipes de atendimento ao cliente ou...
8 meses atrás
03.5K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: modelo de alta fidelidade, teste virtual e ajuste de pose de personagens, modelo de geração de imagens de personagens controlados com código aberto

Introdução abrangente O Leffa é uma estrutura unificada para gerar imagens de personagens controláveis, permitindo a manipulação precisa da aparência do personagem (por exemplo, ajuste virtual) e da pose (por exemplo, transferência de pose). A estrutura reduz significativamente a distorção de detalhes refinados, direcionando a consulta de destino para focar na chave de referência correta na camada de atenção, com...
8 meses atrás
03.8K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: geração de efeitos sonoros e trilhas sonoras sincronizadas para filmagens de vídeo, ferramenta de treinamento conjunto multimodal de vídeo para áudio

Introdução geral O MMAudio é um projeto de código aberto que visa gerar áudio sincronizado de alta qualidade por meio de treinamento multimodal conjunto. Desenvolvido por Ho Kei Cheng et al. na Universidade Chinesa de Hong Kong, a principal função do projeto é gerar áudio sincronizado com base em entrada de vídeo e/ou texto.
8 meses atrás
04K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: configuração flexível de ferramentas nativas de diálogo e processamento de documentos de IA

Introdução geral O H2O GPT é um projeto de código aberto que tem como objetivo fornecer recursos privatizados de bate-papo e processamento de documentos. O projeto é baseado na licença Apache 2.0 e oferece suporte a vários modelos de GPT, incluindo LLaMa2, Mistral, Falcon e outros. Com ...
8 meses atrás
03.5K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: Chatbots personalizados para integração rápida de várias fontes de dados

Introdução geral O OpenChat é um console de chatbot fácil de usar, projetado para simplificar o uso de LLMs (Large Language Models). Ao fornecer um processo de configuração em duas etapas, o OpenChat permite que os usuários criem e gerenciem facilmente vários chatbots personalizados. A plataforma é compatível com G...
7 meses atrás
02.7K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT: garanta a privacidade dos dados conversando com vários documentos em dispositivos locais

Introdução geral O LocalGPT é um projeto de código aberto criado para permitir que os usuários conversem com documentos em dispositivos locais, garantindo a privacidade dos dados. Usando vários modelos de código aberto, o LocalGPT pode processar e entender o conteúdo de documentos sem carregar dados na nuvem. O projeto oferece suporte a uma variedade de p...
8 meses atrás
03.3K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: um sistema de perguntas e respostas de documentos com fluxo de processamento de RAG totalmente localizado

Introdução geral O PrivateGPT é um projeto de IA disponível para ambientes de produção que permite aos usuários fazer testes em documentos usando modelos de linguagem em larga escala (LLMs) sem conexão com a Internet. O projeto garante a privacidade dos dados para o 100%, com todos os dados dispostos no ambiente de execução do usuário...
8 meses atrás
02.4K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: plataforma inteligente de criação de corpos para automação do fluxo de trabalho e execução autônoma de tarefas

Descrição geral O AutoGPT é uma plataforma avançada projetada para ajudar os usuários a criar, implementar e gerenciar agentes de IA em execução contínua e automatizar fluxos de trabalho complexos. Desenvolvida pela Significant Gravitas, a plataforma oferece uma ampla gama de ferramentas e recursos que permitem aos usuários se concentrarem...
8 meses atrás
03.1K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: ferramenta interativa de edição de imagens, controle de apontar e clicar e arrastar e soltar a posição da imagem

Introdução geral DragGAN é uma ferramenta interativa de edição de imagens baseada em redes adversárias generativas (GAN). Ela foi lançada por Xingang Pan et al. na SIGGRAPH 2023 e tem como objetivo permitir que os usuários manipulem intuitivamente por meio de operações simples de apontar e clicar e arrastar e soltar...
8 meses atrás
03.4K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: uma estrutura baseada em Qwen para aplicativos de agentes inteligentes, incluindo chamadas de ferramentas, interpretadores de código, RAGs e extensões do Chrome.

Introdução abrangente O Qwen-Agent é uma estrutura de aplicativo de agente inteligente desenvolvida com base no Qwen 2.0 e superior, com recursos como acompanhamento de comandos, uso de ferramentas, planejamento e memória. A estrutura fornece uma variedade de aplicativos de amostra, como assistentes de navegador, intérpretes de código e assistentes personalizados...
8 meses atrás
03.5K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: um criador de capas on-line projetado para gerar capas personalizadas para blogs, vídeos curtos, mídias sociais e muito mais!

Introdução geral O Mini-Cover é uma ferramenta de geração de capas on-line de código aberto projetada para gerar capas personalizadas para plataformas como blogs, vídeos curtos e mídias sociais. Desenvolvida por JLinMr, a ferramenta tem como objetivo fornecer uma solução simples e eficiente para ajudar os usuários a gerar rapidamente capas que atendam às suas necessidades...
8 meses atrás
02.6K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Ferramenta de conversão inteligente de documentos da Microsoft, converte vários arquivos para o formato Markdown

Introdução geral O MarkItDown é uma ferramenta Python desenvolvida pela Microsoft e projetada para converter vários arquivos e documentos de escritório no formato Markdown. A ferramenta é compatível com uma ampla variedade de tipos de arquivos, incluindo PDF, PowerPoint, Word, Excel, diagramas...
8 meses atrás
03.5K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

Claude Engineer: um assistente de diálogo corporal inteligente que gera e gerencia de forma autônoma ferramentas de IA usando o modelo Claude

Introdução geral O Claude Engineer é uma interface de linha de comando (CLI) interativa desenvolvida por Doriandarko que utiliza o modelo Claude-3.5-Sonnet da Anthropic para auxiliar nas tarefas de desenvolvimento de software...
5 meses atrás
02.9K
Swarms:多智能体编排框架,企业级生产工具

Swarms: estrutura de orquestração de inteligência múltipla, ferramenta de produção empresarial

Introdução geral O Swarms é uma estrutura de orquestração de vários agentes pronta para produção de nível empresarial, projetada para aumentar a produtividade dos negócios por meio do gerenciamento eficiente de agentes e do processamento de tarefas. Com suporte para vários modelos, vários sistemas de memória e criação de agentes personalizados, a estrutura oferece um design modular e recursos abrangentes de registro para garantir que o sistema...
8 meses atrás
02.6K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: Imagens de retrato com áudio geram vídeos de demonstração digital com expressões faciais vívidas

Introdução geral O Sonic é uma plataforma inovadora que se concentra na percepção global do áudio, com o objetivo de gerar animações de retratos vívidos impulsionadas pelo áudio. Desenvolvida por uma equipe de pesquisadores da Tencent e da Universidade de Zhejiang, a plataforma usa informações de áudio para controlar expressões faciais e movimentos da cabeça para gerar vídeos animados naturais e suaves.
4 meses atrás
03K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: um macromodelo multimodal de áudio para diálogo de voz de ponta a ponta em tempo real, uma implementação de código aberto da interação de voz GPT-4o

Introdução abrangente O Ultravox é um inovador modelo multimodal de linguagem grande (LLM) projetado para processamento de fala em tempo real. Diferentemente dos sistemas tradicionais de reconhecimento de fala, o Ultravox elimina a necessidade de um estágio separado de reconhecimento de fala por áudio (ASR) e é capaz de converter diretamente o áudio em um espaço de alta dimensão...
8 meses atrás
02.9K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: ferramenta para sincronização labial de vídeo de alta qualidade, otimizada para Wav2Lip

Introdução geral O Easy-Wav2Lip é uma ferramenta aprimorada baseada no Wav2Lip, projetada para simplificar o processo de sincronização labial de vídeo. A ferramenta oferece uma configuração e implementação mais simples, com suporte para o Google Colab e instalação local. Ao otimizar o algoritmo, o Ea...
8 meses atrás
04.7K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: pesquisa na Web e elaboração de relatórios usando o LLM nativo, detalhando automaticamente os tópicos especificados pelo usuário e gerando resumos.

Introdução geral O Research Rabbit é um assistente nativo de pesquisa e resumo na Web baseado em LLM (Large Language Model). Depois que o usuário fornece um tópico de pesquisa, o Research Rabbit gera uma consulta de pesquisa, obtém resultados relevantes na Web e resume esses resultados...
4 meses atrás
02.6K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: um cliente Python que demonstra o processo de execução de um corpo inteligente, fornecendo uma interface gráfica de usuário intuitiva

Introdução abrangente O AgentClientDemo é um projeto Python abrangente que integra a funcionalidade inteligente (Agente) e cliente (Cliente). O projeto é baseado na estrutura PyQt e fornece uma interface gráfica de usuário intuitiva e fácil de usar (G...
8 meses atrás
02.7K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替

HelloMeme: gere imagens ou vídeos consistentes com ações de expressão local de alta fidelidade, Runway Act one open source ping pong!

Introdução abrangente O HelloMeme é um projeto de código aberto desenvolvido pela HelloVision, com o objetivo de incorporar faixas de alto nível e alta fidelidade em modelos de difusão, integrando o Spatial Knitting Attentions...
8 meses atrás
02.9K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução geral O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). O projeto foi desenvolvido pela Lumina...
8 meses atrás
03.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Converta rapidamente repositórios de código do Github em texto adequado para compreensão do LLM

Introdução geral O GitIngest é uma ferramenta de código aberto projetada para transformar repositórios de código do GitHub em texto adequado para dicas do Modelo de Linguagem Grande (LLM). Com uma operação simples, os usuários podem extrair e formatar o conteúdo de qualquer repositório do GitHub para se adequar ao LLM ...
8 meses atrás
03.6K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: Arena de comparação de recursos de programação LLM de código aberto, visualização em tempo real dos melhores modelos de geração de código

Introdução geral A CodeArena é uma plataforma exclusiva projetada para apresentar os melhores modelos de geração de código-fonte aberto (LLMs) por meio de confrontos em tempo real. Os usuários podem assistir a diferentes LLMs competindo nas mesmas tarefas de programação e ver os modelos com melhor desempenho por meio de tabelas de classificação em tempo real. A plataforma utiliza o Tog...
8 meses atrás
02.6K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): copiloto nativo criado usando a API GPT, com suporte para diálogos complementares em qualquer janela.

Introdução geral O ChatFree é um projeto de código aberto que visa a liberar os aplicativos de IA dos usuários das restrições dos navegadores para serem executados localmente. Criado usando a API GPT, o Copilot foi projetado para oferecer suporte a uma ampla variedade de softwares de escritório, como Office, Word, WPS e outros. O projeto foi desenvolvido por ...
8 meses atrás
02.5K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: gera esboços e desenhos de linha de alta qualidade, retropropaga palavras de sugestão de imagem, instalação de pacote com um clique

Introdução geral O Sketch-Gen é uma ferramenta de geração de esboços e desenhos de linha baseada em tecnologia de IA, projetada para ajudar artistas e designers a gerar rapidamente esboços e desenhos de linha de alta qualidade. Derivada do projeto Paints-UNDO, a ferramenta usa modelos avançados de aprendizado de máquina que podem...
8 meses atrás
02.7K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单

PydanticAI: A criação de aplicativos de IA generativa com o Pydantic facilita a criação de aplicativos de IA de nível de produção

Introdução geral O PydanticAI é uma estrutura de agente Python baseada no Pydantic, projetada para simplificar o desenvolvimento de aplicativos de IA generativa. Ela foi desenvolvida pela equipe da Pydantic e oferece suporte a uma ampla variedade de modelos (por exemplo, OpenAI, Gemini, Groq etc.) e...
8 meses atrás
03.8K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vídeo híbrido de Vincennes: geração de imagens realistas de vídeo de alta qualidade, geração de vídeo de código aberto da Tencent de modelos grandes

Introdução abrangente O Tencent Mixed Yuan Text Generation Video (disponível no Yuanbao APP) é uma plataforma de geração de vídeo baseada na tecnologia de IA lançada pela Tencent. A plataforma utiliza o Tencent Mixed Yuan Big Model com um poderoso conhecimento de vários domínios e compreensão de linguagem natural para gerar vídeos de alta qualidade com base nas descrições de texto dos usuários...
7 meses atrás
03.5K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: automatizando a inteligência de manipulação da área de trabalho com a biblioteca PyAutoGUI

Introdução geral O Clevrr Computer é um projeto de código aberto que visa automatizar as operações do sistema por meio do uso da biblioteca PyAutoGUI. O projeto foi inspirado pelo Anthropic para projetar um agente de automação que possa executar operações com precisão e eficiência usando ...
8 meses atrás
02.5K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: estrutura de agente de vídeo inteligente para executar fluxos de trabalho de pesquisa, edição e geração de vídeo com descrições de linguagem natural

Introdução geral O Director é uma estrutura de código aberto projetada para simplificar e otimizar as interações e os fluxos de trabalho de vídeo por meio da criação de agentes de vídeo inteligentes. A estrutura é baseada na infraestrutura de "vídeo como dados" do VideoDB e é capaz de lidar com tarefas complexas de vídeo, como pesquisa, edição, compilação e geração...
8 meses atrás
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

ChatSum do servidor MCP: Confiando no MCP para consultar e resumir mensagens do WeChat no Claude

Introdução geral O MCP Server ChatSum é um projeto de código aberto criado para ajudar os usuários a consultar e resumir mensagens de bate-papo. O projeto está hospedado no GitHub e fornece um conjunto de ferramentas avançado que permite aos usuários consultar registros de bate-papo com base em parâmetros específicos e gerar resumos correspondentes...
5 meses atrás
03.1K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: o Wisdom Spectrum lançou um modelo avançado para a geração de textos ultralongos, suportando a geração de mais de 10.000 palavras em uma única conversa.

Introdução abrangente O LongWriter é uma poderosa ferramenta de geração de textos longos desenvolvida pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM). A ferramenta é baseada no avançado Modelo de Linguagem de Contexto Longo (LLM) e é capaz de gerar textos longos com mais de 10.000 palavras.
8 meses atrás
02.7K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN: um modelo de código aberto para gerar músicas/trilhas sonoras de várias faixas e criar facilmente clipes de música para vários instrumentos

Introdução geral O MuseGAN é um projeto de geração de música baseado em Redes Adversárias Generativas (GANs) projetado para gerar música com várias faixas (vários instrumentos). O projeto é capaz de gerar música do zero ou acompanhada por faixas fornecidas pelo usuário.
8 meses atrás
02.6K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: gere cópias de vídeo e vídeos curtos em HD com um clique, inserindo um tema de vídeo

Introdução abrangente O MoneyPrinterTurbo é um projeto de código aberto que usa tecnologia avançada de modelo grande de IA para realizar a função de gerar vídeos HD curtos com um clique. Os usuários só precisam fornecer um tema de vídeo ou palavras-chave e o sistema gerará automaticamente cópias de vídeo, clipes de vídeo, legendas de vídeo e...
5 meses atrás
02.8K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: ferramenta de linha de comando para usar os serviços do MCP em qualquer modelo grande, não depende do Claude.

Introdução abrangente A CLI do provedor de contexto de modelo (mcp-cli) é uma ferramenta de linha de comando em nível de protocolo para interagir com um servidor de provedor de contexto de modelo. A ferramenta permite que os usuários enviem comandos, consultem dados e interajam com vários recursos fornecidos pelo servidor...
5 meses atrás
03.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: uma estrutura Python para criar fluxos de trabalho de corpo de inteligência de IA controlados e transparentes

Introdução geral O ControlFlow é uma estrutura Python desenvolvida pela PrefectHQ com foco na criação e no gerenciamento de fluxos de trabalho de IA. Ele fornece uma estrutura estruturada e orientada ao desenvolvedor para definir fluxos de trabalho e delegar tarefas à geração de modelos de linguagem grande (LLM)...
8 meses atrás
03.3K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: um mapa de referência de retratos para gerar vídeos consistentes com caracteres, integração rápida de vários terminais

Introdução abrangente O ConsisID é um projeto de código-fonte aberto desenvolvido pelo grupo de Yuan Rong na Universidade de Pequim, com o objetivo de obter geração de texto para vídeo consistente com a identidade (IPT2V) por meio de técnicas de decomposição de frequência. O núcleo do projeto é um sistema DiT (Diffusion Transfor...
8 meses atrás
03.5K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers: uma biblioteca leve para observabilidade de IA que rastreia dados de solicitação de API compatíveis com OpenAI

Introdução geral O Observers é um SDK Python de código aberto projetado para fornecer observabilidade abrangente para APIs de IA generativas. A biblioteca permite que os usuários acompanhem e registrem facilmente as interações com modelos de IA e armazenem essas observações em vários back-ends. Seja...
8 meses atrás
02.6K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): plataforma de código aberto para criar e gerenciar gráficos de conhecimento, com suporte nativo para aplicativos RAG

Introdução abrangente O Knowledge Graph Studio (KGS) é uma plataforma de código aberto projetada para simplificar o processo de criação e gerenciamento de gráficos de conhecimento nativos do RAG. A plataforma oferece resolução de entidades baseada em regras, construção de gráficos modulares, dados flexíveis...
8 meses atrás
03.1K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Geração de relatórios: gere relatórios detalhados sobre qualquer tópico personalizado, como análise de negócios, relatórios de fim de ano, etc.

Descrição geral O Report mAIstro é uma ferramenta avançada projetada para ajudar os usuários a criar facilmente relatórios personalizados por meio da tecnologia de processamento de linguagem natural. A ferramenta utiliza a tecnologia LangChain para transformar tópicos e estruturas fornecidos pelo usuário em relatórios detalhados...
4 meses atrás
02.8K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível

Introdução geral O TRELLIS é um modelo de geração de ativos 3D em grande escala desenvolvido pela Microsoft. Ele é capaz de receber solicitações de texto ou imagem e gerar ativos 3D de alta qualidade em vários formatos, como campos radiais, Gaussianos 3D e malhas.
8 meses atrás
03.9K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: uma ferramenta eficiente para aprender e prever previsões meteorológicas globais de médio prazo com base em modelos de difusão

Introdução geral O GraphCast é uma ferramenta avançada de previsão do tempo desenvolvida pelo Google DeepMind com o objetivo de melhorar a precisão das previsões meteorológicas globais de médio prazo por meio de técnicas de aprendizagem profunda. O projeto fornece uma variedade de modelos pré-treinados e código de amostra, que os usuários podem utilizar para...
8 meses atrás
02.6K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: uma estrutura leve e flexível para corpos inteligentes, com configuração simples de funções e ferramentas para lidar com várias cargas de tarefas

Introdução geral O Bambo é um novo tipo de estrutura de proxy, que é mais leve e mais flexível do que as estruturas convencionais e pode lidar com uma variedade de tarefas de carga. O Bambo obtém uma funcionalidade de proxy eficiente definindo todas as ferramentas no catálogo de ferramentas e usando funções personalizadas assíncronas. Os usuários podem usar o llm_c...
8 meses atrás
02.9K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automação de e-mail com IA localizada para geração rápida de respostas de rascunho de e-mail (Gmail)

Introdução geral O LAMBDA (Local Auto MailBox Draft Assistant) é um sistema de automação de e-mail com IA localizada, projetado para aprender com o estilo de e-mail do usuário e gerar um rascunho para cada e-mail não lido na caixa de entrada do Gmail...
8 meses atrás
02.8K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: uma versão de código aberto do modelo OpenAI o1 baseado no Qwen2-7B-Instrua o ajuste fino para explorar modelos de inferência abertos para resolver problemas complexos

Introdução abrangente O Marco-o1 é um modelo de raciocínio aberto desenvolvido pelo Alibaba International Digital Commerce Group (AIDC-AI) para resolver problemas complexos do mundo real. O modelo combina o ajuste fino do Chain of Thought (CoT), o Monte Carlo Tree Search (MCTS) e estratégias de raciocínio inovadoras...
8 meses atrás
03.3K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务

Flow (Laminar): um mecanismo de tarefas leve para a criação de inteligências que simplifica e gerencia tarefas com flexibilidade

Introdução abrangente O Flow é um mecanismo de tarefas leve projetado para criar agentes de IA com ênfase na simplicidade e na flexibilidade. Diferentemente dos fluxos de trabalho tradicionais baseados em nós e bordas, o Flow usa um sistema dinâmico de fila de tarefas que suporta execução paralela, agendamento dinâmico e gerenciamento inteligente de dependências. Seu conceito central é ...
8 meses atrás
02.8K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: analisa cada tipo de documento em dados disponíveis no LLM, preservando todas as informações do documento, como tabelas e imagens, em sua totalidade.

Introdução geral O MegaParse é uma ferramenta poderosa e versátil de análise de documentos projetada para otimizar o processamento de dados para o Large Language Model (LLM). Não importa se você está trabalhando com texto, PDF, apresentações do PowerPoint ou documentos do Word, o MegaParse...
8 meses atrás
03.1K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código aberto para remoção em lote de fundos de imagens e vídeos, otimizado para o RMBG 2.0

Introdução geral O RMBG-2-Studio é um aplicativo aprimorado de remoção e substituição de plano de fundo desenvolvido com base no modelo BRIA-RMBG-2.0. O aplicativo foi projetado para oferecer aos usuários recursos eficientes e precisos de processamento de fundo de imagem para vários tipos de imagem, incluindo comércio eletrônico, jogos e...
8 meses atrás
03.6K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative: uma seleção de alternativas de software de código aberto para produtos SaaS comumente usados, encontrando as melhores alternativas de código aberto

Introdução geral O OpenAlternative é uma plataforma focada em fornecer alternativas de software de código aberto, com o objetivo de ajudar os usuários a encontrar ferramentas de código aberto adequadas para substituir os produtos SaaS comerciais que usam diariamente. O site ajuda os usuários a economizar dinheiro e melhorar por meio de uma coleção cuidadosamente selecionada de ferramentas de código aberto...
8 meses atrás
02.3K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: resuma um livro inteiro em um clique, destile com eficiência o conteúdo do livro e compreenda rapidamente as ideias principais

Introdução abrangente O TextDistiller é uma ferramenta avançada orientada por IA, projetada para resumir livros capítulo por capítulo ou como um todo, fornecendo uma visão geral concisa e abrangente. Ao usar o TextDistiller, os usuários podem compreender rapidamente as ideias centrais e os pontos-chave de qualquer livro...
8 meses atrás
03K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: um ambiente de programação visual de código aberto para testar e avaliar a eficácia de grandes dicas de modelos de linguagem

Introdução geral O ChainForge é um ambiente de programação visual de código aberto projetado para testar e avaliar a eficácia de dicas de modelos de linguagem ampla (LLM). Ele oferece um ambiente de engenharia de dicas de fluxo de dados por meio do qual os usuários podem explorar e analisar rapidamente a qualidade de diferentes dicas na resposta do LLM...
8 meses atrás
02.7K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: proxy/reversão do canal Midjourney Discord para chamadas de API de mapeamento de IA (teste gratuito)

Introdução abrangente O Midjourney Proxy é um projeto de código aberto desenvolvido para fornecer serviços de proxy para o canal Discord do Midjourney para converter funções de desenho de IA em formato de API. O projeto é totalmente gratuito e de código aberto, com suporte para troca de rosto com um clique, combinação de imagens, geração de gráficos ...
8 meses atrás
03.5K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: pessoas digitais com IA com interação suave em tempo real em placas de vídeo da série 30/40

Introdução geral O DH_live é um projeto humano digital ao vivo em tempo real baseado em aprendizado sem amostragem, com o objetivo de oferecer aos usuários uma experiência de transmissão ao vivo suave e interativa. O projeto é compatível com as placas de vídeo NVIDIA das séries 30 e 40 e é capaz de ser executado em tempo real a mais de 25 fps. Os usuários podem...
9 meses atrás
03.2K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new: modificação de código aberto baseada no Bolt.new, ferramentas de desenvolvimento de pilha completa orientadas por IA

Descrição geral O multi-model-bolt.new é uma versão modificada do Bolt.new que permite o uso de modelos do TogetherAI, com suporte a recursos como implantação, resposta móvel e entrada de voz. Os usuários podem ser solicitados diretamente no navegador, executar...
8 meses atrás
03.8K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow: uma ferramenta de baixo código para criar fluxos de trabalho e inteligências de IA avançados

Introdução geral O Langflow é uma ferramenta de baixo código projetada para que os desenvolvedores criem agentes e fluxos de trabalho de IA avançados. Ele suporta o uso de qualquer API, modelo ou banco de dados, simplificando o desenvolvimento de aplicativos complexos de IA.
8 meses atrás
04K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund: sistema de negociação automatizado de código aberto que usa várias inteligências para tomar decisões complexas de negociação de fundos de hedge

Introdução geral O AI Hedge Fund é um fundo de hedge de inteligência artificial que utiliza um sistema multiagente para tomar decisões de negociação. O sistema trabalha em conjunto com vários agentes especializados, incluindo agentes de dados de mercado, agentes quantitativos, agentes de gerenciamento de risco e agentes de gerenciamento de portfólio, para realizar negociações complexas...
7 meses atrás
04.1K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI Chatbot Supabase: o Next.js de código aberto e o Supabase criaram um chatbot de IA para rápida implementação na Vercel.

Introdução geral O AI Chatbot Supabase é um modelo de chatbot de IA de código aberto criado com base no Next.js e no Supabase. Desenvolvido pela Vercel, o projeto tem como objetivo fornecer uma solução de chatbot totalmente funcional e personalizável. Por ...
8 meses atrás
04K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: uma ferramenta eficiente de geração de aumento de recuperação (RAG) que suporta vários bancos de dados e modelos de linguagem.

Introdução geral O RAGLite é um kit de ferramentas Python para Retrieval Augmented Generation (RAG) com suporte para bancos de dados PostgreSQL ou SQLite. Ele oferece opções de configuração flexíveis que permitem aos usuários escolher diferentes modelos de linguagem e reordenadores...
9 meses atrás
03.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: monitore as atividades do usuário do OpenWebUI, gerencie os limites de uso e ofereça suporte à implantação com um clique.

Introdução geral O OpenWebUI-Monitor é um painel de controle para monitorar as atividades dos usuários do OpenWebUI e gerenciar as cotas de uso. Ele permite definir cotas de usuários de forma eficiente, exibir dados de usuários e informações visuais em tempo real, além de oferecer suporte à implantação com um clique para facilitar o gerenciamento e o monitoramento de...
9 meses atrás
03.2K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: engenheiros de IA de pilha completa de código aberto que criam e iteram rapidamente projetos completos de TypeScript

Introdução geral O Srcbook é uma plataforma de desenvolvimento de aplicativos centrada em TypeScript, projetada para criar e iterar rapidamente aplicativos da Web com assistentes de IA. Ele é compatível com o tempo de execução nativo, fornece uma interface de notebook interativa e permite que os usuários escrevam e executem códigos de back-end.
9 meses atrás
03.1K