Projeto de código aberto de IA

Total de 1020 artigos
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch: uma ferramenta de visualização para monitorar e otimizar os processos de LLM com base na estrutura DSPy

Introdução abrangente O LangWatch é uma plataforma abrangente projetada para operações de Modelo de Linguagem Grande (LLM), fornecendo monitoramento, análise, avaliação, gerenciamento de conjuntos de dados e otimização de dicas. A plataforma é baseada na estrutura DSPy da Universidade de Stanford e foi projetada para ajudar os usuários a gerenciar e otimizar melhor...
7 meses atrás
02K
PR Agent:自动化拉取请求分析工具

PR Agent: ferramenta automatizada de análise de solicitações pull

Introdução geral O PR-Agent é uma ferramenta de código aberto desenvolvida pela Qodo para automatizar o processamento de solicitações pull (Pull Requests) por meio da tecnologia de IA. A ferramenta é capaz de fornecer feedback, sugestões e análises automatizadas para ajudar os desenvolvedores a realizar revisões de código com mais eficiência...
7 meses atrás
02.4K
Coding Agent:基于Langgraph构建的简单编程助手

Coding Agent: um assistente de programação simples baseado em Langgraph

Introdução geral O Coding Agent é um assistente de programação inteligente desenvolvido por AbhinavTheDev, projetado para ajudar os desenvolvedores a melhorar sua eficiência de programação. A ferramenta usa tecnologia de inteligência artificial para gerar código automaticamente, fornecer sugestões de programação e ajudar os desenvolvedores com vários códigos...
7 meses atrás
02.4K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: avaliando a precisão do RAG recall QA e a correlação de respostas

Introdução abrangente O Ragas é uma ferramenta projetada especificamente para avaliar e otimizar os sistemas RAG (Retrieval Augmented Generation). Ele fornece um conjunto abrangente de métricas de avaliação, analisando as relações entre consultas, contextos de recuperação e respostas geradas. Essas métricas incluem fidelidade, relevância da resposta, relevância do contexto,...
7 meses atrás
03K
VeighNa:国内流行的开源量化交易框架

VeighNa: uma estrutura de negociação quantitativa de código aberto popular na China

Introdução abrangente O VeighNa é uma plataforma de negociação quantitativa de código aberto baseada em Python, originalmente desenvolvida por traders privados nacionais e lançada oficialmente em 2015. Ela evoluiu de um simples pacote de interface de negociação para uma estrutura de desenvolvimento de negociação totalmente funcional. Os usuários incluem fundos de private equity, certificados...
5 meses atrás
03.8K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter: a alternativa de código aberto e sem censura ao Character.AI

Introdução geral O OpenCharacter é uma ferramenta de criação de personagens de código aberto projetada para oferecer aos usuários uma experiência de interação e criação de personagens de IA ilimitada e sem filtros como uma alternativa ao Character.AI. Os usuários podem criar e executar seus próprios personagens usando modelos nativos ou...
7 meses atrás
03.6K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: uma estrutura de código aberto para executar com eficiência tarefas de IA e em lote em qualquer nuvem

Introdução geral O SkyPilot é uma estrutura de código aberto iniciada pelo Sky Computing Lab da Universidade da Califórnia, em Berkeley, projetada para ajudar os usuários a executar com eficiência tarefas de IA e processamento em lote em qualquer infraestrutura de nuvem. Ele é compatível com mais de 14 serviços de nuvem (incluindo ...
6 meses atrás
02K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: a maneira mais rápida de executar e ajustar o LLM localmente!

Introdução geral O LlamaEdge é um projeto de código aberto desenvolvido para simplificar o processo de execução e ajuste fino de grandes modelos de linguagem (LLMs) em dispositivos locais ou de borda. O projeto oferece suporte à família de modelos Llama2 e fornece serviços de API compatíveis com OpenAI que permitem aos usuários criar e executar facilmente...
7 meses atrás
02.5K
AutoGen:微软开发的多智能体对话框架

AutoGen: uma estrutura de diálogo corporal multiinteligente desenvolvida pela Microsoft

Introdução geral O AutoGen é uma estrutura de código aberto desenvolvida por uma equipe de pesquisadores da Microsoft com o objetivo de simplificar a construção de aplicativos de modelo de linguagem grande (LLM) por meio de diálogo corporal multiinteligente. Ele permite que os desenvolvedores criem agentes de IA que podem dialogar entre si e colaborar para resolver tarefas. Essa abordagem não só melhora o desempenho do LLM...
7 meses atrás
03.3K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: plug-in de assistente da Web para diálogo de modelo de IA nativo e recuperação de documentos

Introdução geral O Page Assist é uma extensão de navegador de código aberto criada para oferecer aos usuários uma maneira fácil de interagir com modelos locais de IA. Com essa extensão, os usuários podem abrir uma barra lateral em qualquer página da Web para interagir com modelos de IA em execução localmente.Page Assi...
4 meses atrás
04.5K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboração multiagente para assistente de operação de dispositivos móveis

Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Ele foi desenvolvido pela equipe do X-PLUG e é compatível com Android e ...
7 meses atrás
03.3K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter: ferramenta de edição de imagens no estilo de rabiscos com tecnologia de IA

Introdução geral O FramePainter é uma ferramenta revolucionária de edição de imagens orientada por IA que utiliza tecnologia avançada de difusão de vídeo e controles intuitivos do Sketch para ajudar os usuários a realizar facilmente edições complexas de imagens. Seja um simples ajuste ou uma transformação criativa complexa, o Fr...
7 meses atrás
03.1K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela em tempo real e forneçam...
7 meses atrás
02.9K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: uso ilimitado de IDEs de IA usando ferramentas de automação (por exemplo, Cursor e Windsurf)

Descrição geral O AI Auto Free é uma poderosa ferramenta de automação projetada para ajudar os usuários a fazer uso ilimitado de ambientes de desenvolvimento integrado (IDEs) orientados por IA, como o Cursor e o Windsurf. O projeto oferece suporte a várias plataformas e inclui vários recursos de linguagem...
7 meses atrás
02.7K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: uma estrutura para colaboração em clusters de inteligência múltipla

O Quantum Swarm é uma estrutura de inteligência artificial de código aberto voltada para o desenvolvimento e a pesquisa de inteligência populacional de IA. O projeto é mantido pela equipe da Quarm AI no GitHub e tem como objetivo fornecer uma plataforma flexível e eficiente para criar e testar sistemas de inteligência múltipla.
7 meses atrás
03.1K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: uma ferramenta de avaliação visual para otimizar os sistemas de geração de aprimoramento de recuperação

Introdução abrangente O XRAG (eXamining the Core) é uma estrutura de benchmarking projetada para avaliar os componentes subjacentes dos sistemas avançados de geração de aumento de recuperação (RAG). Ao traçar o perfil e analisar cada módulo central, o XRAG fornece informações sobre como diferentes configurações e componentes afetam o RAG...
7 meses atrás
02.9K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan: embelezar artigos Markdown com um clique, adaptar-se a vários formatos de plataforma de mídia própria (cliente local de código aberto)

Introdução abrangente O WenYan é uma ferramenta projetada para a composição e o embelezamento de artigos Markdown, que oferece suporte à conversão de artigos Markdown editados em um formato adequado para WeChat, Zhihu, manchetes de hoje e outras plataformas. Os usuários podem copiar o artigo com um clique, o artigo diretamente...
7 meses atrás
02.2K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: Ferramenta de resumo da linha do tempo de notícias para melhorar a eficiência da recuperação de notícias e da geração de linhas do tempo

Introdução geral O CHRONOS é uma ferramenta de resumo da linha do tempo de notícias desenvolvida pela equipe de NLP da Alibaba. A ferramenta gera resumos de linhas do tempo de eventos de notícias por meio de autoquestionamento iterativo. O CHRONOS não só é capaz de lidar com tarefas de resumo de linhas do tempo de domínio aberto, mas também em termos de eficiência e escalabilidade...
7 meses atrás
02.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: controla o movimento dos objetos no vídeo, adicionando ou subtraindo qualquer objeto em movimento no vídeo.

Introdução geral O Go-with-the-Flow é um projeto de código aberto desenvolvido pela equipe de pesquisa da Netflix Eyeline Studios para controlar os padrões de movimento dos modelos de difusão de vídeo distorcendo o ruído. O projeto permite que o usuário determine como a câmera da cena e...
7 meses atrás
02.5K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Introdução geral O X-Dyna é um projeto de código aberto desenvolvido pela ByteDance que visa gerar animações dinâmicas de retratos por meio de técnicas de difusão de amostra zero. O projeto usa expressões faciais e movimentos corporais em vídeos de unidades para animar imagens de retratos individuais, gerando efeitos de movimento realistas e sensíveis ao contexto.
7 meses atrás
02.6K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): geração de ativos 3D de alta resolução, vários fluxos de trabalho de geração de material 3D

Introdução abrangente O Tencent Hunyuan3D (Hunyuan3D 2.0) é um sistema avançado de composição 3D em grande escala da Tencent, projetado para gerar ativos 3D texturizados de alta resolução. O sistema consiste em dois componentes principais: Hunyuan3D-DiT, um modelo de geração de formas em grande escala, e Hunyuan3D-DiT, uma textura em grande escala...
7 meses atrás
03.5K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Criando um sistema inteligente de perguntas e respostas sobre documentos e simplesmente criando uma base de conhecimento privada na Web

Introdução abrangente O RAG Web UI é um sistema de diálogo inteligente baseado na tecnologia RAG (Retrieval Augmented Generation). Ele ajuda empresas e indivíduos a criar sistemas inteligentes de perguntas e respostas com base em sua própria base de conhecimento. Combinando a recuperação de documentos e grandes modelos de linguagem, o RAG Web UI fornece informações precisas e confiáveis...
7 meses atrás
02.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicativo da Intelligentsia para controle de computadores usando linguagem natural

Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.
7 meses atrás
03.1K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix: empacotamento da base de código em um arquivo de texto para recuperação de modelos grandes

Introdução geral O Repomix (anteriormente conhecido como Repopack) é uma ferramenta de código aberto projetada para empacotar toda uma base de código em um único arquivo compatível com IA. Essa ferramenta permite que os desenvolvedores disponibilizem facilmente sua base de código para grandes modelos de linguagem (como Claude, Chat...
7 meses atrás
03.1K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: leitura de arquivos de texto do repositório git e sua rápida divisão em pedaços para modelos grandes

Introdução geral O Yek é uma ferramenta rápida baseada em Rust para ler arquivos de texto de repositórios ou diretórios, dividi-los em pedaços e serializá-los para uso em modelos de linguagem grande (LLMs). Por padrão, a ferramenta usa a regra .gitignore para ignorar arquivos desnecessários e usa...
7 meses atrás
03K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: inteligências multifuncionais que revisam, validam e formatam os resultados para produzir resultados de alta qualidade

Introdução abrangente O Kheish é um agente de código aberto de múltiplas funções projetado para tarefas de modelagem de grandes linguagens (LLM) que exigem colaboração estruturada e passo a passo. O Kheish é mais do que um simples coordenador, ele é um agente inteligente por si só, solicitando módulos sob demanda, integrando a reversão do usuário...
7 meses atrás
02.8K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: uma ferramenta versátil de criação de conteúdo de IA para gerar histórias curtas, roteiros de diálogos, narrações e gráficos

Descrição geral O AI ContentCraft é uma ferramenta versátil de criação de conteúdo que integra geração de texto, síntese de fala, geração de imagens e muito mais. Ela ajuda os criadores a gerar rapidamente histórias, roteiros de podcast e o conteúdo de áudio e vídeo que os acompanha. A ferramenta oferece suporte a conversões de vários idiomas e pode...
7 meses atrás
02.9K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: criação de gráficos de conhecimento e mecanismos de pesquisa pessoal executados localmente

Introdução geral O Unigraph é um mecanismo de pesquisa pessoal e gráfico de conhecimento de propósito geral local, projetado para fornecer aos usuários um espaço de trabalho integrado para ajudar a gerenciar e pesquisar uma ampla variedade de dados em suas vidas pessoais. Com o Unigraph, os usuários podem integrar dados de diferentes fontes em um...
7 meses atrás
02.7K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta

Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA).
7 meses atrás
03.3K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA que controla páginas da Web, executa asserções e extrai dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando a medição da IU...
7 meses atrás
03.4K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Video Analyzer: analisa o conteúdo do vídeo e gera descrições detalhadas

O Comprehensive Introduction Video Analyzer é uma ferramenta abrangente de análise de vídeo que combina visão computacional, transcrição de áudio e técnicas de processamento de linguagem natural para gerar descrições detalhadas do conteúdo do vídeo. A ferramenta transcreve o conteúdo de áudio extraindo quadros-chave do vídeo...
6 meses atrás
04.1K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: uma ferramenta de código aberto para ajuste fino e treinamento eficientes de modelos de linguagem grandes

Introdução abrangente O Unsloth é um projeto de código aberto criado para fornecer ferramentas eficientes para o ajuste fino e o treinamento de grandes modelos de linguagem (LLMs). O projeto oferece suporte a vários modelos conhecidos, incluindo Llama, Mistral, Phi e Gemma.
6 meses atrás
03K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de perguntas e respostas com base de conhecimento de IA pronto para uso para atendimento inteligente ao cliente e base de conhecimento interna

Introdução abrangente O MaxKB (Max Knowledge Base) é um sistema de Q&A de base de conhecimento de código aberto baseado em grandes modelos de linguagem e RAG (Retrieval Augmented Generation). O sistema é amplamente utilizado no atendimento inteligente ao cliente, na base de conhecimento interna da empresa, na pesquisa e educação acadêmica e em outros cenários.
7 meses atrás
03.6K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: uma estrutura de redação para gerar ensaios longos de alta qualidade, buscando conhecimento externo e, em seguida, refletindo sobre ele e criando uma árvore de conhecimento passo a passo

Introdução abrangente O OmniThink é uma estrutura inovadora de escrita automática projetada para gerar ensaios longos de alta qualidade, imitando a expansão iterativa e a reflexão dos processos cognitivos humanos. A estrutura se concentra em ampliar os limites do conhecimento e gerar informações ricas e profundas, o que o OmniThink faz construindo...
7 meses atrás
02.5K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes em tempo real da OpenAI: um aplicativo de interação de fala corporal multiinteligente (exemplo da OpenAI)

Introdução geral O OpenAI Realtime Agents é um projeto de código aberto que tem como objetivo mostrar como a API em tempo real do OpenAI pode ser usada para criar aplicativos de fala corporal multiinteligentes. Ele fornece um modelo de corpo inteligente de alto nível (emprestado do OpenAI Swarm) que permite...
7 meses atrás
03.5K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: renderização de luz natural de imagens de retrato (não publicado)

Descrição geral O SynthLight é uma ferramenta de reiluminação de retratos baseada em um modelo de difusão. Ela aprende a renderizar novamente imagens sintéticas de rostos para obter ajustes de efeitos de iluminação em fotos de retratos reais. A ferramenta usa um mecanismo de renderização física para gerar conjuntos de dados que simulam transformações de iluminação sob diferentes condições de iluminação...
7 meses atrás
03.2K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução abrangente O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido pelo thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala.
7 meses atrás
03.4K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversão de imagem para Markdown, OCR de alta precisão de modelo visual

Introdução geral O Zerox é um projeto de código aberto desenvolvido para converter PDF, DOCX, imagens e outros documentos para o formato Markdown por meio de modelos visuais. O projeto foi desenvolvido pela equipe getomni-ai e oferece uma solução simples e eficiente de OCR (reconhecimento óptico de caracteres).
7 meses atrás
03.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: uma ferramenta minimalista de bate-papo com IA baseada em endpoint com integração nativa ao back-end do Ollama

Descrição geral O Charla é um aplicativo de bate-papo baseado em endpoint projetado para dialogar com modelos de idioma nativo. O aplicativo se integra ao back-end do Ollama, oferece suporte ao diálogo com reconhecimento de contexto e salva as sessões de bate-papo como arquivos Markdown. Os usuários podem simplesmente...
7 meses atrás
02.9K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Introdução abrangente O MiniRAG é uma estrutura extremamente simples do Retrieval Augmented Generation (RAG) que visa a permitir um bom desempenho do RAG mesmo para modelos pequenos por meio de indexação de gráficos heterogêneos e recuperação leve com aprimoramento de topologia. Ele foi desenvolvido pelo Laboratório de Ciência de Dados da Universidade de Hong Kong (HKUDS) para abordar ...
7 meses atrás
03.4K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: um grande modelo multimodal para compreensão em nível de região de imagens e vídeos para aprimorar a análise de conteúdo visual

Introdução abrangente O Omni-RGPT é um modelo multimodal de linguagem grande projetado para permitir a compreensão de imagens e vídeos em nível de região. Com a introdução da técnica Token Mark, o Omni-RGPT é capaz de destacar a região-alvo no espaço de recursos visuais e indicar a região-alvo por meio de dicas de região (por exemplo, caixas ou...
7 meses atrás
02.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: um assistente de diálogo de voz de código aberto de baixa latência para conversação e comunicação naturais

Introdução abrangente O Bailing (Bailing) é um assistente de diálogo de voz de código aberto projetado para estabelecer um diálogo natural com os usuários por meio da fala. O projeto combina as tecnologias de reconhecimento de fala (ASR), detecção de atividade de voz (VAD), modelagem de linguagem ampla (LLM) e síntese de fala (TTS) para...
7 meses atrás
03.3K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI: versão de código aberto da ferramenta de geração de vídeos curtos e clonagem digital de humanos por IA

Introdução abrangente O Metaverse AI (versão de código aberto) é um projeto hospedado no GitHub, desenvolvido pela equipe da libn-net. Ele pode clonar imagens e vozes humanas digitais por meio da tecnologia de IA para gerar vídeos curtos e também suporta dublagem e legendagem. Essa ferramenta oferece o Windo...
5 meses atrás
01.7K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: uma ferramenta de bate-papo para recuperar conhecimento usando dados da Wikipédia

Introdução geral O WikiChat é um chatbot experimental desenvolvido na Universidade de Stanford com o objetivo de aprimorar a factualidade de modelos de linguagem grandes recuperando dados da Wikipédia. Os grandes modelos de linguagem (como o ChatGPT e o GPT-4) tendem a processar informações atualizadas ou tópicos menos populares quando...
7 meses atrás
02.2K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem...
7 meses atrás
03.1K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: uma estrutura eficiente para a criação de aplicativos colaborativos multiinteligentes

Introdução geral AIEvo é a estrutura multiagente de código aberto do Ant Group, projetada para criar aplicativos multiagentes com eficiência. A estrutura segue rigorosamente o gráfico de tarefas SOP para melhorar a taxa de sucesso da execução de tarefas complexas e garante alta flexibilidade e escalabilidade por meio de mecanismos de feedback e monitoramento.
7 meses atrás
02.5K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: geração e avaliação automáticas de apresentações PPT, documentos para PPTs

Introdução geral O PPTAgent é um sistema inovador projetado para gerar automaticamente apresentações a partir de documentos. O sistema se baseia na abordagem humana para criar apresentações, usando um processo de duas etapas para garantir a qualidade do conteúdo e o impacto visual. Além disso, o PPTAgent apresenta o PPTEval, uma ferramenta abrangente...
7 meses atrás
02.8K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: criação de uma interface de arrastar e soltar nós para aplicativos LLM personalizados

Introdução geral O FlowiseAI é uma ferramenta de código aberto e de baixo código projetada para ajudar os desenvolvedores a criar aplicativos LLM (Large Language Model) personalizados e agentes de IA. Com uma interface simples de arrastar e soltar, os usuários podem criar e iterar rapidamente aplicativos LLM, tornando o processo de teste à produção mais eficiente...
7 meses atrás
03.1K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper

Introdução geral O RealtimeSTT é uma biblioteca de conversão de fala em texto eficiente e de baixa latência em tempo real, com detecção avançada de atividade de fala e ativação de palavras de alerta. Ela foi desenvolvida por Kolja Beigel para dar suporte a aplicativos que exigem conversão de fala em texto rápida e precisa...
7 meses atrás
03K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: implementação rápida de desduplicação de texto semântico para melhorar a eficiência da limpeza de dados

Introdução abrangente O SemHash é uma ferramenta leve e flexível para eliminar a duplicação de conjuntos de dados por similaridade semântica. Ele combina a rápida geração de incorporação do Model2Vec com a eficiente pesquisa de similaridade ANN (vizinho mais próximo aproximado) do Vicinity.SemHa...
7 meses atrás
02.7K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: uma estrutura de código aberto para criar aplicativos RAG modulares e testar rapidamente diversas estratégias RAG

Introdução abrangente A Cognita é uma estrutura de código aberto desenvolvida pela TrueFoundry para simplificar o desenvolvimento de aplicativos baseados em RAG (Retrieval-Augmented Generation). A estrutura fornece um sistema estruturado, mod...
7 meses atrás
02.9K
BotSharp:基于.NET的多智能体AI应开发与管理平台

BotSharp: uma plataforma de desenvolvimento e gerenciamento de inteligência múltipla de IA baseada em .NET

Introdução abrangente O BotSharp é um projeto de código aberto baseado no .NET Core dedicado a fornecer uma ferramenta abrangente de criação de plataforma de chatbot de IA. Ele usa a programação C#, oferece suporte à operação entre plataformas e tem como objetivo simplificar a aplicação de algoritmos de aprendizado de máquina, permitindo que os desenvolvedores de nível empresarial...
7 meses atrás
02.9K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: uma estrutura de corpo inteligente para a criação de dispositivos inteligentes multimodais

Introdução abrangente O OmAgent é uma estrutura de corpo inteligente multimodal desenvolvida pelo Om AI Lab, com o objetivo de fornecer recursos avançados baseados em IA para dispositivos inteligentes. Ao integrar modelos de base multimodais de última geração e algoritmos de corpo inteligente, o projeto permite que os desenvolvedores criem dispositivos inteligentes eficientes em uma variedade de...
7 meses atrás
02.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: um conjunto completo de ferramentas para a criação de inteligências de IA com base no LangGraph

Introdução abrangente O AI Agent Service Toolkit é um conjunto de ferramentas completo baseado em LangGraph, FastAPI e Streamlit, projetado para ajudar os desenvolvedores a criar e executar rapidamente serviços de agente de IA. O kit de ferramentas fornece um...
7 meses atrás
02.6K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: criação de módulos de memória de IA humanizados para salvar e atualizar informações sobre interações com humanos

Introdução geral O Memora é um agente projetado para replicar memórias humanas para cada IA personalizada. Ele ajuda as IAs a se lembrarem de detalhes de interações passadas, emoções e experiências compartilhadas, assim como os humanos fazem, por meio de recursos como memórias com registro de data e hora, marcadores de emoção e memórias multimodais.
7 meses atrás
02.9K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Microagente: inteligência de programação de IA que gera código automaticamente e o testa e corrige.

Introdução geral O Micro-Agent é um assistente de codificação de IA de código aberto desenvolvido pela Builder.io, projetado para fornecer aos desenvolvedores a capacidade de gerar e testar códigos automaticamente. Ele gera casos de teste compreendendo descrições de linguagem natural e itera o código até que todos os testes sejam aprovados, reduzindo, assim, o tempo de...
7 meses atrás
03.2K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: Fluxos de trabalho corporais inteligentes de criação de linguagem natural para automação de desktops e navegadores

Introdução geral A Eko é uma estrutura JavaScript de nível de produção projetada para criar fluxos de trabalho eficientes de agentes inteligentes por meio de descrições de linguagem natural. Ele foi projetado para permitir que os desenvolvedores automatizem tarefas cotidianas usando tecnologias de IA sem programação profunda.
5 meses atrás
02.7K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: uma interface de gerenciamento para interação humano-computador com inteligências de IA

Introdução geral O Agent Inbox é um projeto de código aberto desenvolvido pela equipe da LangChain para proporcionar uma nova experiência de usuário na interação com inteligências de IA. O projeto permite que os usuários gerenciem e otimizem as interações com várias inteligências de IA por meio de uma interface centralizada.Ag...
7 meses atrás
02.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: um assistente inteligente para mídias sociais que gera e gerencia automaticamente o conteúdo das mídias sociais

Introdução geral O Social Media Agent (Agente de mídia social) é um projeto de código aberto que gerencia as informações de interação pela nova Caixa de entrada do agente, projetado para ajudar os usuários a automatizar a geração e o gerenciamento de conteúdo de mídia social. O projeto foi desenvolvido pela equipe da LangChain...
7 meses atrás
02.6K
Executive AI Assistant:AI行政助理,提醒阅读邮件并规划工作日程

Assistente executivo de IA: assistente executivo de IA, lembretes para ler e-mails e planejar agendas de trabalho

Introdução geral O Executive AI Assistant (EAIA) é uma ferramenta de assistente baseada em IA projetada para ajudar os usuários a automatizar e gerenciar suas tarefas diárias. Desenvolvida pela LangChain, a ferramenta é capaz de lidar com e-mails, agendamentos, gerenciamento de tarefas e outros...
7 meses atrás
02.8K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: uma ferramenta automatizada de coloração de linhas para colorir rapidamente desenhos de anime em preto e branco.

Introdução abrangente O MangaNinjia é um projeto de código aberto desenvolvido pelo Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), com foco no processamento automatizado de coloração de desenhos de linha. Essa ferramenta consegue a correspondência precisa de cores de imagens de referência por meio de técnicas de aprendizagem profunda, melhorando muito...
7 meses atrás
02.6K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Introdução geral O Audiblez é um projeto de código aberto criado para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e várias vozes. Os usuários podem simplesmente...
7 meses atrás
03.4K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Pesquisa o1: Capacitar modelos de inferência para pesquisar ativamente, permitindo que modelos grandes pesquisem conhecimento externo enquanto pensam

Introdução abrangente O Search-o1 é um projeto de código aberto que visa aprimorar o desempenho de modelos de raciocínio em larga escala (LRMs) por meio da integração de mecanismos de pesquisa avançados. A ideia central é resolver o problema do déficit de conhecimento encontrado no processo de raciocínio por meio da busca dinâmica e da integração do conhecimento. O projeto é patrocinado pela Sunn...
7 meses atrás
02.4K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: gere e publique automaticamente vídeos curtos no YouTube e conteúdo no Twitter

Introdução geral O MoneyPrinter V2 é um projeto de código aberto desenvolvido por FujiwaraChoki para ajudar os usuários a ganhar dinheiro on-line por meio da automação. O projeto integra principalmente automação do Twitter, geração de vídeos curtos do YouTube e acampamento de afiliados...
7 meses atrás
03.4K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: um aplicativo de tradução de voz em tempo real para Android, gratuito e off-line!

Introdução geral O RTranslator é um aplicativo de tradução em tempo real off-line, gratuito e de código aberto, desenvolvido para dispositivos Android. Os usuários podem manter o telefone no bolso, conectando um fone de ouvido Bluetooth, e conversar com outras pessoas como se estivessem falando seu próprio idioma.
7 meses atrás
03.1K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

Gemini Next Chat: Implemente seu aplicativo Gemini multimodal privado gratuitamente com um clique!

Introdução geral O Gemini Next Chat é um projeto de código aberto criado para ajudar os usuários a implementar facilmente aplicativos Gemini privados. O projeto é compatível com o modelo multimodal Gemini 1.5 e Gemini 2.0, e os usuários podem implantá-lo com um clique no Vercel...
7 meses atrás
02.4K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: geração de código de automação do navegador para transformar ações do mouse em scripts Selenium Python via IA

Introdução geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as...
7 meses atrás
02.8K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: uso de técnicas RAG para gerar consultas SQL precisas a partir de texto

Introdução abrangente O Vanna é uma estrutura Python de código aberto licenciada pelo MIT, focada na geração de consultas SQL por meio de técnicas RAG (Retrieval Augmented Generation). Os usuários podem treinar modelos RAG, aplicá-los a seus próprios dados e, em seguida, fazer perguntas, e o Vanna retornará a resposta adequada...
7 meses atrás
02.6K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: uma estrutura unificada para implementar o reparo de faces em vídeos, reparando vídeos antigos com retratos em preto e branco e desfocados

Introdução abrangente O SVFR (Stable Video Face Restoration) é uma estrutura unificada para restauração de faces em vídeo que suporta as tarefas de restauração básica de faces (BFR), coloração, reparo e suas combinações. A estrutura utiliza priores generativos e cinemáticos unificando...
7 meses atrás
03.6K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: sistema interativo digital humano ao vivo em tempo real de código aberto para obter um diálogo síncrono de áudio e vídeo

Introdução abrangente O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, comprometido com a criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0, integrado a várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de streaming de áudio e vídeo em tempo real...
7 meses atrás
03.9K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: ferramenta de assistente de programação de código aberto, use o assistente de IA para escrever códigos e editar arquivos

Introdução geral O Aider é uma poderosa ferramenta de assistente de programação de IA de código aberto que ajuda os desenvolvedores a escrever, editar e refatorar códigos por meio de diálogo em linguagem natural. Como uma ferramenta interativa de programação de pares de IA, o Aider é compatível com muitas das principais linguagens de programação e pode ser integrado perfeitamente ao Git...
4 meses atrás
03K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: Ferramenta de edição de vídeo de retratos falados em 3D com reconhecimento de profundidade e orientada por áudio

Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução 3D e métodos de extração de recursos de áudio para capturar com precisão as características de identidade do locutor e a expressão...
7 meses atrás
02.7K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: software de remoção de marca d'água de vídeo sem perdas e legendas rígidas com tecnologia de IA (cliente de remoção de marca d'água de vídeo 7G+)

Introdução abrangente O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas difíceis e marcas d'água de texto de vídeos. A ferramenta usa uma variedade de modelos de algoritmos de IA (STTN, L...
7 meses atrás
03.4K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Baixe rapidamente o vídeo WeChat Video No., compatível com vários formatos e plataformas

Introdução abrangente O WeChat Video No. Downloader é um projeto de código aberto criado para ajudar os usuários a baixar rapidamente o conteúdo de vídeo dos números de vídeo do WeChat. A ferramenta é compatível com vários formatos e plataformas de vídeo, e os usuários podem usá-la facilmente nos sistemas Windows e macOS. O projeto foi desenvolvido pela ltaoo e hospedado no...
7 meses atrás
02.7K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: inteligências interativas automatizadas de mídia social que pesquisam, curtem e deixam mensagens automaticamente

Introdução geral O Riona-AI-Agent é uma ferramenta inovadora de automação alimentada por IA, projetada especificamente para gerenciar e otimizar as operações das principais plataformas de mídia social. O projeto utiliza modelos avançados de IA para plataformas como Instagram, Twitter e GitHub para fornecer...
7 meses atrás
08.3K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: análise de documentos de formato complexo e extração de dados multimodais em metadados e texto

Introdução abrangente O NV Ingest (NVIDIA Ingest) é um conjunto de microsserviços de acesso antecipado projetado para analisar centenas de milhares de PDFs não estruturados complexos e confusos e outros documentos corporativos. Ele pode converter esses documentos em metadados e texto para serem incorporados à recuperação...
7 meses atrás
02.9K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: uma estrutura de código aberto para executar inteligências de IA para navegar na Web, permitindo que a IA manipule automaticamente as páginas da Web

Introdução geral A interface do usuário da Web do Browser Use é um projeto inovador de código aberto que se concentra em fornecer aos agentes de IA recursos de interação com o navegador como uma ferramenta de interface gráfica. O projeto foi desenvolvido com base na estrutura principal do Browser Use, desenvolvida com o Gradio ...
2 meses atrás
04.4K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA e LangChain lançam: um guia avançado para escrever relatórios estruturados para análise, permitindo a geração de relatórios técnicos orientados por IA

Introdução geral Este é um projeto de blueprint de geração de relatórios estruturados co-desenvolvido pela LangChain e pela NVIDIA, apresentado em um tutorial de notebook Jupyter no GitHub. O projeto utiliza técnicas avançadas de IA, especificamente o Llama-3.3-7...
4 meses atrás
02.3K
BrownChat:开源实时语音聊天的AI助手

BrownChat: assistente de IA de bate-papo por voz em tempo real de código aberto

Introdução geral O BrownChat é um aplicativo de bate-papo com áudio em tempo real baseado na tecnologia LLM (Large Language Modelling). Desenvolvido pelo usuário do GitHub sugarforever, o projeto tem como objetivo aprimorar a experiência de comunicação do usuário por meio da tecnologia avançada de processamento de linguagem natural.
7 meses atrás
02.4K
Lecca:无代码构建AI智能体与AI工作流构建平台

Lecca: Criando inteligência de IA e plataformas de criação de fluxo de trabalho de IA sem código

Introdução abrangente O Lecca é uma plataforma de IA avançada que permite aos usuários configurar e implementar modelos de linguagem grande (LLMs) com várias ferramentas e fluxos de trabalho. Os usuários podem criar, personalizar e automatizar facilmente seus agentes de IA. O Lecca oferece uma ampla seleção de provedores e modelos de IA...
5 meses atrás
02.5K