Projeto de código aberto de IA

Total de 1020 artigos
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: inclusão automática de sites e suporte para o site de navegação multilíngue de ferramentas de IA de código aberto

Introdução geral O AigoTools é um software de código aberto de navegação de sites da Web com IA, projetado para ajudar os usuários a criar e gerenciar rapidamente sites de navegação. Ele tem gerenciamento de site integrado e recursos de inclusão automática baseados em IA, suporte para vários idiomas, alternância de tema claro/escuro e otimização de SEO.
10 meses atrás
02.9K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: a API do modelo Gemini é compatível com o formato OpenAI, desbloqueando restrições de região e oferecendo suporte à pesquisa de chaves de várias APIs.

Introdução abrangente O Gemini Balance é um serviço proxy de API OpenAI desenvolvido com base na estrutura FastAPI, com o objetivo de fornecer recursos eficientes de otimização e gerenciamento de chaves de várias APIs. O projeto é compatível com as chamadas do modelo Gemini, e os principais recursos incluem...
4 meses atrás
02.9K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: Adicionando som sincronizado e vívido a um vídeo silencioso

Introdução geral O FoleyCrafter é um projeto de código aberto desenvolvido pelo OpenMMLab para gerar efeitos sonoros vívidos e sincronizados para vídeos silenciosos. O projeto usa técnicas avançadas de inteligência artificial para gerar efeitos sonoros semanticamente relevantes e sincronizados com o tempo, analisando o conteúdo do vídeo...
8 meses atrás
02.9K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: ferramenta inteligente projetada para analisar dados tabulares complexos

Introdução abrangente O TableGPT Agent é uma ferramenta inteligente baseada no projeto de código aberto do GitHub, projetado para processar e analisar dados tabulares. Ele se baseia no TableGPT2 Big Language Model e usa a interação de linguagem natural para permitir que os usuários consultem, manipulem e...
6 meses atrás
02.9K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: a partir de texto e imagens para gerar gráficos vetoriais SVG projeto de código aberto

Introdução geral O OmniSVG é um projeto de código aberto voltado para a geração de gráficos vetoriais (SVG) de alta qualidade por meio de um modelo multimodal. Ele usa modelos visual-linguísticos pré-treinados para dar suporte à geração de SVG a partir de descrições textuais ou entradas de imagens, abrangendo uma ampla gama de cenários, desde ícones simples até personagens complexos de anime. Itens ...
4 meses atrás
02.9K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela em tempo real e forneçam...
7 meses atrás
02.9K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

light card: ferramenta geradora de cartões HTML5, crie belos cartões de conteúdo com ferramentas simples

Descrição geral O lightcard é uma ferramenta simples e elegante de geração de cartões projetada para ajudar os usuários a criar facilmente belos cartões de conteúdo. A ferramenta suporta conteúdo de texto personalizado, vários estilos de tema e códigos QR para tornar a criação mais fácil e divertida. Os usuários podem editar o título, o corpo e o autor...
8 meses atrás
02.9K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy: conteúdo de várias fontes para ferramenta de conversação de áudio multilíngue, uma alternativa de código aberto aos recursos de podcasting do NotebookLM

Introdução geral O Podcastfy é um pacote Python de código aberto que usa a tecnologia GenAI (Generative Artificial Intelligence, Inteligência Artificial Generativa) para converter conteúdo da Web, arquivos PDF, texto, imagens, vídeos do YouTube e muitas outras fontes em...
10 meses atrás
02.9K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: assistente de programação inteligente executado em um terminal de linha de comando, alternativa localizada para o interpretador de código ChatGPT

Introdução abrangente O GPTMe é uma ferramenta revolucionária de assistente de IA de terminal projetada para aumentar a eficiência do trabalho dos desenvolvedores. Ele combina perfeitamente recursos avançados de IA com o ambiente do terminal, oferecendo suporte a diversas funções, como execução de código, edição de arquivos, navegação na Web e reconhecimento visual. Como solução de código do ChatGPT...
8 meses atrás
02.9K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK de quadro branco de tela ilimitada de código aberto, IA para gerar wireframes minimalistas e diagramas UML

Descrição geral O tldraw é uma ferramenta de desenho colaborativo gratuita e instantânea que oferece uma tela ilimitada onde os usuários podem desenhar gráficos, escrever textos e colaborar instantaneamente. Com uma interface intuitiva e excelente desempenho, ele é adequado para colaboração em equipe e trabalho remoto. Com suporte da comunidade de código aberto, o tldr...
9 meses atrás
02.8K
QAnything:高度集成RAG处理流程的本地知识库问答系统

QAnything: sistema de perguntas e respostas da base de conhecimento local com fluxo de processamento de RAG altamente integrado

QAnything Introdução abrangente O QAnything (Question and Answer based on Anything) é um sistema local de perguntas e respostas baseado em conhecimento lançado pela NetEase, que suporta todos os tipos de formatos de arquivos e bancos de dados e pode ser instalado e usado off-line....
11 meses atrás
02.8K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Assistente de correção de pronúncia em inglês

Introdução geral O Gemini Teacher é um assistente de prática de conversação em inglês baseado na IA do Google Gemini. Ele reconhece a pronúncia em inglês do usuário em tempo real e fornece feedback instantâneo e sugestões de correção. A ferramenta foi projetada para ajudar os usuários a melhorar suas habilidades de fala em inglês por meio de...
6 meses atrás
02.8K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: uma estrutura leve e flexível para corpos inteligentes, com configuração simples de funções e ferramentas para lidar com várias cargas de tarefas

Introdução geral O Bambo é um novo tipo de estrutura de proxy, que é mais leve e mais flexível do que as estruturas convencionais e pode lidar com uma variedade de tarefas de carga. O Bambo obtém uma funcionalidade de proxy eficiente definindo todas as ferramentas no catálogo de ferramentas e usando funções personalizadas assíncronas. Os usuários podem usar o llm_c...
8 meses atrás
02.8K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: implementação rápida de desduplicação de texto semântico para melhorar a eficiência da limpeza de dados

Introdução abrangente O SemHash é uma ferramenta leve e flexível para eliminar a duplicação de conjuntos de dados por similaridade semântica. Ele combina a rápida geração de incorporação do Model2Vec com a eficiente pesquisa de similaridade ANN (vizinho mais próximo aproximado) do Vicinity.SemHa...
7 meses atrás
02.8K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: extrai quaisquer dados não estruturados de documentos/multimídia e os analisa em dados estruturados

Introdução geral O OmniParse é uma poderosa plataforma de análise e otimização de dados projetada para transformar quaisquer dados não estruturados em dados estruturados e acionáveis otimizados para a estrutura GenAI (Generative Artificial Intelligence). Não importa se você está trabalhando com documentos, tabelas, imagens, vídeos, arquivos de áudio ou...
9 meses atrás
02.8K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: fornecendo uma solução eficiente de gateway de IA para simplificar o gerenciamento de microsserviços e aumentar a segurança

Introdução abrangente O Higress é um gateway de API nativo da nuvem desenvolvido pela Alibaba, com base no Istio e no Envoy, projetado para fornecer soluções eficientes de agendamento de tráfego, governança de serviços e segurança. Ele oferece suporte a extensões de plug-in Wasm para várias linguagens de programação para negócios de IA...
9 meses atrás
02.8K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview: um macromodelo de diálogo de fala antropomórfico de ponta a ponta para interação em tempo real

O SpeechGPT 2.0-preview é o primeiro sistema de interação antropomórfica em tempo real introduzido pelo OpenMOSS, que é treinado com base em milhões de horas de dados de fala. O sistema é equipado com expressão falada antropomórfica e resposta de baixa latência de 100 ms, oferecendo suporte à interação natural e suave em tempo real...
6 meses atrás
02.8K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: um editor de código colaborativo multijogador de alto desempenho desenvolvido pela Rust

Introdução geral O Zed é um editor de código colaborativo multiusuário de alto desempenho, desenvolvido pelos criadores do Atom e do Tree-sitter. Escrito na linguagem Rust, o Zed foi projetado para proporcionar uma experiência de codificação rápida e fluida. Seus principais recursos incluem suporte para multijogadores...
8 meses atrás
02.8K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: um assistente inteligente para mídias sociais que gera e gerencia automaticamente o conteúdo das mídias sociais

Introdução geral O Social Media Agent (Agente de mídia social) é um projeto de código aberto que gerencia as informações de interação pela nova Caixa de entrada do agente, projetado para ajudar os usuários a automatizar a geração e o gerenciamento de conteúdo de mídia social. O projeto foi desenvolvido pela equipe da LangChain...
7 meses atrás
02.8K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: uma ferramenta de código aberto para melhorar a qualidade da geração de imagens e vídeos

Introdução abrangente O CFG-Zero-star é um projeto de código aberto desenvolvido por Weichen Fan e pela equipe do S-Lab da Universidade Tecnológica de Nanyang. Ele se concentra no aprimoramento da técnica CFG (Classifier Free Guidance) em modelos de correspondência de fluxo por meio da otimização da estratégia de orientação e do zero-inicial ...
5 meses atrás
02.8K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: geração de mundos 3D exploráveis em 360° a partir de uma única imagem (código progressivamente de código aberto)

Introdução geral O GenEx é um modelo avançado de IA capaz de gerar um mundo 3D 360° totalmente explorável a partir de uma única imagem. Os usuários podem explorar interativamente esse mundo gerado. O GenEx ultrapassa os limites da IA figurativa no espaço imaginativo e tem o potencial de...
8 meses atrás
02.8K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

Galeria de desenvolvimento de IA: Conjunto de ferramentas de desenvolvimento de modelos de IA nativos do Windows, integração de modelos do lado final em aplicativos do Windows

Introdução geral O AI Dev Gallery é um aplicativo de ferramentas de desenvolvimento de IA da Microsoft (atualmente em visualização pública) projetado para desenvolvedores do Windows. Ele fornece uma plataforma abrangente para ajudar os desenvolvedores a integrar facilmente os recursos de IA em seus...
7 meses atrás
02.8K
Pyramid Flow:快手推出的开源版

Pyramid Flow: uma versão de código aberto do "Kringle" lançada pela Racer, baseada no SD3 e executada em GPUs com menos de 8 GB (versão de implantação com um clique)

Introdução abrangente O Pyramid Flow é um método eficiente de geração de vídeo autorregressivo baseado na técnica de correspondência de fluxo. O método alcança maior eficiência computacional na geração e descompressão de conteúdo de vídeo por meio da interpolação entre diferentes resoluções e níveis de ruído...
9 meses atrás
02.8K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: uma ferramenta de código aberto para facilitar a implantação de modelos de IA multimodais

Introdução geral O Aana SDK é uma estrutura de código aberto desenvolvida pela Mobius Labs, batizada com o nome da palavra malaiala ആന (elefante). Ele ajuda os desenvolvedores a implementar e gerenciar rapidamente modelos de IA multimodais, oferecendo suporte ao processamento de texto, imagens, áudio e vídeo e outros dados...
5 meses atrás
02.8K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: uma estrutura de corpo inteligente para a criação de dispositivos inteligentes multimodais

Introdução abrangente O OmAgent é uma estrutura de corpo inteligente multimodal desenvolvida pelo Om AI Lab, com o objetivo de fornecer recursos avançados baseados em IA para dispositivos inteligentes. Ao integrar modelos de base multimodais de última geração e algoritmos de corpo inteligente, o projeto permite que os desenvolvedores criem dispositivos inteligentes eficientes em uma variedade de...
7 meses atrás
02.8K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: uma plataforma de diálogo de análise de dados para consultas de dados e geração de gráficos em linguagem natural

Introdução geral O PandasAI é uma plataforma de código aberto baseada em Python projetada para simplificar o processo de análise de dados por meio de técnicas de processamento de linguagem natural. Permite que os usuários trabalhem em um diálogo com bancos de dados (por exemplo, SQL, CSV, pandas, polars, mongodb, n...
9 meses atrás
02.8K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: geração de pesquisa de IA com base em conteúdo de pesquisa na Web

Introdução geral O Open Deep Research é uma ferramenta de geração de relatórios de pesquisa orientada por IA de código aberto como uma alternativa de código aberto aos recursos de pesquisa profunda do Google Gemini. O projeto é desenvolvido em TypeScript e baseado no Next.js 1...
4 meses atrás
02.8K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter: gerar ilustrações gráficas contínuas e consistentes com base em uma longa história.

Introdução geral O Story-Adapter é uma estrutura inovadora de visualização de histórias que converte histórias textuais em sequências de imagens coerentes. Desenvolvido por pesquisadores, esse projeto emprega uma abordagem iterativa que não requer treinamento para gerar ilustrações de histórias de alta qualidade. A estrutura é caracterizada por sua capacidade de lidar com longas...
7 meses atrás
02.8K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: cliente de análise e visualização de dados de IA para geração rápida de gráficos e relatórios

Introdução geral O DataLine é uma poderosa ferramenta de análise e visualização de dados de IA projetada para ajudar os usuários a interagir com uma variedade de fontes de dados por meio de operações simples. Seja um arquivo CSV ou um banco de dados convencional, como Postgres, MySQL, Snowflake, SQL...
6 meses atrás
02.8K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: gere cópias de vídeo e vídeos curtos em HD com um clique, inserindo um tema de vídeo

Introdução abrangente O MoneyPrinterTurbo é um projeto de código aberto que usa tecnologia avançada de modelo grande de IA para realizar a função de gerar vídeos HD curtos com um clique. Os usuários só precisam fornecer um tema de vídeo ou palavras-chave e o sistema gerará automaticamente cópias de vídeo, clipes de vídeo, legendas de vídeo e...
5 meses atrás
02.8K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: Ferramenta avançada de incorporação e extração de marca d'água oculta em vídeo de código aberto para proteger os direitos autorais de vídeo

Introdução geral O VideoSeal é uma ferramenta de marca d'água de vídeo de código aberto desenvolvida pela Facebook Research, projetada para fornecer incorporação e extração eficientes de marcas d'água de vídeo. A ferramenta é compatível com os modelos de código aberto mais recentes e contém modelos pré-treinados, código de treinamento, código de inferência e ferramentas de avaliação...
8 meses atrás
02.8K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: permite que os usuários consultem bancos de dados SQLite e arquivos CSV/JSON para obter dados de consulta

Introdução geral O SQLite-Utils-Ask é uma ferramenta avançada criada para ajudar os usuários a realizar consultas de dados com perguntas e respostas em bancos de dados SQLite e arquivos CSV/JSON com o auxílio do LLM (Large Language Model). A ferramenta é capaz de gerar automaticamente perguntas para o usuário com base em...
9 meses atrás
02.8K
Data Formulator:AI驱动的数据可视化工具

Data Formulator: uma ferramenta de visualização de dados orientada por IA

Introdução geral O Data Formulator é uma ferramenta de visualização de dados orientada por IA de código aberto desenvolvida pela Microsoft Research. A ferramenta combina uma interface gráfica de usuário (GUI) e entrada de linguagem natural (NL) para permitir que os usuários criem e iterem rapidamente por meio de interações e comandos simples...
6 meses atrás
02.8K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: Ferramenta de edição de vídeo de retratos falados em 3D com reconhecimento de profundidade e orientada por áudio

Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução 3D e métodos de extração de recursos de áudio para capturar com precisão as características de identidade do locutor e a expressão...
7 meses atrás
02.8K
Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

Introdução abrangente O Vision Parse é uma ferramenta revolucionária de processamento de documentos, que combina de forma inteligente a mais avançada tecnologia de modelos de linguagem visual (Vision Language Models), a capacidade de converter documentos PDF de forma inteligente em um formato Markdown de alta qualidade...
8 meses atrás
02.8K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Baixe rapidamente o vídeo WeChat Video No., compatível com vários formatos e plataformas

Introdução abrangente O WeChat Video No. Downloader é um projeto de código aberto criado para ajudar os usuários a baixar rapidamente o conteúdo de vídeo dos números de vídeo do WeChat. A ferramenta é compatível com vários formatos e plataformas de vídeo, e os usuários podem usá-la facilmente nos sistemas Windows e macOS. O projeto foi desenvolvido pela ltaoo e hospedado no...
7 meses atrás
02.8K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: base de conhecimento conversacional baseada em GraphRAG/ferramenta de pesquisa profunda na Web com diálogos que podem ser integrados a outros sites

Introdução geral O AutoFlow é uma ferramenta de código aberto desenvolvida pela PingCAP para criar bases de conhecimento baseadas em gráficos com armazenamento vetorial sem servidor TiDB. Ele integra as estruturas LlamaIndex e DSPy para oferecer suporte à pesquisa de diálogos complexos e ao gráfico de conhecimento...
7 meses atrás
02.8K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: criação de uma estrutura de desenvolvimento de aplicativos de dados nativos de IA, integrando gerenciamento de vários modelos e processamento inteligente de dados

Introdução abrangente O DB-GPT é uma estrutura de desenvolvimento de aplicativos de dados nativos de IA de código aberto criada usando AWEL (Agentic Workflow Expression Language) e tecnologias de corpo inteligente. O projeto tem como objetivo criar uma infraestrutura no campo de grandes modelos...
5 meses atrás
02.8K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3: modelo de imagem de geração de texto de difusão em cascata de código aberto do Wisdom Spectrum

Introdução abrangente O CogView3 é um sistema avançado de imagens geradas por texto desenvolvido pela Universidade de Tsinghua e pela Think Tank Team (Chi Spectrum Qingyan). Ele se baseia em um modelo de difusão em cascata e gera imagens de alta resolução em vários estágios. Os principais recursos do CogView3 incluem geração em vários estágios, arquitetura inovadora e desempenho eficiente...
10 meses atrás
02.8K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Ferramenta de monitoramento de degradação do serviço ChatGPT: Detecção de degradações do serviço ChatGPT

Introdução abrangente A ferramenta de monitoramento de degradação do serviço ChatGPT é um projeto de código aberto criado para ajudar os usuários a detectar se o serviço ChatGPT foi degradado devido a IPs de alto risco. A ferramenta analisa os valores de dificuldade do Proof of Work (PoW) para determinar se os usuários...
8 meses atrás
02.8K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: simulação de inteligência múltipla de interações de mídia social de milhões de usuários para estudar fenômenos sociais complexos

Introdução geral O OASIS (Open Agent Social Interaction Simulations) é um simulador de mídia social de código aberto capaz de simular o comportamento de até um milhão de usuários. A plataforma combina um modelo de linguagem em grande escala com um modelo baseado em regras...
5 meses atrás
02.8K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: geração de modelos de conversão de texto em fala específicos do locutor a partir do texto de entrada

Introdução geral O Parler-TTS é uma biblioteca de modelos de conversão de texto em fala (TTS) de código aberto desenvolvida pela Hugging Face, projetada para gerar fala de alta qualidade e com som natural. O modelo é capaz de gerar fala com base no texto de entrada com um estilo de locutor específico (por exemplo, gênero, tom, estilo de fala...).
6 meses atrás
02.8K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Introdução geral O X-Dyna é um projeto de código aberto desenvolvido pela ByteDance que visa gerar animações dinâmicas de retratos por meio de técnicas de difusão de amostra zero. O projeto usa expressões faciais e movimentos corporais em vídeos de unidades para animar imagens de retratos individuais, gerando efeitos de movimento realistas e sensíveis ao contexto.
7 meses atrás
02.8K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank: gerenciamento de orçamento diário com tecnologia de IA para facilitar o acompanhamento de orçamentos diários

Descrição geral O Porkybank é um aplicativo de gerenciamento de finanças pessoais de código aberto desenvolvido para ajudar os usuários a controlar facilmente seu orçamento diário. Com uma fórmula simples (Renda - Despesas) / Dias = Dinheiro, os usuários podem visualizar sua situação financeira. O projeto está hospedado no GitHu...
7 meses atrás
02.8K
GaiaNet node:安装和运行自己的本地模型在线代理服务

Nó GaiaNet: instale e execute seu próprio serviço de proxy on-line de modelo local

Introdução geral O GaiaNet-AI/gaianet-node é um projeto de código aberto que permite aos usuários instalar rapidamente a pilha de software de nó padrão no Mac, Linux ou Windows WSL com um único comando. Os usuários podem inicializar os nós, personalizar as configurações, fazer download...
11 meses atrás
02.8K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Agent Laboratory: código automatizado e assistente de redação de estudos para pesquisadores

Introdução abrangente O Agent Laboratory é um fluxo de trabalho de pesquisa autônomo de ponta a ponta projetado para ajudar os pesquisadores a concretizar suas ideias de pesquisa. O sistema consiste em agentes dedicados, orientados por modelos de linguagem em grande escala, que dão suporte a todo o fluxo de trabalho de pesquisa, desde a realização de revisões de literatura e desenvolvimento de planos até a execução...
4 meses atrás
02.8K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: converte PDF em podcasts de ferramentas de código aberto

Introdução geral O Open NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto Large Language Model (LLM) e Text-to-Speech (TTS) para processar o conteúdo do PDF e gerar um diálogo natural adequado para podcasts de áudio...
6 meses atrás
02.8K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Corrige cadeias de caracteres JSON inválidas e resolve possíveis erros de formatação em dados JSON gerados por LLMs.

Descrição geral Um módulo para corrigir arquivos JSON inválidos, especialmente para analisar dados JSON incorretos gerados por LLMs (Large Language Models). O módulo corrige erros comuns de sintaxe JSON, como aspas ausentes, vírgulas incorretas, caracteres sem escape e valores-chave incompletos...
10 meses atrás
02.8K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: uma estrutura de diálogo de fala em tempo real com suporte a vários idiomas e sotaques para modelos de base de diálogo de fala

Introdução geral O Moshi Chat é um assistente de voz de IA em tempo real de ponta a ponta da Kyutai, um laboratório francês de IA sem fins lucrativos. Ele não apenas ouve em tempo real, mas também se envolve em conversas naturais e oferece suporte a interações multimodais, incluindo a capacidade de ver, ouvir e falar.Moshi Ch...
11 meses atrás
02.8K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: uma ferramenta baseada em gráficos heterogêneos para recuperação e geração de informações precisas

Uma introdução abrangente O NodeRAG é um sistema RAG (Retrieval Augmented Generation) de código aberto hospedado no GitHub e desenvolvido por Terry-Xu-666. Ele otimiza a recuperação e a geração de informações por meio de estruturas gráficas heterogêneas, melhorando significativamente a precisão da recuperação e a relevância contextual.
4 meses atrás
02.8K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: um assistente de IA que oferece suporte à pesquisa profunda multilíngue

Introdução abrangente A Deep Research Web UI é uma ferramenta de assistente de pesquisa de código aberto baseada em tecnologia de IA, projetada para ajudar os usuários a realizar pesquisas iterativas profundas sobre qualquer tópico. Ele combina o poder dos mecanismos de pesquisa, o rastreamento da Web e a modelagem de linguagem em larga escala por meio de uma interface intuitiva na Web...
4 meses atrás
02.8K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Serviço de proxy de back-end do Copilot: assumir o servidor de plug-in do GitHub Copilot com outros modelos

Introdução geral O Copilot Backend Agent Service é um projeto de código aberto desenvolvido para gerenciar o servidor de plug-in do Copilot do GitHub, aproveitando outros modelos de FIM, como o DeepSeek, e oferecendo suporte a várias pessoas que compartilham contas oficiais. O serviço oferece suporte a uma variedade de IDEs, incluindo o V...
8 meses atrás
02.8K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Geração de relatórios: gere relatórios detalhados sobre qualquer tópico personalizado, como análise de negócios, relatórios de fim de ano, etc.

Descrição geral O Report mAIstro é uma ferramenta avançada projetada para ajudar os usuários a criar facilmente relatórios personalizados por meio da tecnologia de processamento de linguagem natural. A ferramenta utiliza a tecnologia LangChain para transformar tópicos e estruturas fornecidos pelo usuário em relatórios detalhados...
4 meses atrás
02.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: estrutura de mecanismo de pesquisa de IA de código aberto para implementar seu próprio mecanismo de pesquisa Perplexity!

Introdução abrangente O MindSearch é uma estrutura de mecanismo de busca de IA de código aberto lançada pelo Laboratório de Inteligência Artificial de Xangai (SAL), cujo objetivo é simular o processo de pensamento humano para coleta e integração de informações complexas. A ferramenta combina as tecnologias avançadas de modelagem de linguagem em larga escala (LLM) e mecanismos de busca por meio de inteligência múltipla...
8 meses atrás
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: uma ferramenta de código aberto para extração e exploração eficientes de dados estruturados

Introdução abrangente A Knowledge Table (Tabela de conhecimento) é um projeto de código aberto criado para simplificar o processo de extração e exploração de dados estruturados de documentos não estruturados. Os usuários podem criar representações de conhecimento estruturado, como tabelas e gráficos, por meio de uma interface de consulta em linguagem natural. A ferramenta permite personalizar a extração ...
10 meses atrás
02.8K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: um cliente de diálogo de IA que usa a inteligência do MCP para executar tarefas complexas

Introdução geral O HyperChat é um cliente de bate-papo de código aberto desenvolvido pelo BigSweetPotatoStudio e hospedado no GitHub, projetado para fornecer uma visão geral abrangente do modelo de linguagem do BigSweetPotatoStudio, integrando APIs de vários modelos de linguagem grandes (LLMs), como OpenAI, Cla...
5 meses atrás
02.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: criação de gráficos de conhecimento e mecanismos de pesquisa pessoal executados localmente

Introdução geral O Unigraph é um mecanismo de pesquisa pessoal e gráfico de conhecimento de propósito geral local, projetado para fornecer aos usuários um espaço de trabalho integrado para ajudar a gerenciar e pesquisar uma ampla variedade de dados em suas vidas pessoais. Com o Unigraph, os usuários podem integrar dados de diferentes fontes em um...
7 meses atrás
02.8K
Vector Vein(向量脉络):无代码AI工作流构建平台

Vector Vein: plataforma de criação de fluxo de trabalho de IA sem código

Introdução abrangente O Vector Vein é uma plataforma de criação de fluxos de trabalho de IA sem código, projetada para ajudar os usuários a criar facilmente fluxos de trabalho inteligentes e automatizados. Sem necessidade de base de programação, os usuários podem simplesmente conectar vários módulos funcionais por meio de operações de arrastar e soltar para criar fluxos de trabalho de IA complexos...
8 meses atrás
02.8K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: criando mini-inteligências LLM com "estrutura de gráfico direcionado" em 100 linhas de código

Introdução geral O miniLLMFlow é uma estrutura de desenvolvimento minimalista do Large Language Model (LLM) que contém apenas 100 linhas de código principal, demonstrando a filosofia de design de "manter a simplicidade". A estrutura foi projetada especificamente para permitir que os assistentes de IA (por exemplo, ChatGPT, Claude etc.)...
7 meses atrás
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automação de e-mail com IA localizada para geração rápida de respostas de rascunho de e-mail (Gmail)

Introdução geral O LAMBDA (Local Auto MailBox Draft Assistant) é um sistema de automação de e-mail com IA localizada, projetado para aprender com o estilo de e-mail do usuário e gerar um rascunho para cada e-mail não lido na caixa de entrada do Gmail...
8 meses atrás
02.8K
基于RAG构建提供健康建议的小助手(实验项目)

Construção, com base em RAG, de um mini-assistente que fornece orientação sobre saúde (projeto piloto)

Introdução geral O LLM-RAG-Longevity-Coach é um chatbot baseado nas tecnologias Large Language Modelling (LLM) e Retrieval Augmented Generation (RAG), projetado para fornecer conselhos personalizados sobre saúde e longevidade aos usuários. O projeto foi desenvolvido por Tyler Burle...
6 meses atrás
02.8K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicativo da Web de bate-papo de IA de código aberto com upload de documentos e suporte a vários modelos

Introdução geral O Zola é um aplicativo de bate-papo com IA gratuito e de código aberto desenvolvido pelo desenvolvedor Julien Thibeaut (nome de usuário ibelick do GitHub) e hospedado no GitHub. Seu melhor recurso é que ele suporta vários modos de IA...
4 meses atrás
02.7K
Flock:低代码工作流编排快速构建聊天机器人

Flock: orquestração de fluxo de trabalho com pouco código para criar chatbots rapidamente

Introdução geral O Flock é uma plataforma de código aberto de baixo código para fluxo de trabalho, hospedada no GitHub e desenvolvida pela equipe da Onelevenvy. Ela se baseia nas tecnologias LangChain e LangGraph e se concentra em ajudar os usuários a criar rapidamente máquinas de bate-papo...
6 meses atrás
02.7K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: implantação sem servidor de um site de diálogo multimodal Gemini

Introdução geral O Gemini Playground é um projeto de código aberto criado para ajudar os usuários a implementar rapidamente um site de diálogo multimodal. O projeto é desenvolvido por um técnico de rastreamento de camarão, com suporte ao uso da chave da API Gemini em 10 segundos para concluir a implantação. Se o usuário estiver ...
6 meses atrás
02.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: um conjunto completo de ferramentas para a criação de inteligências de IA com base no LangGraph

Introdução abrangente O AI Agent Service Toolkit é um conjunto de ferramentas completo baseado em LangGraph, FastAPI e Streamlit, projetado para ajudar os desenvolvedores a criar e executar rapidamente serviços de agente de IA. O kit de ferramentas fornece um...
7 meses atrás
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extração e categorização de documentos em dados estruturados para otimizar o processo de manuseio de documentos

Introdução abrangente O ExtractThinker é uma ferramenta flexível de inteligência de documentos que extrai e classifica dados estruturados de documentos usando Modelos de Linguagem Grandes (LLMs), fornecendo um fluxo de trabalho de processamento de documentos semelhante ao ORM. Ele é compatível com vários carregadores de documentos, incluindo o Tess...
7 meses atrás
02.7K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: um modelo para gerar diretamente vocais de rap (Rap) a partir de letras e faixas de apoio (conjunto de dados atualmente aberto)

Introdução geral O RapBank é um conjunto de dados e ferramentas projetado para a geração de letras de músicas de rap. O projeto foi criado pela NZqian para fornecer a pesquisadores e desenvolvedores dados de alta qualidade sobre letras de rap, coletando e processando músicas de rap do YouTube...
8 meses atrás
02.7K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: uma interface de gerenciamento para interação humano-computador com inteligências de IA

Introdução geral O Agent Inbox é um projeto de código aberto desenvolvido pela equipe da LangChain para proporcionar uma nova experiência de usuário na interação com inteligências de IA. O projeto permite que os usuários gerenciem e otimizem as interações com várias inteligências de IA por meio de uma interface centralizada.Ag...
7 meses atrás
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: um ambiente de programação visual de código aberto para testar e avaliar a eficácia de grandes dicas de modelos de linguagem

Introdução geral O ChainForge é um ambiente de programação visual de código aberto projetado para testar e avaliar a eficácia de dicas de modelos de linguagem ampla (LLM). Ele oferece um ambiente de engenharia de dicas de fluxo de dados por meio do qual os usuários podem explorar e analisar rapidamente a qualidade de diferentes dicas na resposta do LLM...
8 meses atrás
02.7K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: baseado no modelo de OCR multimodal de ponta a ponta QWen2 0.5B

Introdução abrangente O GOT-OCR2.0 é um modelo de reconhecimento óptico de caracteres (OCR) de código aberto co-proposto pela StepStar, cujo objetivo é impulsionar a tecnologia de OCR em direção ao OCR-2.0 por meio de um modelo unificado de ponta a ponta. O modelo oferece suporte a uma ampla variedade de tarefas de OCR, incluindo reconhecimento de texto normal, gr...
11 meses atrás
02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: serviço de armazenamento e recuperação de documentos baseado em incorporação visual

Introdução geral O ColiVara é um serviço de armazenamento e recuperação de documentos baseado na tecnologia de incorporação visual. Ele elimina a necessidade de reconhecimento óptico de caracteres (OCR) ou de extração de texto e evita os problemas de formulários quebrados ou imagens perdidas. O ColiVara é compatível com mais de 100 formatos de arquivo, incluindo PDF...
6 meses atrás
02.7K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atômicos: uma estrutura para criar inteligências de IA modulares e leves

Introdução geral O Atomic Agents é uma estrutura extremamente leve e modular projetada com base no conceito de atomicidade para a criação de pipelines e aplicativos de IA de agentes. A estrutura oferece um conjunto de ferramentas e agentes que podem ser combinados para criar aplicativos avançados. Ela se baseia no Instruc...
8 meses atrás
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: o Wisdom Spectrum lançou um modelo avançado para a geração de textos ultralongos, suportando a geração de mais de 10.000 palavras em uma única conversa.

Introdução abrangente O LongWriter é uma poderosa ferramenta de geração de textos longos desenvolvida pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM). A ferramenta é baseada no avançado Modelo de Linguagem de Contexto Longo (LLM) e é capaz de gerar textos longos com mais de 10.000 palavras.
8 meses atrás
02.7K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: tecnologia revolucionária de geração de imagens de altíssima resolução com riqueza de detalhes de imagem

Introdução geral O UltraPixel é uma tecnologia avançada de geração de imagens de resolução ultra-alta projetada para criar imagens de altíssima qualidade e ricas em detalhes. Ela foi desenvolvida pelo usuário catcathh do GitHub e apresentada no NeurIPS 2024.U...
10 meses atrás
02.7K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: uma ferramenta de IA para analisar as relações entre personagens de livros e gerar gráficos

Introdução geral O Austen é uma ferramenta de IA de código aberto que usa a estrutura Angular e a inicialização Analogjs, combinada com a tecnologia Mermaidjs para gerar gráficos que ajudam os usuários a analisar as relações entre personagens em livros. Os usuários podem entrar no Open...
4 meses atrás
02.7K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: extrai dados do corpo do URL HTML, produz texto simples/markdown

Introdução geral magic-html é uma biblioteca Python projetada para simplificar o processo de extração do conteúdo da região do corpo do HTML. Seja lidando com estruturas complexas de HTML ou com páginas da Web simples, essa biblioteca tem como objetivo fornecer uma interface conveniente e eficiente para os usuários. Ela oferece suporte à extração multimodal...
11 meses atrás
02.7K