Projeto de código aberto de IA

Total de 1020 artigos
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível

Introdução geral O TRELLIS é um modelo de geração de ativos 3D em grande escala desenvolvido pela Microsoft. Ele é capaz de receber solicitações de texto ou imagem e gerar ativos 3D de alta qualidade em vários formatos, como campos radiais, Gaussianos 3D e malhas.
8 meses atrás
03.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: estrutura de orquestração de corpos inteligentes com suporte a agentes RAG e LLM para simplificar o desenvolvimento de aplicativos de IA

Introdução abrangente O Dynamiq é uma estrutura de orquestração de IA de código aberto projetada para aplicativos de IA de agentes e Modelagem de Linguagem Ampla (LLM). Seu objetivo é simplificar o desenvolvimento de aplicativos orientados por IA, especialmente na área de Retrieval Augmented Generation (RAG) e na orquestração de agentes LLM.
9 meses atrás
03.5K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter: a alternativa de código aberto e sem censura ao Character.AI

Introdução geral O OpenCharacter é uma ferramenta de criação de personagens de código aberto projetada para oferecer aos usuários uma experiência de interação e criação de personagens de IA ilimitada e sem filtros como uma alternativa ao Character.AI. Os usuários podem criar e executar seus próprios personagens usando modelos nativos ou...
7 meses atrás
03.5K
OpenSPG:开源知识图谱引擎

OpenSPG: Mecanismo gráfico de conhecimento de código aberto

Introdução abrangente O OpenSPG é um mecanismo de gráfico de conhecimento de código aberto desenvolvido pelo Ant Group em colaboração com o OpenKG, com base na estrutura do SPG (Semantic Augmented Programmable Graph). O mecanismo foi projetado para fornecer recursos como representação semântica explícita, definição de regras lógicas e estrutura operacional para dar suporte à construção e ao gerenciamento de gráficos de conhecimento de domínio...
11 meses atrás
03.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: Modelo de aprendizagem profunda para remoção rápida de fundo de imagens e vídeos

Introdução abrangente O BEN2 (Background Erase Network 2) é um modelo de aprendizagem profunda desenvolvido pela Prama LLC, projetado especificamente para remover automaticamente o plano de fundo de uma imagem e gerar uma imagem em primeiro plano. O modelo usa uma inovadora tecnologia Confiden...
2 meses atrás
03.5K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI Portrait Master versão chinesa: ferramenta de palavras-chave para otimizar a geração de retratos

Introdução geral A versão chinesa do ComfyUI Portrait Master é uma ferramenta de geração de palavras-chave de retratos projetada para criadores de imagens de IA. A ferramenta ajuda os usuários a gerar retratos de alta qualidade, otimizando as palavras-chave. Os usuários podem escolher diferentes lentes de acordo com a demanda...
12 meses atrás
03.5K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: projeto de código aberto que imita o diálogo de IA de interação da interface ChatGPT

Introdução geral O LibreChat é uma plataforma de bate-papo com IA gratuita e de código aberto com amplas opções de personalização e suporte para vários provedores, serviços e integrações de IA. Ele reúne todas as conversas de IA em um só lugar com uma interface familiar e recursos inovadores, oferecendo suporte a vários modelos de IA, plug-ins e vários idiomas. Por...
12 meses atrás
03.5K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: o assistente inteligente de código aberto da LangChain para pesquisa profunda

Introdução abrangente O Open Deep Research é um assistente de pesquisa baseado na Web capaz de gerar relatórios de pesquisa abrangentes sobre qualquer tópico. O sistema usa um fluxo de trabalho de planejar e fazer que permite aos usuários planejar e revisar a estrutura do relatório antes de passar para a fase de pesquisa demorada...
4 meses atrás
03.5K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: um mapa de referência de retratos para gerar vídeos consistentes com caracteres, integração rápida de vários terminais

Introdução abrangente O ConsisID é um projeto de código-fonte aberto desenvolvido pelo grupo de Yuan Rong na Universidade de Pequim, com o objetivo de obter geração de texto para vídeo consistente com a identidade (IPT2V) por meio de técnicas de decomposição de frequência. O núcleo do projeto é um sistema DiT (Diffusion Transfor...
8 meses atrás
03.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: converta ebooks em audiolivros, ferramenta de código aberto com suporte multilíngue e clonagem de voz

Introdução geral O ebook2audiobook é uma poderosa ferramenta de código aberto de ebook para audiolivro. Ela é capaz de converter livros eletrônicos em vários formatos em audiolivros com marcadores de capítulos e metadados completos. A ferramenta usa o Calibre para a conversão do formato do livro eletrônico usando o Co...
7 meses atrás
03.5K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: edição inteligente de conteúdo de vídeo em curtas-metragens, fácil de obter extração/corte precisos de clipes de vídeo

Introdução abrangente O FunClip é uma ferramenta de edição de vídeo automatizada, localizada e de código aberto, desenvolvida pelo TONGYI Speech Lab do Alibaba Dharma Institute. A ferramenta integra o modelo de reconhecimento de fala Paraformer-Large de nível industrial, que pode identificar com precisão a fala no vídeo...
7 meses atrás
03.5K
WeWe RSS:生成微信公众号RSS订阅的开源工具

WeWe RSS: ferramenta de código aberto para gerar feeds RSS públicos do WeChat

Introdução abrangente O WeWe RSS é uma ferramenta gratuita de código aberto projetada especificamente para usuários de números públicos do WeChat. Ela captura artigos de números públicos por meio da plataforma de leitura do WeChat e gera feeds RSS para que os usuários possam visualizar o conteúdo a qualquer momento com um leitor de RSS. Essa ferramenta resolve o problema da carta de número público do WeChat...
5 meses atrás
03.5K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: um mecanismo RAG de código aberto baseado na compreensão profunda de documentos, fornecendo fluxos de trabalho de geração aprimorados por recuperação eficientes

Introdução abrangente O RAGFlow é um mecanismo RAG (Retrieval Augmented Generation) de código aberto baseado na tecnologia de compreensão profunda de documentos. Ele fornece um fluxo de trabalho RAG eficiente para empresas de todos os portes, incorporando um modelo de linguagem em grande escala (LLM) que pode fornecer dados em formatos complexos com base em...
7 meses atrás
03.5K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: ferramenta de rastreamento assíncrono da Web de código aberto para extrair dados estruturados sem LLM

Introdução abrangente O Crawl4AI é uma ferramenta de rastreamento assíncrono da Web de código aberto projetada para modelos de linguagem grande (LLMs) e aplicativos de inteligência artificial (IA). Ele simplifica o rastreamento da Web e o processo de extração de dados, oferece suporte ao rastreamento eficiente da Web e fornece formatos de saída compatíveis com LLM para...
9 meses atrás
03.4K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX Video (LTXV): um modelo de código aberto de geração de vídeo em tempo real para gerar vídeo de alta qualidade

Introdução geral O LTX-Video é o primeiro modelo de geração de vídeo em tempo real baseado em DiT (Diffusion Transformer) desenvolvido pela Lightricks. O modelo é capaz de gerar alta qualidade com resolução de 768x512 a 24 quadros por segundo...
7 meses atrás
03.4K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelagem autorregressiva bit a bit da geração de imagens de alta resolução para geração ilimitada de imagens de alta resolução

Introdução geral O Infinity é uma estrutura inovadora de geração de imagens de alta resolução desenvolvida pela equipe da FoundationVision. O projeto rompe as limitações dos modelos tradicionais de geração de imagens por meio de uma abordagem inovadora de modelagem autorregressiva visual em nível de bits...
8 meses atrás
03.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: um assistente de bate-papo com IA localizado compatível com várias plataformas

Introdução geral O NextChat é um serviço revolucionário de bate-papo com IA que permite aos usuários implantar serviços de bate-papo com os melhores modelos de idiomas da categoria, como GPT-3, GPT-4, GPT-4.5 e Gemini Pro. Ele oferece uma interface de usuário elegante, recursos de colaboração, integrações, modelos e...
6 meses atrás
03.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: ferramenta inteligente de processamento de informações da Web, API gratuita para captura de conteúdo da Web

WebPilot Introdução geral O Webpilot é um "assistente da Web" gratuito e de código aberto que permite que você se comunique livremente com qualquer página da Web ou execute tarefas automatizadas. Não é necessário alternar entre páginas ou copiar e colar, basta selecionar o texto ou digitar comandos e o Webpilot...
11 meses atrás
03.4K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan (SiYuan Notes): software de gerenciamento de conhecimento pessoal que prioriza a privacidade com suporte a bate-papo de perguntas e respostas/escrita de IA

Geral: o SiYuan Notes (SiYuan) é um software de gerenciamento de conhecimento pessoal que prioriza a privacidade, é totalmente de código aberto e oferece suporte à auto-hospedagem. Ele é escrito em TypeScript e Golang, fornece referências refinadas em nível de bloco e Markdown WYSIWYG (WYSIWY...
6 meses atrás
03.4K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: Bot do WeChat para envio de notícias, diálogo com IA e gerenciamento de bate-papo em grupo

Introdução abrangente O NGCBot é um mecanismo HOOK baseado no desenvolvimento do projeto de código aberto do robô WeChat, criado pelo desenvolvedor ngc660sec (Yunshan/eXM) e hospedado no GitHub. Após dois anos de iteração, a versão atual do V2.3, a função do robô inicial simples ...
5 meses atrás
03.4K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): geração de ativos 3D de alta resolução, vários fluxos de trabalho de geração de material 3D

Introdução abrangente O Tencent Hunyuan3D (Hunyuan3D 2.0) é um sistema avançado de composição 3D em grande escala da Tencent, projetado para gerar ativos 3D texturizados de alta resolução. O sistema consiste em dois componentes principais: Hunyuan3D-DiT, um modelo de geração de formas em grande escala, e Hunyuan3D-DiT, uma textura em grande escala...
7 meses atrás
03.4K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vídeo híbrido de Vincennes: geração de imagens realistas de vídeo de alta qualidade, geração de vídeo de código aberto da Tencent de modelos grandes

Introdução abrangente O Tencent Mixed Yuan Text Generation Video (disponível no Yuanbao APP) é uma plataforma de geração de vídeo baseada na tecnologia de IA lançada pela Tencent. A plataforma utiliza o Tencent Mixed Yuan Big Model com um poderoso conhecimento de vários domínios e compreensão de linguagem natural para gerar vídeos de alta qualidade com base nas descrições de texto dos usuários...
7 meses atrás
03.4K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: um modelo unificado de geração de imagens com entradas multimodais para gerar imagens consistentes com caracteres

Introdução geral O OmniGen é um modelo "universal" de geração de imagens desenvolvido pela VectorSpaceLab que permite aos usuários criar efeitos visuais diversificados e contextualmente ricos com comandos de texto simples ou entradas multimodais. Ele é particularmente adequado para aplicativos que precisam reconhecer...
9 meses atrás
03.4K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: modelo de alta fidelidade, teste virtual e ajuste de pose de personagens, modelo de geração de imagens de personagens controlados com código aberto

Introdução abrangente O Leffa é uma estrutura unificada para gerar imagens de personagens controláveis, permitindo a manipulação precisa da aparência do personagem (por exemplo, ajuste virtual) e da pose (por exemplo, transferência de pose). A estrutura reduz significativamente a distorção de detalhes refinados, direcionando a consulta de destino para focar na chave de referência correta na camada de atenção, com...
8 meses atrás
03.4K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: projeto de código aberto de reparo de imagens danificadas e zoom de alta definição de imagens, memória de vídeo mínima de 16G

Descrição geral O InstantIR é um modelo inovador de restauração de imagem única desenvolvido pela equipe do InstantX, projetado para ressuscitar suas imagens danificadas com detalhes extremamente realistas e de alta qualidade, capaz de realizar a restauração de alta qualidade de imagens danificadas. A ferramenta não apenas restaura os detalhes da imagem...
9 meses atrás
03.4K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: software de remoção de marca d'água de vídeo sem perdas e legendas rígidas com tecnologia de IA (cliente de remoção de marca d'água de vídeo 7G+)

Introdução abrangente O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas difíceis e marcas d'água de texto de vídeos. A ferramenta usa uma variedade de modelos de algoritmos de IA (STTN, L...
7 meses atrás
03.4K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): mágica de controle de iluminação de imagem, controla a luz, a sombra e o plano de fundo da imagem

Introdução abrangente O IC-Light é um projeto de controle de iluminação de imagens que visa a manipular os efeitos de iluminação das imagens por meio de modelos avançados de IA. Desenvolvido por Lvmin Zhang et al, o projeto oferece dois modelos principais: um modelo de reiluminação condicional ao texto e um modelo condicional ao plano de fundo. Os usuários podem passar...
8 meses atrás
03.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: tela colaborativa de edição de código, versão de código aberto do OpenAI Canvas/Claude Artifacts

Introdução geral A LangChain apresenta o Open Canvas, um aplicativo da Web de código aberto projetado para aprimorar a experiência de edição e colaboração de documentos com funcionalidade de memória de agente duplo integrada e smith integrado para observar todos os detalhes da execução. A plataforma é alimentada pelo OpenA...
5 meses atrás
03.4K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: uma estrutura unificada para implementar o reparo de faces em vídeos, reparando vídeos antigos com retratos em preto e branco e desfocados

Introdução abrangente O SVFR (Stable Video Face Restoration) é uma estrutura unificada para restauração de faces em vídeo que suporta as tarefas de restauração básica de faces (BFR), coloração, reparo e suas combinações. A estrutura utiliza priores generativos e cinemáticos unificando...
7 meses atrás
03.4K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução geral O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). O projeto foi desenvolvido pela Lumina...
8 meses atrás
03.4K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Converta rapidamente repositórios de código do Github em texto adequado para compreensão do LLM

Introdução geral O GitIngest é uma ferramenta de código aberto projetada para transformar repositórios de código do GitHub em texto adequado para dicas do Modelo de Linguagem Grande (LLM). Com uma operação simples, os usuários podem extrair e formatar o conteúdo de qualquer repositório do GitHub para se adequar ao LLM ...
8 meses atrás
03.4K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Projeto de super-resolução de imagem de código aberto para melhorar a qualidade da resolução da imagem

Introdução geral O InvSR é um projeto inovador de super-resolução de imagens de código aberto baseado em técnicas de inversão de difusão capazes de converter imagens de baixa resolução em imagens de alta resolução e alta qualidade. O projeto explora o rico conhecimento prévio da imagem incorporado em modelos de difusão em larga escala pré-treinados e, por meio de um mecanismo de amostragem flexível, oferece suporte...
8 meses atrás
03.4K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Ferramenta de conversão inteligente de documentos da Microsoft, converte vários arquivos para o formato Markdown

Introdução geral O MarkItDown é uma ferramenta Python desenvolvida pela Microsoft e projetada para converter vários arquivos e documentos de escritório no formato Markdown. A ferramenta é compatível com uma ampla variedade de tipos de arquivos, incluindo PDF, PowerPoint, Word, Excel, diagramas...
8 meses atrás
03.4K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: um aplicativo de IA para iOS de código aberto baseado em modelos OLMoE executados off-line

Introdução geral O Ai2 OLMoE é um aplicativo iOS de código aberto desenvolvido pelo Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence) para fornecer modelos de IA que são executados inteiramente em dispositivos. O aplicativo aproveita o modelo de código aberto OLMoE do Ai2...
6 meses atrás
03.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: mecanismo de física generativo de código aberto para simulação de mundo dinâmico 4D baseado em física real

Introdução geral O Genesis é um mundo de física generativa projetado para robótica de uso geral e aprendizado de IA incorporado. Ele fornece uma plataforma de simulação unificada que suporta a simulação de uma ampla gama de materiais e fenômenos físicos. O Genesis tem como objetivo desbloquear a IA generativa e a simulação física combinando...
8 meses atrás
03.4K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA que controla páginas da Web, executa asserções e extrai dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando a medição da IU...
7 meses atrás
03.4K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

Diffusers Image Outpaint: ferramenta superpotente de código aberto de extensão de imagem AI, pintura de imagem (pintura de imagem)

Introdução geral Diffusers Image Outpaint é uma poderosa ferramenta de expansão de imagens de IA criada pelo membro da comunidade Hugging Face, fffiloni. A ferramenta utiliza técnicas avançadas de modelagem de difusão para trazer imagens para...
11 meses atrás
03.3K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução abrangente O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido pelo thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala.
7 meses atrás
03.3K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: uma plataforma de código aberto, sem código, que rastreia automaticamente os dados da Web e os converte em APIs ou planilhas

Introdução abrangente O Maxun é uma plataforma de extração de dados da Web de código aberto e sem código que permite aos usuários treinar robôs em minutos para rastrear automaticamente dados da Web e convertê-los em APIs ou planilhas. A plataforma oferece suporte a paginação e rolagem, adapta-se a alterações no layout do site, fornece rastreamento avançado de dados...
7 meses atrás
03.3K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems (Ferramenta de geração de aumento de recuperação paramétrica para melhorar o desempenho dos sistemas de perguntas e respostas)

Introdução abrangente O PRAG (Parametric Retrieval-Augmented Generation) é uma ferramenta inovadora de geração de recuperação aumentada que visa aprimorar a geração de conhecimento externo, incorporando-o diretamente ao espaço de parâmetros de um Modelo de Linguagem Grande (LLM)...
6 meses atrás
03.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: adicionando iluminação a imagens com ferramentas de pintura inteligentes

Introdução geral O LuminaBrush é uma ferramenta inovadora e interativa de edição de imagens para efeitos de iluminação, com tecnologia de inteligência artificial. O projeto usa uma estrutura de dois estágios para processar imagens: o primeiro estágio transforma a imagem de entrada em uma aparência "uniformemente iluminada", enquanto o segundo estágio gera...
7 meses atrás
03.3K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: pessoas digitais inteligentes para interação em tempo real, com suporte à implantação multiplataforma com um clique

Introdução geral O DUIX (Dialogue User Interface System) é uma plataforma de interação humana digital alimentada por IA criada pela Silicon Intelligence. Com recursos de interação humana digital de código aberto, os desenvolvedores podem integrar facilmente modelos de grande escala, reconhecimento automático de fala (ASR...
7 meses atrás
03.3K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: aplicativo portátil de diário de voz com IA e suporte de fala para texto.

Introdução geral O ALog é um aplicativo de diário de voz baseado em IA projetado para ajudar os usuários a registrar suas vidas diárias por voz. Ele foi desenvolvido pela duxins e tem código aberto no GitHub. Os usuários podem gravar entradas de diário por meio de entrada de voz, e o aplicativo converterá automaticamente a voz em texto...
7 meses atrás
03.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: uma estrutura baseada em Qwen para aplicativos de agentes inteligentes, incluindo chamadas de ferramentas, interpretadores de código, RAGs e extensões do Chrome.

Introdução abrangente O Qwen-Agent é uma estrutura de aplicativo de agente inteligente desenvolvida com base no Qwen 2.0 e superior, com recursos como acompanhamento de comandos, uso de ferramentas, planejamento e memória. A estrutura fornece uma variedade de aplicativos de amostra, como assistentes de navegador, intérpretes de código e assistentes personalizados...
8 meses atrás
03.3K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes em tempo real da OpenAI: um aplicativo de interação de fala corporal multiinteligente (exemplo da OpenAI)

Introdução geral O OpenAI Realtime Agents é um projeto de código aberto que tem como objetivo mostrar como a API em tempo real do OpenAI pode ser usada para criar aplicativos de fala corporal multiinteligentes. Ele fornece um modelo de corpo inteligente de alto nível (emprestado do OpenAI Swarm) que permite...
7 meses atrás
03.3K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: uma biblioteca de ferramentas de OCR multilíngue baseada no Flying Paddle, com suporte ao reconhecimento de mais de 80 idiomas

Introdução abrangente O PaddleOCR é um kit de ferramentas de OCR multilíngue baseado no PaddlePaddle, projetado para fornecer um sistema de OCR prático e ultraleve. Ele é compatível com o reconhecimento de mais de 80 idiomas e oferece ferramentas de anotação e síntese de dados para...
8 meses atrás
03.3K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM: pesquise dados da Web com base no tópico, gere documentos com citações, relatórios de documentos longos

Introdução geral O STORM é um sistema de integração de conhecimento e geração de artigos desenvolvido pela equipe Oval da Universidade de Stanford. Ele se concentra na geração de artigos exaustivos semelhantes aos da Wikipédia (documentos sistemáticos) a partir do zero. O sistema usa modelos de linguagem em grande escala para pesquisa de tópicos, preparação de sinopses e simulação de artigos interconectados reais...
4 meses atrás
03.3K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: um modelo que oferece suporte à interpretação de papéis e a diálogos complexos, com desempenho superior a 32b (com instalador de um clique)

Introdução abrangente O Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 é um modelo de linguagem eficiente projetado para oferecer suporte a diálogos complexos de interpretação de papéis e de várias rodadas. Profundamente otimizado com base no Qwen 2.5-7B, ele tem excelente geração de texto e diálogo...
6 meses atrás
03.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: modelagem de linguagem multimodal MNN para Android

Introdução abrangente A MNN (Mobile Neural Network) é uma estrutura de aprendizagem profunda leve e eficiente, desenvolvida pela Alibaba e otimizada para dispositivos móveis. A MNN não só é capaz de fazer inferências rápidas em dispositivos móveis, mas também oferece suporte a tarefas multimodais, incluindo geração de texto...
6 meses atrás
03.3K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: uma plataforma de desenvolvimento com pouco código para aplicativos de IA generativa de nível empresarial

Introdução abrangente O BuffGPT é uma plataforma de desenvolvimento de aplicativos de IA de código aberto baseada no Modelo de Linguagem Grande (LLM), que oferece recursos prontos para uso, como processamento de dados, invocação de modelos, recuperação de RAG e orquestração de fluxo de trabalho visual para ajudar os usuários a criar e operar facilmente aplicativos de IA generativa. A plataforma oferece suporte a...
5 meses atrás
03.3K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: gere e publique automaticamente vídeos curtos no YouTube e conteúdo no Twitter

Introdução geral O MoneyPrinter V2 é um projeto de código aberto desenvolvido por FujiwaraChoki para ajudar os usuários a ganhar dinheiro on-line por meio da automação. O projeto integra principalmente automação do Twitter, geração de vídeos curtos do YouTube e acampamento de afiliados...
7 meses atrás
03.3K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: proxy/reversão do canal Midjourney Discord para chamadas de API de mapeamento de IA (teste gratuito)

Introdução abrangente O Midjourney Proxy é um projeto de código aberto desenvolvido para fornecer serviços de proxy para o canal Discord do Midjourney para converter funções de desenho de IA em formato de API. O projeto é totalmente gratuito e de código aberto, com suporte para troca de rosto com um clique, combinação de imagens, geração de gráficos ...
8 meses atrás
03.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: ferramenta de troca de rosto de IA em tempo real de código aberto, uma foto para troca de rosto em tempo real

Introdução geral O Deep Live Cam é uma ferramenta de inteligência artificial de código aberto projetada para permitir a substituição de rostos em tempo real e a geração de vídeos falsos profundos a partir de uma única foto. Usando algoritmos avançados de aprendizagem profunda, a ferramenta é capaz de substituir rostos em tempo real durante a transmissão ao vivo ou chamadas de vídeo, protegendo a privacidade do usuário e adicionando diversão...
9 meses atrás
03.3K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta

Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA).
7 meses atrás
03.3K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: ferramenta de quadro branco virtual com estilo de desenho à mão | fluxograma de geração de texto orientado por IA | tutoriais do Excalidraw

Excalidraw Descrição geral O Excalidraw é uma ferramenta de desenho de quadro branco virtual de código aberto que permite desenhar facilmente diagramas com estilo de desenho à mão. Você pode usar o Excalidraw para criar belas ilustrações desenhadas à mão, diagramas de estrutura de arame ou qualquer um de seus...
9 meses atrás
03.3K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: um robô de diálogo inteligente construído em um modelo grande, compatível com o WeChat e outras plataformas de acesso a múltiplos diálogos

Introdução abrangente O projeto ChatGPT-on-WeChat é um grande robô de diálogo inteligente baseado em modelos, que oferece suporte ao acesso multiplataforma ao WeChat pessoal, ao número público do WeChat, ao aplicativo WeChat empresarial, ao Flybook, ao Nail e assim por diante. Os usuários podem escolher entre GPT3.5, GPT-4, Claude, Man...
8 meses atrás
03.3K
sensitive-word:敏感词过滤工具,高效DFA算法实现

sensitive-word: ferramenta de filtragem de palavras sensíveis, implementação eficiente do algoritmo DFA

Introdução abrangente A Sensitive Word Filtering Tool (Sensitive Word) é uma ferramenta de filtragem de palavras sensíveis em Java de alto desempenho, baseada na implementação da estrutura do algoritmo DFA. A ferramenta é capaz de detectar e filtrar com eficiência palavras sensíveis e oferece suporte a uma variedade de conversões de formato e estratégias de substituição personalizadas. Seu objetivo de design é fornecer ...
11 meses atrás
03.2K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): um kit de ferramentas de aprendizagem profunda para geração de texto para fala com suporte multilíngue e recursos de clonagem de voz

Introdução abrangente O Coqui TTS é um kit de ferramentas de geração de texto para fala (TTS) avançado e de código aberto baseado em técnicas de aprendizagem profunda. Ele foi testado em ambientes de pesquisa e produção e oferece um rico conjunto de recursos e modelos que suportam a conversão de texto em fala em vários idiomas.
6 meses atrás
03.2K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: configuração flexível de ferramentas nativas de diálogo e processamento de documentos de IA

Introdução geral O H2O GPT é um projeto de código aberto que tem como objetivo fornecer recursos privatizados de bate-papo e processamento de documentos. O projeto é baseado na licença Apache 2.0 e oferece suporte a vários modelos de GPT, incluindo LLaMa2, Mistral, Falcon e outros. Com ...
8 meses atrás
03.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: clonagem rápida de voz e treinamento de modelos, conversão de texto em fala com base no xtts v2

Introdução abrangente O MockingBird é um projeto de código aberto que visa à clonagem rápida de fala e à conversão de texto em fala por meio da tecnologia de IA. Os usuários só precisam fornecer 5 segundos de amostras de voz, e você pode gerar qualquer conteúdo de voz. O projeto oferece suporte a uma variedade de conjuntos de dados chineses e, no Windows ...
8 meses atrás
03.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

IA lê livros: a IA lê livros em PDF página por página, extrai automaticamente os principais pontos de conhecimento e gera resumos.

Introdução abrangente O AI-reads-books-page-by-page é um desenvolvimento baseado em Python de uma ferramenta inteligente de análise de livros em PDF, que pode automatizar a análise página a página de livros em PDF, extrair os principais pontos de conhecimento e, após o intervalo de página especificado, gerar o estágio...
7 meses atrás
03.2K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: um mecanismo de pesquisa de IA de código aberto que replica os recursos e a interface do Perplexity AI na proporção de 1 para 1

Introdução geral O Perplexica é um mecanismo de pesquisa de código aberto orientado por IA, projetado para fornecer respostas que se aprofundam na Internet. Ele usa algoritmos avançados de aprendizado de máquina, como pesquisa de similaridade e técnicas de incorporação, para otimizar os resultados da pesquisa e fornecer respostas claras com fontes citadas.
9 meses atrás
03.2K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon: uma ferramenta de questionário de documentos multimodais de código aberto simples de implantar

Introdução geral O Kotaemon é uma ferramenta de perguntas e respostas de documentos de código aberto projetada para fornecer aos usuários finais e desenvolvedores a funcionalidade de perguntas e respostas com base no Retrieval Augmented Generation (RAG). O projeto foi desenvolvido pela Cinnamon e oferece suporte a vários provedores de API LLM (por exemplo, OpenA...
11 meses atrás
03.2K
AutoGen:微软开发的多智能体对话框架

AutoGen: uma estrutura de diálogo corporal multiinteligente desenvolvida pela Microsoft

Introdução geral O AutoGen é uma estrutura de código aberto desenvolvida por uma equipe de pesquisadores da Microsoft com o objetivo de simplificar a construção de aplicativos de modelo de linguagem grande (LLM) por meio de diálogo corporal multiinteligente. Ele permite que os desenvolvedores criem agentes de IA que podem dialogar entre si e colaborar para resolver tarefas. Essa abordagem não só melhora o desempenho do LLM...
7 meses atrás
03.2K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código aberto para remoção em lote de fundos de imagens e vídeos, otimizado para o RMBG 2.0

Introdução geral O RMBG-2-Studio é um aplicativo aprimorado de remoção e substituição de plano de fundo desenvolvido com base no modelo BRIA-RMBG-2.0. O aplicativo foi projetado para oferecer aos usuários recursos eficientes e precisos de processamento de fundo de imagem para vários tipos de imagem, incluindo comércio eletrônico, jogos e...
8 meses atrás
03.2K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: ferramenta de tradução de vídeo multifuncional de código aberto, transcrição e tradução de voz em vários idiomas, instalação com um clique no Windows

Introdução geral O Voice-Pro é uma ferramenta versátil baseada na Gradio WebUI que oferece suporte a conversão de fala em texto, conversão de texto em fala, tradução em tempo real, downloads de vídeos do YouTube e separação de voz humana. Ele integra o Whisper, o Faster-Wh...
9 meses atrás
03.2K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: operação automatizada de smartphones usando inteligências multimodais

Introdução abrangente O AppAgent é uma estrutura de agente multimodal baseada no Large Language Model (LLM), projetada para manipular aplicativos de smartphones. A estrutura imita as interações humanas, como toques e deslizes, por meio de um espaço de manipulação simplificado, eliminando, assim, a necessidade de acesso ao back-end do sistema, ampliando seu alcance em diferentes aplicativos...
8 meses atrás
03.2K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: um assistente de IA para gerenciamento de conhecimento empresarial e pesquisa de documentos, integrando várias ferramentas de trabalho

Introdução geral O Danswer é um assistente de IA de recuperação de documentos corporativos de código aberto projetado para se conectar a documentos, aplicativos e pessoas da equipe para fornecer pesquisa unificada e respostas a consultas em linguagem natural por meio de uma interface de bate-papo inteligente e recursos de pesquisa unificada. Garantindo que os dados do usuário e os bate-papos sejam totalmente controlados...
5 meses atrás
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus: ferramenta de IA para gerar vídeos curtos com um clique, mixagem em lote gratuita

Introdução abrangente O MoneyPrinterPlus é um projeto de código aberto que visa gerar e misturar todos os tipos de vídeos curtos com um clique por meio da tecnologia de IA e publicá-los automaticamente em várias plataformas de vídeo, como Jieyin, Shutterbugs, Xiaohongshu e Video Number. A ferramenta oferece suporte a modelos de voz locais e baseados em nuvem, incluindo bate-papo...
11 meses atrás
03.2K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Introdução geral O Audiblez é um projeto de código aberto criado para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e várias vozes. Os usuários podem simplesmente...
7 meses atrás
03.2K
Novel:模仿Notion AI的开源写作编辑器

Novel: um editor de redação de código aberto que imita o Notion AI

Introdução abrangente Este é um projeto de código aberto desenvolvido por Steven Tey chamado Novel, é um editor de texto WYSIWYG no estilo Notion, com recurso integrado de autocompletar AI que pode ajudar os usuários a aumentar a eficiência da entrada de texto. O projeto fornece documentação detalhada e instruções de instalação ...
1 ano atrás
03.2K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de perguntas e respostas com base de conhecimento de IA pronto para uso para atendimento inteligente ao cliente e base de conhecimento interna

Introdução abrangente O MaxKB (Max Knowledge Base) é um sistema de Q&A de base de conhecimento de código aberto baseado em grandes modelos de linguagem e RAG (Retrieval Augmented Generation). O sistema é amplamente utilizado no atendimento inteligente ao cliente, na base de conhecimento interna da empresa, na pesquisa e educação acadêmica e em outros cenários.
7 meses atrás
03.2K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: uma estrutura Python para criar fluxos de trabalho de corpo de inteligência de IA controlados e transparentes

Introdução geral O ControlFlow é uma estrutura Python desenvolvida pela PrefectHQ com foco na criação e no gerenciamento de fluxos de trabalho de IA. Ele fornece uma estrutura estruturada e orientada ao desenvolvedor para definir fluxos de trabalho e delegar tarefas à geração de modelos de linguagem grande (LLM)...
8 meses atrás
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: retratos orientados por áudio para gerar vídeos falados (instalador acelerado do EchoMimicV2)

Introdução geral O EchoMimic é um projeto de código-fonte aberto criado para gerar animações de retratos realistas acionadas por áudio. Desenvolvido pela divisão Terminal Technologies do Ant Group, o projeto utiliza condições de pontos de marcação editáveis para gerar vídeos de retratos dinâmicos usando uma combinação de áudio e pontos de marcação facial.
7 meses atrás
03.2K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: aprimoramento da experiência de desenvolvimento do Cursor IDE, tornando o Cursor/Windsurf um assistente de programação inteligente semelhante ao Devin

Introdução geral O Devin.cursorrules é um projeto inovador de código aberto criado para converter o Cursor ou o Windsurf IDE (~US$ 20) em um poderoso assistente de programação com IA, como o Devin. O projeto fornece um conjunto de ...
7 meses atrás
03.2K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: ferramenta interativa de edição de imagens, controle de apontar e clicar e arrastar e soltar a posição da imagem

Introdução geral DragGAN é uma ferramenta interativa de edição de imagens baseada em redes adversárias generativas (GAN). Ela foi lançada por Xingang Pan et al. na SIGGRAPH 2023 e tem como objetivo permitir que os usuários manipulem intuitivamente por meio de operações simples de apontar e clicar e arrastar e soltar...
8 meses atrás
03.2K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: conteúdo de plataformas de mídia social múltipla, ferramenta de rastreamento de comentários em vídeo

Introdução geral O MediaCrawler é uma ferramenta de rastreamento de conteúdo de mídia social criada para desenvolvedores. Ao fornecer uma função de rastreamento avançada, ele pode obter rapidamente vídeos, imagens, comentários, curtidas, retweets e outros dados de plataformas sociais como Xiaohongshu, Shake, Shutter, B, Weibo e outras...
12 meses atrás
03.2K