Projeto de código aberto de IA

Total de 1020 artigos
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: tecnologia revolucionária de geração de imagens de altíssima resolução com riqueza de detalhes de imagem

Introdução geral O UltraPixel é uma tecnologia avançada de geração de imagens de resolução ultra-alta projetada para criar imagens de altíssima qualidade e ricas em detalhes. Ela foi desenvolvida pelo usuário catcathh do GitHub e apresentada no NeurIPS 2024.U...
10 meses atrás
02.8K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher: ferramenta automatizada de pesquisa aprofundada para escrever relatórios de pesquisa completos

Introdução geral O OpenDeepResearcher é uma ferramenta de pesquisa profunda automatizada de código aberto projetada para melhorar a eficiência da pesquisa por meio de técnicas de inteligência artificial. O projeto foi desenvolvido por mshumer e hospedado no GitHub.OpenDeepResear...
4 meses atrás
02.8K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atômicos: uma estrutura para criar inteligências de IA modulares e leves

Introdução geral O Atomic Agents é uma estrutura extremamente leve e modular projetada com base no conceito de atomicidade para a criação de pipelines e aplicativos de IA de agentes. A estrutura oferece um conjunto de ferramentas e agentes que podem ser combinados para criar aplicativos avançados. Ela se baseia no Instruc...
8 meses atrás
02.8K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: carregue uma imagem e migre os recursos de retrato para gerar diferentes estilos de imagens

Introdução abrangente O InstantID é uma tecnologia avançada voltada para a geração de imagens com estilos ou poses personalizados em segundos, garantindo um alto nível de fidelidade com o uso de uma única imagem de referência de identificação. A tecnologia usa uma solução baseada em um modelo de difusão, integrando imagens faciais, mapas de pontos de referência...
12 meses atrás
02.8K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: uma interface de gerenciamento para interação humano-computador com inteligências de IA

Introdução geral O Agent Inbox é um projeto de código aberto desenvolvido pela equipe da LangChain para proporcionar uma nova experiência de usuário na interação com inteligências de IA. O projeto permite que os usuários gerenciem e otimizem as interações com várias inteligências de IA por meio de uma interface centralizada.Ag...
7 meses atrás
02.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: uma ferramenta para converter conteúdo da Web em feeds RSS por meio de IA

Introdução geral O AI RSS é uma ferramenta inovadora que converte conteúdo da Web em feeds RSS por meio da tecnologia de IA. Ela consiste em duas partes principais: um plug-in de navegador e um lado do servidor. O plug-in do navegador permite que os usuários selecionem listas de páginas da Web e gerem arquivos de descrição de dados estruturados (SDD)...
7 meses atrás
02.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: uma nova estrutura de orquestração de agentes com base em LLM e EKG (conhecimento do setor)

Introdução geral O muAgent é uma estrutura inovadora de inteligência múltipla desenvolvida pelo Ant Group. A estrutura ajuda os usuários a executar vários procedimentos operacionais padrão (SOPs) complexos sob orientação humana por meio de arrastar e soltar telas e escrever textos simples, em colaboração com multiinteligência, chamadas de função, intérpretes de código e outras tecnologias...
9 meses atrás
02.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: extrai dados do corpo do URL HTML, produz texto simples/markdown

Introdução geral magic-html é uma biblioteca Python projetada para simplificar o processo de extração do conteúdo da região do corpo do HTML. Seja lidando com estruturas complexas de HTML ou com páginas da Web simples, essa biblioteca tem como objetivo fornecer uma interface conveniente e eficiente para os usuários. Ela oferece suporte à extração multimodal...
11 meses atrás
02.8K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: memória gráfica baixa de 6G, crescimento rápido do projeto de código aberto de vídeo longo

Introdução geral O FramePack é uma ferramenta de geração de vídeo de código aberto que tem como objetivo tornar as técnicas de difusão de vídeo mais práticas. Ele desacopla a carga de trabalho de geração da duração do vídeo, compactando os quadros de entrada em um comprimento fixo por meio de uma rede neural exclusiva de previsão do próximo quadro. Isso significa que, mesmo ao gerar vídeos longos, os requisitos de memória de vídeo...
3 meses atrás
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: uma ferramenta de código aberto para extração e exploração eficientes de dados estruturados

Introdução abrangente A Knowledge Table (Tabela de conhecimento) é um projeto de código aberto criado para simplificar o processo de extração e exploração de dados estruturados de documentos não estruturados. Os usuários podem criar representações de conhecimento estruturado, como tabelas e gráficos, por meio de uma interface de consulta em linguagem natural. A ferramenta permite personalizar a extração ...
10 meses atrás
02.8K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: uma ferramenta de código aberto para gerar retratos falados realistas

Introdução geral O FantasyTalking é um projeto de código aberto desenvolvido pela equipe do Fantasy-AMAP, com foco na geração de vídeos de retratos falados realistas por meio da unidade de áudio. O projeto é baseado no modelo avançado de difusão de vídeo Wan2.1, combinado com o codificador de áudio Wa...
3 meses atrás
02.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: a inteligência de IA que automatiza as ações do desktop em dispositivos macOS

Introdução geral O mac assistant é um projeto de corpo de inteligência de IA desenvolvido para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto oferece suporte às APIs OpenAI e GEMINI, e planeja oferecer suporte a futuras ...
6 meses atrás
02.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: Plug-in de navegador para fazer o ChatGPT funcionar em outras páginas da Web

Introdução geral O ChatGPT Box é uma extensão de navegador de código aberto projetada para integrar profundamente o ChatGPT ao navegador do usuário. Desenvolvida pela josStorer, a ferramenta é compatível com vários idiomas e oferece uma variedade de recursos, como chamar pares de bate-papo em qualquer página...
4 meses atrás
02.8K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: ferramenta de varredura de vulnerabilidades LLM de código aberto que fornece técnicas de ataque e testes de fuzz abrangentes

Introdução geral O Agentic Security é uma ferramenta de código aberto de varredura de vulnerabilidades do LLM (Large Language Model) projetada para fornecer aos desenvolvedores e profissionais de segurança técnicas abrangentes de teste e ataque de fuzz. A ferramenta é compatível com conjuntos de regras personalizadas ou ataques baseados em agentes e é capaz de integrar o LLM AP...
6 meses atrás
02.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: ferramenta automatizada de geração de código e depuração com suporte a vários idiomas

Introdução geral O AutoDev é um projeto de código aberto desenvolvido pela equipe do Unit Mesh e hospedado no GitHub, com o objetivo de melhorar a eficiência de programação dos desenvolvedores por meio da tecnologia de inteligência artificial. Ele é um assistente de codificação avançado que oferece suporte a várias linguagens de programação, incluindo Ja...
6 meses atrás
02.8K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: uma estratégia genérica de fragmentação semântica baseada no Llama-70B

Introdução abrangente O zChunk é uma nova estratégia de fragmentação desenvolvida pela ZeroEntropy que visa a fornecer uma solução para a fragmentação semântica genérica. A estratégia se baseia no modelo Llama-70B, que otimiza o processo de fragmentação de documentos, solicitando a geração de blocos, garantindo que a recuperação de informações seja mantida em um alto nível...
6 meses atrás
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automação de e-mail com IA localizada para geração rápida de respostas de rascunho de e-mail (Gmail)

Introdução geral O LAMBDA (Local Auto MailBox Draft Assistant) é um sistema de automação de e-mail com IA localizada, projetado para aprender com o estilo de e-mail do usuário e gerar um rascunho para cada e-mail não lido na caixa de entrada do Gmail...
8 meses atrás
02.8K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D orientados por áudio de pessoas digitais interativas em tempo real, executados a 30 fps na CPU

Introdução geral O LiteAvatar é uma ferramenta de código aberto desenvolvida pela equipe HumanAIGC (parte do Ali) que se concentra na geração de animações faciais a partir de avatares 2D acionados por áudio em tempo real. Ele é executado a 30 quadros por segundo (fps), dependendo apenas da CPU, e é especialmente adequado para...
6 meses atrás
02.8K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: Fluxos de trabalho corporais inteligentes de criação de linguagem natural para automação de desktops e navegadores

Introdução geral A Eko é uma estrutura JavaScript de nível de produção projetada para criar fluxos de trabalho eficientes de agentes inteligentes por meio de descrições de linguagem natural. Ele foi projetado para permitir que os desenvolvedores automatizem tarefas cotidianas usando tecnologias de IA sem programação profunda.
5 meses atrás
02.8K
Cerebr:与网页内容对话的开源浏览器插件

Cerebr: plug-in de navegador de código aberto que se comunica com o conteúdo da Web

Descrição geral O Cerebr é uma poderosa extensão de assistente de IA para o Chrome, projetada para aprimorar sua produtividade e experiência de aprendizado. O Cerebr foi projetado desde o início com a necessidade de um assistente de IA de navegador limpo e eficiente, com um design minimalista e...
4 meses atrás
02.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: um corpo inteligente para análise de radiografias de tórax usando macromodelos multimodais

Introdução abrangente O MedRAX é uma inteligência de IA de última geração projetada para análise de radiografia de tórax (CXR). Ele integra ferramentas de análise de CXR de última geração e modelos multimodais de linguagem ampla para processar dinamicamente consultas médicas complexas sem treinamento adicional.
5 meses atrás
02.8K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: estrutura de planejamento e inferência de condução autônoma de ponta a ponta de código aberto da Xiaomi

Introdução abrangente O Orion é um projeto de código aberto desenvolvido pela Xiaomi Labs, com foco na tecnologia de direção autônoma de ponta a ponta (E2E). Ele resolve o problema de raciocínio causal insuficiente em cenários complexos por métodos tradicionais de direção autônoma por meio de modelos de linguagem visual (VLMs) e planejadores generativos.
4 meses atrás
02.8K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extração e categorização de documentos em dados estruturados para otimizar o processo de manuseio de documentos

Introdução abrangente O ExtractThinker é uma ferramenta flexível de inteligência de documentos que extrai e classifica dados estruturados de documentos usando Modelos de Linguagem Grandes (LLMs), fornecendo um fluxo de trabalho de processamento de documentos semelhante ao ORM. Ele é compatível com vários carregadores de documentos, incluindo o Tess...
7 meses atrás
02.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: implantação sem servidor de um site de diálogo multimodal Gemini

Introdução geral O Gemini Playground é um projeto de código aberto criado para ajudar os usuários a implementar rapidamente um site de diálogo multimodal. O projeto é desenvolvido por um técnico de rastreamento de camarão, com suporte ao uso da chave da API Gemini em 10 segundos para concluir a implantação. Se o usuário estiver ...
6 meses atrás
02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: uma ferramenta para simplificar o processo de ajuste fino dos modelos das principais linguagens visuais de código aberto

Introdução abrangente O Maestro é uma ferramenta desenvolvida pela Roboflow para simplificar e acelerar o processo de ajuste fino de modelos multimodais, para que todos possam treinar seus próprios macromodelos visuais. Ele fornece receitas prontas para o ajuste fino de modelos populares de linguagem visual (VLMs), como o F...
6 meses atrás
02.7K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: Chatbots personalizados para integração rápida de várias fontes de dados

Introdução geral O OpenChat é um console de chatbot fácil de usar, projetado para simplificar o uso de LLMs (Large Language Models). Ao fornecer um processo de configuração em duas etapas, o OpenChat permite que os usuários criem e gerenciem facilmente vários chatbots personalizados. A plataforma é compatível com G...
7 meses atrás
02.7K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: converter ebooks epub em audiolivros m4b

Introdução geral O Autiobooks é uma ferramenta de código aberto criada para ajudar os usuários a converter rapidamente livros eletrônicos no formato .epub em audiolivros no formato .m4b. Ela usa tecnologia de síntese de fala de alta qualidade fornecida pela Kokoro para gerar áudio natural e suave. Essa ferramenta foi desenvolvida por...
5 meses atrás
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: o Wisdom Spectrum lançou um modelo avançado para a geração de textos ultralongos, suportando a geração de mais de 10.000 palavras em uma única conversa.

Introdução abrangente O LongWriter é uma poderosa ferramenta de geração de textos longos desenvolvida pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM). A ferramenta é baseada no avançado Modelo de Linguagem de Contexto Longo (LLM) e é capaz de gerar textos longos com mais de 10.000 palavras.
8 meses atrás
02.7K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI: sistema de gerenciamento de interface de encaminhamento de modelo de IA de alto valor, o site oficial oferece cota de API gratuita diariamente

Introdução abrangente O VoAPI é um novo sistema de gerenciamento e distribuição de interface de modelo de IA de alto perfil e alto desempenho, usado principalmente para canais de distribuição e gerenciamento interno pessoal ou empresarial. Desenvolvido com base na NewAPI, o sistema oferece módulos funcionais avançados e interface de usuário otimizada, com o objetivo de aprimorar...
9 meses atrás
02.7K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Criando um sistema inteligente de perguntas e respostas sobre documentos e simplesmente criando uma base de conhecimento privada na Web

Introdução abrangente O RAG Web UI é um sistema de diálogo inteligente baseado na tecnologia RAG (Retrieval Augmented Generation). Ele ajuda empresas e indivíduos a criar sistemas inteligentes de perguntas e respostas com base em sua própria base de conhecimento. Combinando a recuperação de documentos e grandes modelos de linguagem, o RAG Web UI fornece informações precisas e confiáveis...
7 meses atrás
02.7K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: uso de técnicas RAG para gerar consultas SQL precisas a partir de texto

Introdução abrangente O Vanna é uma estrutura Python de código aberto licenciada pelo MIT, focada na geração de consultas SQL por meio de técnicas RAG (Retrieval Augmented Generation). Os usuários podem treinar modelos RAG, aplicá-los a seus próprios dados e, em seguida, fazer perguntas, e o Vanna retornará a resposta adequada...
7 meses atrás
02.7K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, uma plataforma para criar modelos de base de IA do mundo físico

Introdução abrangente O NVIDIA Cosmos é uma plataforma de modelagem baseada no mundo para desenvolvedores, projetada especificamente para ajudar os desenvolvedores de IA de física a criar seus sistemas de IA de física de forma melhor e mais rápida. A plataforma oferece uma variedade de modelos pré-treinados, incluindo modelos de difusão e autorregressivos baseados no mundo...
7 meses atrás
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: um ambiente de programação visual de código aberto para testar e avaliar a eficácia de grandes dicas de modelos de linguagem

Introdução geral O ChainForge é um ambiente de programação visual de código aberto projetado para testar e avaliar a eficácia de dicas de modelos de linguagem ampla (LLM). Ele oferece um ambiente de engenharia de dicas de fluxo de dados por meio do qual os usuários podem explorar e analisar rapidamente a qualidade de diferentes dicas na resposta do LLM...
8 meses atrás
02.7K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: um modelo de código aberto para reconhecimento de fala multilíngue de alta precisão

Introdução geral O FireRedASR é um modelo de reconhecimento de fala desenvolvido e de código aberto pela equipe do Little Red Book FireRed, com foco no fornecimento de soluções de reconhecimento automático de fala (ASR) de alta precisão e com suporte a vários idiomas. O projeto está hospedado no GitHub para desenvolvedores e pesquisadores, e oferece...
5 meses atrás
02.7K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: uma ferramenta para gerenciar a colaboração de várias inteligências usando inteligências de supervisão

Introdução geral O LangGraph Supervisor é uma biblioteca Python baseada na estrutura LangGraph, projetada para criar e gerenciar sistemas corporais multiinteligentes. A biblioteca coordena o trabalho de vários agentes especializados por meio de um agente de supervisão central, garantindo que os fluxos de comunicação e as tarefas sejam divididos...
6 meses atrás
02.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: uma ferramenta de ajuste virtual de IA de alta fidelidade para aprimorar a autenticidade dos detalhes das roupas

Introdução abrangente O FitDiT é um sistema de ajuste virtual de alta fidelidade baseado em transformadores de difusão (Diffusion Transformers). Desenvolvido pelo Tencent AI Lab, o projeto tem como objetivo abordar as limitações dos sistemas de ajuste virtual tradicionais na exibição de detalhes do vestuário.
7 meses atrás
02.7K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: projeto de código aberto para pesquisa de inferência profunda usando conhecimento local

Introdução abrangente O Deep Searcher é uma ferramenta avançada que combina modelos de linguagem grande (LLMs) e bancos de dados vetoriais projetados para pesquisar, avaliar e raciocinar com base em dados privados, fornecendo respostas altamente precisas e relatórios abrangentes. Ele é adequado para a gestão de conhecimento empresarial...
6 meses atrás
02.7K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: Mecanismo de código aberto para baixa implantação existente do FLUX, Wan 2.1

Introdução geral O DiffSynth-Engine é um projeto de código aberto lançado pela ModelScope, hospedado no GitHub. Ele se baseia na tecnologia de modelagem de difusão, concentra-se na geração eficiente de imagens e vídeos e é adequado para que os desenvolvedores implantem modelos de IA em ambientes de produção...
5 meses atrás
02.7K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragmentos: versões de código aberto de aplicativos como o Claude Artifacts da Anthropic, o Vercel v0 ou o GPT Engineer.

Introdução geral O Fragments by E2B é um projeto de código aberto que fornece um modelo baseado no Next.js para a criação de aplicativos gerados inteiramente por IA. O projeto foi desenvolvido pela E2B para simplificar e acelerar o processo de desenvolvimento de aplicativos de IA. Ele integra uma variedade de aplicativos atuais...
9 meses atrás
02.7K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: interface simples de bate-papo na Web com modelos de IA multiplataforma integrados (sem implantação)

Introdução geral O OrionChat é uma interface de bate-papo de IA baseada na Web que oferece aos usuários uma plataforma unificada para interagir com vários modelos de IA convencionais. O projeto oferece suporte a uma ampla gama de modelos de IA, incluindo Ollama (executado localmente), OpenAI GPT, Google Gemi...
8 meses atrás
02.7K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: ferramenta de IA para extrair roupas de uma pessoa como uma imagem de exibição de roupas em mosaico

Introdução abrangente O TryOffAnyone é uma ferramenta inovadora de processamento de imagens de IA projetada para resolver os desafios da exibição de roupas no setor de comércio eletrônico. Ele é capaz de converter de forma inteligente fotos de pessoas reais vestindo roupas em imagens com efeito de exibição plana, essa tecnologia é baseada na mais recente tecnologia de...
7 meses atrás
02.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: uma ferramenta de aprendizagem por reforço multimodal para explorar o raciocínio visual

Introdução abrangente O MM-EUREKA é um projeto de código aberto desenvolvido pelo Shanghai Artificial Intelligence Laboratory, pela Shanghai Jiao Tong University e por outras partes. Ele amplia os recursos de raciocínio textual para cenários multimodais por meio de técnicas de aprendizagem por reforço baseadas em regras para ajudar os modelos a processar informações de imagem e texto. O núcleo dessa ferramenta...
5 meses atrás
02.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: um modelo Next.js para criar aplicativos de IA de diálogo de voz em tempo real

Introdução abrangente O OpenAI Realtime API Next.js é um projeto de código aberto baseado na estrutura Next.js, projetado para ajudar os desenvolvedores a criar rapidamente aplicativos de IA de voz em tempo real. O projeto integra a API em tempo real da OpenAI e a tecnologia WebRTC...
7 meses atrás
02.7K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formulários de análise de dados on-line que integram diálogo de IA e execução de código

Descrição geral O Quadratic é uma ferramenta de planilha inteligente de código aberto que combina recursos de IA, código e conectividade de dados projetados para fornecer aos usuários recursos avançados de processamento e análise de dados. Ao oferecer suporte a linguagens de programação como Python, SQL e Rust, o Quadratic...
6 meses atrás
02.7K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate: tradução de documentos em texto completo: traduza rapidamente documentos PDF/MD em inglês para documentos em chinês.

Introdução abrangente O Doc2XAPITranslate é uma poderosa ferramenta de tradução de documentos de texto completo projetada para traduzir rapidamente documentos PDF ou Markdown em inglês para documentos chineses. A ferramenta oferece suporte a vários tradutores, incluindo DeepSeek, OpenAI, O...
6 meses atrás
02.7K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: uma ferramenta de IA para fornecer tutoria personalizada, um projeto de tutor pessoal de IA de código aberto baseado no Llama 3.1

Introdução geral O Llama Tutor é um projeto de tutor pessoal de IA de código aberto criado com base no Llama 3.1, projetado para oferecer aos usuários uma experiência de aprendizado personalizada. Ao integrar várias pilhas de tecnologia, como Together AI, Next.js e T...
9 meses atrás
02.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: sistema de diálogo inteligente para pessoas digitais, combinando grandes modelos de linguagem e modelos visuais para novas experiências interativas

Introdução geral O Linly-Talker é um sistema inovador de diálogo humano digital que combina modelos de linguagem ampla (LLMs) com modelos visuais para criar uma nova abordagem para a interação humano-computador. O sistema integra uma variedade de tecnologias, como Whisper, Linly, Micros...
6 meses atrás
02.7K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: uma chave para gerar audiolivros com qualidade de som natural, suporte para PDF, epub, docx e outros formatos

Introdução abrangente O QuickPiperAudiobook é um projeto de código aberto desenvolvido para converter vários formatos de texto (por exemplo, epub, mobi, txt, PDF, HTML etc.) em audiolivros com som natural por meio de um simples comando. A ferramenta usa o Pi...
10 meses atrás
02.7K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: fornecendo uma ferramenta de teste de aplicativos LLM segura e confiável

Introdução abrangente O promptfoo é uma ferramenta de linha de comando de código aberto e uma biblioteca dedicada à avaliação e ao teste de equipe vermelha de aplicativos do Large Language Model (LLM). Ele fornece aos desenvolvedores um conjunto completo de ferramentas para a criação de prompts, modelos e geração baseada em recuperação (RAGs) confiáveis com...
6 meses atrás
02.7K
Docs:开源的协作笔记和文档管理工具

Docs: notas colaborativas de código aberto e ferramentas de gerenciamento de documentos

Introdução geral O Docs é uma plataforma de código aberto para anotações colaborativas e gerenciamento de documentos desenvolvida pela equipe suitenumerique. Ela foi criada usando as tecnologias Django e React com o objetivo de fornecer uma ferramenta fácil de usar para ajudar os usuários a fazer anotações, gerenciar...
5 meses atrás
02.7K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: uma plataforma de IA para gerar ativos digitais modelados em 3D de alta resolução

Introdução geral O Neural4D é uma plataforma inovadora baseada em IA, focada em ajudar os usuários a gerar rapidamente modelos e animações em 3D de alta qualidade com uma simples entrada de texto ou imagem. Desenvolvida pela DreamTech, ela se baseia na tecnologia líder mundial de geração de modelos grandes em 3D de ponta a ponta...
6 meses atrás
02.7K
Meeting:本地实时转录和生成会议纪要的开源客户端

Reunião: transcrição local em tempo real e geração de atas de reunião do cliente de código aberto

Introdução geral O Meeting Minutes (também conhecido como Meetily) é uma ferramenta de assistente de reunião de IA gratuita e de código aberto desenvolvida pela Zackriya Solutions, focada na captura de áudio de reuniões em tempo real, na geração de texto transcrito e na extração automática de...
5 meses atrás
02.7K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: Cursor de código aberto para design de front-end, design e publicação de código em aplicativos React

Introdução geral O Onlook é uma ferramenta de design de código aberto criada para designers e desenvolvedores que permite aos usuários projetar diretamente em um aplicativo React em execução e converter alterações de design em código. A ferramenta oferece uma experiência de edição visual intuitiva semelhante à do Figma ou do Webf...
6 meses atrás
02.7K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: projeto de código aberto de geração eficiente de vídeo que alega gerar um vídeo de um minuto em um minuto

Introdução abrangente O Magic 1-For-1 é um modelo eficiente de geração de vídeo projetado para otimizar o uso da memória e reduzir a latência da inferência. O modelo decompõe a tarefa de geração de texto para vídeo em duas subtarefas: geração de texto para imagem e geração de imagem para vídeo, permitindo treinamento e destilação mais eficientes...
6 meses atrás
02.7K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: um plug-in de assistente de IA do WordPress para diálogo, geração de posts e tradução

Introdução abrangente O WordPress AI Assistant Plugin (wp-ai-chat) é um plug-in de WordPress de código aberto projetado para fornecer aos usuários uma variedade de recursos de IA, incluindo diálogo de IA, geração de artigos, resumo de artigos, tradução de artigos e leitura de conteúdo. O plug-in suporta o acoplamento de vários ...
6 meses atrás
02.7K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GUI GLIGEN: controle preciso da posição dos elementos da imagem, interface gráfica intuitiva baseada no ComfyUI

Introdução geral O GLIGEN GUI é uma interface gráfica intuitiva baseada no ComfyUI, projetada para simplificar o uso do modelo GLIGEN, um novo modelo de texto para imagem que permite a especificação precisa da posição dos objetos em uma imagem. Com o GLIGE...
11 meses atrás
02.7K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: a maneira mais rápida de executar e ajustar o LLM localmente!

Introdução geral O LlamaEdge é um projeto de código aberto desenvolvido para simplificar o processo de execução e ajuste fino de grandes modelos de linguagem (LLMs) em dispositivos locais ou de borda. O projeto oferece suporte à família de modelos Llama2 e fornece serviços de API compatíveis com OpenAI que permitem aos usuários criar e executar facilmente...
7 meses atrás
02.7K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: um criador de capas on-line projetado para gerar capas personalizadas para blogs, vídeos curtos, mídias sociais e muito mais!

Introdução geral O Mini-Cover é uma ferramenta de geração de capas on-line de código aberto projetada para gerar capas personalizadas para plataformas como blogs, vídeos curtos e mídias sociais. Desenvolvida por JLinMr, a ferramenta tem como objetivo fornecer uma solução simples e eficiente para ajudar os usuários a gerar rapidamente capas que atendam às suas necessidades...
8 meses atrás
02.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: implementação de código aberto do NotebookLM com base no Deepseek-V3 e no PlayHT TTS

Introdução geral O Open Source NotebookLM é um projeto inovador de inteligência artificial que combina os recursos de compreensão de linguagem do Deepseek-V3 com a tecnologia de síntese de fala do PlayHT, com o objetivo de criar um sistema inteligente de diálogo para anotações. O projeto foi desenvolvido pela Build Fast com...
7 meses atrás
02.7K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: documentos PDF serão traduzidos para ferramentas bilíngues de código aberto

Introdução geral O BabelDOC é uma ferramenta de código aberto projetada para traduzir documentos PDF em um formato bilíngue. Ela foi desenvolvida pela equipe funstory-ai, hospedada no GitHub, atendendo principalmente à necessidade de lidar com usuários de documentos em idiomas estrangeiros, como pesquisadores ...
2 meses atrás
02.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: gera esboços e desenhos de linha de alta qualidade, retropropaga palavras de sugestão de imagem, instalação de pacote com um clique

Introdução geral O Sketch-Gen é uma ferramenta de geração de esboços e desenhos de linha baseada em tecnologia de IA, projetada para ajudar artistas e designers a gerar rapidamente esboços e desenhos de linha de alta qualidade. Derivada do projeto Paints-UNDO, a ferramenta usa modelos avançados de aprendizado de máquina que podem...
8 meses atrás
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: modelo multimodal de código aberto para apoiar a compreensão de vídeos e várias rodadas de diálogo

Introdução abrangente O CogVLM2 é um modelo multimodal de código aberto desenvolvido pelo Grupo de Pesquisa em Mineração de Dados da Universidade de Tsinghua (THUDM), com base na arquitetura Llama3-8B e com o objetivo de oferecer desempenho comparável ou até melhor que o GPT-4V. O modelo oferece suporte à compreensão de imagens, ao diálogo em várias rodadas e à...
6 meses atrás
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: um cliente Python que demonstra o processo de execução de um corpo inteligente, fornecendo uma interface gráfica de usuário intuitiva

Introdução abrangente O AgentClientDemo é um projeto Python abrangente que integra a funcionalidade inteligente (Agente) e cliente (Cliente). O projeto é baseado na estrutura PyQt e fornece uma interface gráfica de usuário intuitiva e fácil de usar (G...
8 meses atrás
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa

Introdução abrangente O NVIDIA Garak é uma ferramenta de código aberto projetada especificamente para detectar vulnerabilidades em modelos de linguagem ampla (LLMs). Ela verifica o modelo quanto a vários pontos fracos, como ilusões, vazamento de dados, injeção de dicas, geração de mensagens de erro, geração de conteúdo prejudicial etc., por meio de sondagem estática, dinâmica e adaptativa...
9 meses atrás
02.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: um modelo de compreensão multimodal do lado final que oferece suporte à compreensão e análise multimodal de texto, imagem e áudio

Introdução abrangente O Infini-Megrez é uma solução de inteligência de ponta desenvolvida pela cúpula do núcleo inquestionável (Infinigence AI), com o objetivo de obter compreensão e análise multimodais eficientes por meio de co-projeto de hardware e software. O núcleo do projeto é o modelo Megrez-3B, que oferece suporte a gráficos...
7 meses atrás
02.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: uma estrutura de redação para gerar ensaios longos de alta qualidade, buscando conhecimento externo e, em seguida, refletindo sobre ele e criando uma árvore de conhecimento passo a passo

Introdução abrangente O OmniThink é uma estrutura inovadora de escrita automática projetada para gerar ensaios longos de alta qualidade, imitando a expansão iterativa e a reflexão dos processos cognitivos humanos. A estrutura se concentra em ampliar os limites do conhecimento e gerar informações ricas e profundas, o que o OmniThink faz construindo...
7 meses atrás
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: um modelo de vídeo de Vincennes que suporta entrada multilíngue e geração de vídeos longos

Introdução abrangente O Step-Video-T2V é um modelo avançado de conversão de texto em vídeo da StepFun AI (StepFun Star). O modelo tem 3 bilhões de parâmetros e é capaz de gerar vídeos de até 204 fps. Com um Variable Auto-Encoder (VAE) profundamente compactado, o modelo...
6 meses atrás
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model: Vídeo de referência de mapa de retrato estático Vídeo de geração de movimento de retrato

Introdução geral Thin-Plate-Spline-Motion-Model é um projeto inovador de geração de animação de imagens apresentado na CVPR 2022. O projeto baseia-se na teoria das transformadas de spline de placa fina e é capaz de obter movimento de alta qualidade a partir de imagens estáticas com base na condução de vídeo...
7 meses atrás
02.7K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Sistema de investimento em IA: sistema automatizado de tomada de decisões de investimento em ações da categoria A, usando um sistema de inteligência múltipla para analisar dados de mercado

Introdução abrangente O A_Share_investment_Agent é um auxiliar de decisão de investimento em ações da categoria A baseado em um sistema de inteligência múltipla. O sistema foi projetado para analisar dados de mercado, calcular o valor intrínseco das ações, analisar o sentimento do mercado e dados fundamentais por meio de várias inteligências colaborativas para...
7 meses atrás
02.7K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: a ferramenta de desenvolvimento de código reduzido de código aberto da Shangtang para a criação de aplicativos corporais multiinteligentes

Introdução abrangente O LazyLLM é uma ferramenta de código aberto desenvolvida pela equipe do LazyAGI, com foco na simplificação do processo de desenvolvimento de aplicativos de modelos grandes de inteligência múltipla. Ela ajuda os desenvolvedores a criar rapidamente aplicativos complexos de IA por meio da implantação com um clique e de mecanismos de gateway leves, poupando a tediosa configuração de engenharia...
6 meses atrás
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de dados de destilação DeepSeek-R1 de sangue puro baseado na China, compatível com o conjunto de dados SFT de destilação R1 chinês

Introdução abrangente O conjunto de dados chinês de destilação DeepSeek-R1 é um conjunto de dados chinês de código aberto que contém 110 mil dados projetados para dar suporte à pesquisa de aprendizado de máquina e processamento de linguagem natural. O conjunto de dados foi lançado pela equipe de NLP de Cong Liu e contém não apenas dados matemáticos, mas também um grande número de tipos gerais...
6 meses atrás
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: documentos digitalizados em PDF para ferramentas de código aberto Markdown

Introdução geral O PDF Craft é uma ferramenta de código aberto projetada para digitalizar PDFs de livros e convertê-los para o formato Markdown. Ela foi desenvolvida pelo oomol-lab e está hospedada no GitHub para usuários que gostam de organizar seus livros eletrônicos. A ferramenta funciona por meio desta ...
5 meses atrás
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente do assistente inteligente de bate-papo em grupo do WeChat para Windows

Introdução abrangente O WeChatAI é um assistente inteligente pessoal e de bate-papo em grupo do WeChat baseado em Python, que oferece suporte a uma variedade de modelos de linguagem grandes (como DeepSeek, Gemini, Tongyi Thousand Questions), que podem proporcionar diálogo inteligente, resposta automática e outras funções. O projeto usa modelos modernos de ...
6 meses atrás
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: um cliente de visualização de fluxo de trabalho para modelos de IA com base na orquestração de nós

Introdução geral O NodeTool é uma plataforma inovadora de criação de IA projetada para fornecer uma interface simples e intuitiva para entusiastas de IA, desenvolvedores, cientistas de dados e criativos. Seja você um artista, desenvolvedor ou iniciante, o NodeTool o ajuda a criar protótipos criativos rapidamente...
8 meses atrás
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: um kit de ferramentas de código aberto para conectar inteligências de IA ao protocolo Solana

Introdução geral O Solana Agent Kit é um kit de ferramentas de código aberto projetado para conectar perfeitamente as inteligências de IA ao protocolo de blockchain Solana. O kit permite que tanto os pesquisadores de IA quanto os desenvolvedores de criptomoedas usem qualquer corpo inteligente treinado por modelo para realizar mais de...
6 meses atrás
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

Editor WeChat Markdown: ferramentas simples e eficientes de layout gráfico do WeChat, uma chave para colar o artigo no número público do WeChat

Introdução abrangente O WeChat Markdown Editor (WeChat Markdown Editor) é uma ferramenta de layout gráfico do WeChat altamente concisa, projetada para ajudar os usuários a criar facilmente belas postagens no WeChat. O editor é compatível com todos os recursos básicos do Markdown ...
7 meses atrás
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: recupere o conteúdo e resuma o conhecimento de documentos maciços e de várias fontes

Introdução abrangente O wdoc é um poderoso sistema RAG (Retrieval Augmentation Generation) projetado para processar e analisar grandes quantidades de documentos diversos. Ele é capaz de recuperar uma grande variedade de tipos de documentos, incluindo PDFs, páginas da Web, vídeos do YouTube, arquivos de áudio etc. O wdoc é especialmente adequado para processar...
6 meses atrás
02.7K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: pesquisa na Web e elaboração de relatórios usando o LLM nativo, detalhando automaticamente os tópicos especificados pelo usuário e gerando resumos.

Introdução geral O Research Rabbit é um assistente nativo de pesquisa e resumo na Web baseado em LLM (Large Language Model). Depois que o usuário fornece um tópico de pesquisa, o Research Rabbit gera uma consulta de pesquisa, obtém resultados relevantes na Web e resume esses resultados...
4 meses atrás
02.7K