Projeto de código aberto de IA

Total de 1020 artigos
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: criador de fluxo de trabalho de código aberto para agentes de IA

Introdução abrangente O Sim Studio é uma plataforma de código aberto para a criação de fluxos de trabalho de agentes de IA, focada em ajudar os usuários a projetar, testar e implementar rapidamente fluxos de trabalho de modelo de linguagem (LLM) em grande escala por meio de uma interface visual leve e intuitiva. Os usuários podem criar fluxos de trabalho complexos sem programação profunda, arrastando e soltando...
3 meses atrás
01.2K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: uma ferramenta de IA para auxiliar na leitura e análise de artigos acadêmicos

Introdução geral O Mad Professor (Grumpy Professor Reads Papers) é uma ferramenta acadêmica de IA de código aberto desenvolvida para pesquisadores e estudantes para simplificar a leitura e a análise de artigos acadêmicos. Ela integra processamento de PDF, tradução de IA, recuperação de RAG, perguntas de IA...
3 meses atrás
01.1K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: uma ferramenta de código aberto para editar imagens com instruções em linguagem natural

Introdução geral O Step1X-Edit é uma estrutura de edição de imagens de código aberto desenvolvida pela equipe de IA da Stepfun e hospedada no GitHub. Ele combina um modelo multimodal de linguagem grande (Qwen-VL) e um transformador de difusão (DiT) para permitir que os usuários criem imagens por meio de um método simples e natural.
3 meses atrás
0928
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: diálogo falado natural de baixa latência com IA

Introdução geral O RealtimeVoiceChat é um projeto de código aberto voltado para conversas naturais e em tempo real com inteligência artificial via voz. Os usuários usam um microfone para inserir sua voz, e o sistema captura o áudio por meio de um navegador, converte-o rapidamente em texto, e um modelo de linguagem grande (LLM) gera de volta...
3 meses atrás
0818
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: um pequeno modelo de código aberto para raciocínio matemático eficiente e geração de código

Introdução geral O MiMo é um projeto de modelagem de linguagem grande de código aberto desenvolvido pela Xiaomi, com foco em raciocínio matemático e geração de código. O produto principal é a família de modelos MiMo-7B, que contém um modelo básico (Base), um modelo de ajuste fino supervisionado (SFT), um produto químico forte treinado a partir do modelo básico...
3 meses atrás
01.2K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: treinamento e síntese de fala em podcasts personalizados

O Synthesis Muyan-TTS é um modelo de conversão de texto em fala (TTS) de código aberto projetado para cenários de podcasting. Ele é pré-treinado com mais de 100.000 horas de dados de áudio de podcast e suporta síntese de fala de amostra zero para gerar fala natural de alta qualidade. O modelo é baseado no Llama-3.2-3...
3 meses atrás
01.2K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: serviços MCP para controle de software CAD por meio de comandos de linguagem natural

Introdução geral O CAD-MCP é um projeto de código aberto que permite aos usuários controlar o software CAD por meio de comandos de linguagem natural para operações de desenho. Ele combina processamento de linguagem natural e tecnologia de automação de CAD, de modo que os usuários não precisam operar manualmente a interface de CAD, basta inserir comandos de texto simples que ...
3 meses atrás
01.3K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: ajuste fino de modelos de linguagem usando gráficos de conhecimento para gerar dados sintéticos

Introdução abrangente O GraphGen é uma estrutura de código aberto desenvolvida pelo OpenScienceLab, um laboratório de IA em Xangai, hospedado no GitHub, com foco na otimização do ajuste fino supervisionado de modelos de linguagem grande (LLMs), orientando a geração de dados sintéticos por meio de gráficos de conhecimento. Ele foi desenvolvido a partir de ...
3 meses atrás
0904
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: projeto experimental para executar um modelo de linguagem em grande escala em um arquivo PDF

Introdução geral O llm.pdf é um projeto de código aberto que permite aos usuários executar modelos de linguagem grandes (LLMs) diretamente em arquivos PDF. Desenvolvido por EvanZhouDev e hospedado no GitHub, esse projeto demonstra uma abordagem inovadora: por meio do Em...
3 meses atrás
0997
Abogen:将多种文本格式转换为有声读物的工具

Abogen: uma ferramenta para converter vários formatos de texto em audiolivros

Introdução geral O Abogen é uma ferramenta de código aberto projetada para converter rapidamente arquivos ePub, PDF ou de texto simples em áudio de alta qualidade. Ele usa o modelo Kokoro-82M para gerar uma fala natural e suave e oferece suporte à geração simultânea de legendas, o que é adequado para a produção de audiolivros...
3 meses atrás
0957
Local Deep Research:本地运行的生成深度研究报告工具

Local Deep Research: uma ferramenta executada localmente para gerar relatórios de pesquisa aprofundados

Introdução geral O Local Deep Research é um assistente de pesquisa de IA de código aberto projetado para ajudar os usuários a realizar pesquisas profundas e gerar relatórios detalhados para problemas complexos. Ele oferece suporte à execução local, permitindo que os usuários concluam tarefas de pesquisa sem depender de serviços em nuvem. A ferramenta ...
3 meses atrás
01.1K
Trackers:用于视频对象跟踪的开源工具库

Trackers: biblioteca de ferramentas de código aberto para rastreamento de objetos de vídeo

Introdução geral Trackers é uma biblioteca de ferramentas Python de código aberto voltada para o rastreamento de vários objetos em vídeo. Ela integra vários dos principais algoritmos de rastreamento, como o SORT e o DeepSORT, e permite que os usuários combinem diferentes modelos de detecção de objetos (como o YOLO...
3 meses atrás
01.2K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: processamento de áudio de código aberto e modelo de base de diálogo

Introdução geral O Kimi-Audio é um modelo de base de áudio de código aberto desenvolvido pela Moonshot AI, com foco na compreensão, geração e diálogo de áudio. Ele oferece suporte a uma ampla gama de tarefas de processamento de áudio, como reconhecimento de fala, P&R de áudio e reconhecimento de emoção de fala. O modelo foi testado em mais de 130...
3 meses atrás
01K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: criando uma ferramenta de colaboração de tarefas de inteligência múltipla em uma única frase

Introdução geral O Cooragent é uma estrutura de colaboração de agentes de IA de código aberto desenvolvida pelo LeapLab da Universidade de Tsinghua e hospedada no GitHub. Ele permite que os usuários criem agentes de IA inteligentes com uma descrição de uma frase e oferece suporte a vários agentes para colaborar em tarefas complexas. A estrutura oferece dois...
3 meses atrás
01K
Claude生成深度研究报告的MCP服务

Serviço MCP da Claude para gerar relatórios de pesquisa aprofundados

Introdução geral O MCP Server Deep Research é uma ferramenta de código aberto que gera automaticamente relatórios de pesquisa estruturados para problemas complexos por meio de inteligência artificial e pesquisa na Web. Os usuários inserem uma pergunta de pesquisa, e a ferramenta divide a pergunta, procura informações confiáveis, avalia a credibilidade da fonte...
3 meses atrás
0891
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: uma ferramenta de código aberto que fornece uma estrutura de memória de nível empresarial para modelos grandes

Introdução abrangente O Deep Recall é uma estrutura de memória de código aberto e de classe empresarial projetada para modelos de linguagem grandes (LLMs). Ele oferece capacidade de resposta hiperpersonalizada por meio de recuperação e integração contextuais eficientes. A estrutura usa uma arquitetura de três camadas, incluindo um serviço de memória, um serviço de raciocínio e um coordenador, com suporte...
3 meses atrás
01K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: uma ferramenta de código aberto para gerar retratos falados realistas

Introdução geral O FantasyTalking é um projeto de código aberto desenvolvido pela equipe do Fantasy-AMAP, com foco na geração de vídeos de retratos falados realistas por meio da unidade de áudio. O projeto é baseado no modelo avançado de difusão de vídeo Wan2.1, combinado com o codificador de áudio Wa...
3 meses atrás
01.6K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: transformação automática de documentos de aprendizado de máquina em código executável

Introdução geral O Paper2Code é um projeto de código aberto que visa resolver o problema da falta de implementações de código para artigos de aprendizado de máquina. Ele transforma automaticamente artigos científicos em repositórios de código executáveis por meio do sistema multiagente de modelagem de linguagem grande (LLM) PaperCoder. O sistema usa planejamento ...
3 meses atrás
01K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: geração automatizada de documentação de IA para repositórios do GitHub e do GitLab

Introdução abrangente O DeepWiki-Open é um projeto de código aberto desenvolvido para gerar automaticamente documentação estruturada para repositórios de código no GitHub, GitLab e Bitbucket. Ele usa a tecnologia de IA para analisar a estrutura do código, o conteúdo do arquivo e as relações lógicas, gerando rapidamente ...
3 meses atrás
01.5K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: transformando artigos populares de tecnologia em podcasts de áudio prontos para serem ouvidos

Introdução geral O Audibit é um projeto de código aberto, cuja função principal é transformar automaticamente os artigos do Hacker News, TechCrunch e outros artigos populares sobre tecnologia em podcasts de áudio, para que os usuários possam ouvir informações pela Web ou por dispositivos móveis durante o trajeto para o trabalho, o exercício físico ou quando estiverem ocupados. O projeto faz ...
3 meses atrás
01K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: uma estrutura de código aberto TypeScript para criar rapidamente inteligências de IA

Introdução geral O VoltAgent é uma estrutura TypeScript de código aberto projetada para que os desenvolvedores ajudem a criar e orquestrar rapidamente inteligências de IA. Ele fornece ferramentas modulares e um modelo de desenvolvimento padronizado que simplifica a interação com grandes modelos de linguagem (LLMs), estado...
3 meses atrás
0959
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: extensão do navegador para gerenciar e usar prompts rapidamente

O General Quick Prompt é uma extensão de navegador de código aberto que se concentra no gerenciamento de palavras de prompt (Prompt) e na entrada rápida. Os usuários podem criar, organizar e armazenar bibliotecas de Prompts e inserir rapidamente o conteúdo predefinido do Prompt na caixa de entrada de qualquer página da Web. Essa ferramenta é especialmente ...
3 meses atrás
01.3K
Suna:集成浏览器操作与数据分析的智能代理

Suna: agentes inteligentes que integram operações de navegador e análise de dados

Introdução geral O Suna é um agente de IA de uso geral de código aberto desenvolvido pela Kortix AI, hospedado no GitHub, com base na licença Apache 2.0, permitindo que os usuários façam download, modifiquem e hospedem o agente gratuitamente. Ele usa o diálogo em linguagem natural para ajudar os usuários com...
4 meses atrás
01.3K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: grandes modelos multimodais de código aberto para processamento de imagens, vídeos e textos

Introdução abrangente O InternVL é um grande projeto de modelo multimodal de código aberto desenvolvido pelo Shanghai Artificial Intelligence Lab (OpenGVLab) e hospedado no GitHub. Ele integra recursos de processamento visual e linguístico para apoiar a compreensão e a geração abrangentes de imagens, vídeos e textos.
4 meses atrás
01.1K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: um assistente de engenharia de IA para criar rapidamente bases de código proprietárias

Introdução abrangente A Potpie AI é uma plataforma de código aberto focada em fornecer aos desenvolvedores assistentes de engenharia de IA personalizados. Ela permite que os agentes de IA compreendam profundamente a estrutura e a lógica do código e automatizem tarefas como depuração, teste e geração de código, criando um gráfico de conhecimento da base de código. Os usuários podem usar...
4 meses atrás
01.3K
Vexa:实时会议转录与智能知识提取工具

Vexa: uma ferramenta inteligente de extração de conhecimento e transcrição de reuniões em tempo real

Introdução abrangente O Vexa é uma plataforma de código aberto de transcrição de reuniões em tempo real e de gerenciamento de conhecimento projetada para fornecer serviços eficientes de gravação de reuniões e extração inteligente de conhecimento para empresas e indivíduos. Ele se une automaticamente a plataformas como Google Meet, Zoom etc. por meio de robôs de reunião orientados por API...
4 meses atrás
01.2K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: um sistema de aprimoramento de memória baseado na extensão de código Roo

Introdução abrangente O RooFlow é uma ferramenta de programação assistida por IA de código aberto com a funcionalidade principal de preservar o código, as decisões e o progresso das tarefas durante o desenvolvimento por meio do registro de projetos. Ele se baseia na extensão Roo Code e integra cinco modos: arquitetura, codificação, teste, depuração e perguntas e respostas. Esses modos interagem...
4 meses atrás
0941
Zev:用自然语言快速查询终端命令的CLI工具

Zev: uma ferramenta CLI para consulta rápida de comandos de terminal em linguagem natural

Introdução geral O Zev é uma ferramenta de interface de linha de comando (CLI) fácil de usar que ajuda os usuários a consultar e gerar rapidamente comandos de terminal em linguagem natural. Em vez de ter de lembrar a sintaxe de comandos complexos, o Zev gera comandos de terminal descrevendo suas necessidades em linguagem cotidiana. Baseado no Ope...
4 meses atrás
0623
Together Open Deep Research:生成带索引的深度研究报告

Together Open Deep Research: Geração de relatórios de pesquisa profunda indexados

Introdução geral O Open Deep Research é uma ferramenta de pesquisa profunda desenvolvida e de código aberto pela equipe Together AI e hospedada no GitHub. Ela simula o processo de pesquisa humana por meio de um fluxo de trabalho de IA multiagente, gerando relatórios de pesquisa detalhados...
4 meses atrás
0690
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: uma ferramenta de gerenciamento que combina aprovações de processos automatizados inteligentes com auditorias humanas

Introdução geral O LLManager é uma ferramenta de gerenciamento de aprovação inteligente e de código aberto, desenvolvida com base na estrutura LangGraph da LangChain, focada na automação do processamento de solicitações de aprovação e, ao mesmo tempo, na otimização da tomada de decisões com revisão humana. Ele faz isso por meio de pesquisa semântica, aprendizado sem amostras e...
4 meses atrás
01.2K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: uma ferramenta inteligente para automatizar a documentação do código Python

Introdução geral O DocAgent é uma ferramenta de código aberto de geração de documentação de código Python desenvolvida pela Meta AI. Ela usa a colaboração de inteligência múltipla e a análise de código hierárquico para gerar automaticamente anotações de documentos de alta qualidade e com reconhecimento de contexto para bases de código Python (d...
4 meses atrás
0835
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: suporte para ferramentas de geração de imagens personalizadas de assunto único e de vários assuntos (adequadas para gráficos de comércio eletrônico)

UNO é uma estrutura de geração de imagens de código aberto desenvolvida pela ByteDance Intelligent Creation Team. Ele se baseia no modelo FLUX.1 e se concentra na geração de imagens personalizadas de objeto único e de vários objetos por meio de uma abordagem de generalização "menos para mais".
4 meses atrás
0857
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: ferramenta gratuita de código aberto para edição de síntese de músicas

Introdução geral O OpenUtau é uma plataforma gratuita e de código aberto de síntese e edição de músicas criada para oferecer à comunidade UTAU uma experiência de edição moderna. É o sucessor do software UTAU e resolve os problemas de compatibilidade e complexidade do software original.O OpenUtau é compatível com o Wind...
4 meses atrás
01.4K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: uma ferramenta baseada em gráficos heterogêneos para recuperação e geração de informações precisas

Uma introdução abrangente O NodeRAG é um sistema RAG (Retrieval Augmented Generation) de código aberto hospedado no GitHub e desenvolvido por Terry-Xu-666. Ele otimiza a recuperação e a geração de informações por meio de estruturas gráficas heterogêneas, melhorando significativamente a precisão da recuperação e a relevância contextual.
4 meses atrás
01.4K
Open Codex:将自然语言转换为Shell命令的开源AI工具

Open Codex: uma ferramenta de IA de código aberto para converter linguagem natural em comandos de shell

Introdução geral O Open Codex é uma ferramenta de IA de linha de comando de código aberto criada para que os desenvolvedores convertam instruções de linguagem natural em comandos de shell precisos. Ele usa um modelo de linguagem nativa (por exemplo, phi-4-mini), não requer rede ou chaves de API e todas as operações em...
4 meses atrás
0820
SkyReels V2:生成无限长度视频的开源AI工具

SkyReels V2: uma ferramenta de IA de código aberto para gerar vídeos de comprimento ilimitado

Introdução abrangente O SkyReels-V2 é um modelo de geração de vídeo de código aberto desenvolvido pela SkyworkAI. Ele oferece suporte à geração de vídeos de duração ilimitada por meio da avançada tecnologia Diffusion Forcing e é adequado para conversão de texto em vídeo (T2V) e gráficos...
4 meses atrás
01.2K
Dia:生成超现实多人对话的文本转语音模型

Dia: um modelo de conversão de texto em fala para gerar diálogos hiper-realistas para vários jogadores

Introdução geral O Dia é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pela Nari Labs, voltado para a geração de áudio de diálogo hiper-realista. Ele transforma scripts de texto em diálogos realistas com vários caracteres em um único processo, oferece suporte ao controle de emoções e entonação e até mesmo gera representações não verbais...
4 meses atrás
0867
Plandex:支持超长上下文的开源AI编码助手

Plandex: um assistente de codificação de IA de código aberto com suporte para contextos ultralongos

Introdução geral O Plandex é um assistente de codificação de IA de código aberto de ponta a ponta, projetado para projetos de software grandes e complexos. Ele pode planejar e executar tarefas em várias etapas, lidar com contextos de até 2 milhões de tokens e oferecer suporte a mais de 30 linguagens de programação.
4 meses atrás
01.1K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: a ferramenta de IA que gera automaticamente notas Markdown a partir de vídeos

Introdução abrangente O BiliNote é uma ferramenta de anotações de vídeo com IA de código aberto que suporta a extração de conteúdo dos links de vídeo do BiliNote e do YouTube para gerar automaticamente anotações claramente estruturadas no formato Markdown. Ele usa a transcrição de áudio nativa e uma variedade de modelos grandes (por exemplo, ...
4 meses atrás
0839
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: integração de várias fontes de dados em um único arquivo de texto

Introdução abrangente O OneFileLLM é uma ferramenta de linha de comando de código aberto projetada para consolidar várias fontes de dados em um único arquivo de texto para facilitar a entrada em modelos de linguagem grande (LLMs). Ele é compatível com o processamento de repositórios do GitHub, artigos do ArXiv, transcrições de vídeos do YouTube,...
4 meses atrás
01.2K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: memória gráfica baixa de 6G, crescimento rápido do projeto de código aberto de vídeo longo

Introdução geral O FramePack é uma ferramenta de geração de vídeo de código aberto que tem como objetivo tornar as técnicas de difusão de vídeo mais práticas. Ele desacopla a carga de trabalho de geração da duração do vídeo, compactando os quadros de entrada em um comprimento fixo por meio de uma rede neural exclusiva de previsão do próximo quadro. Isso significa que, mesmo ao gerar vídeos longos, os requisitos de memória de vídeo...
3 meses atrás
0969
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: um assistente de codificação de IA de linha de comando de terminal lançado pela OpenAI

Introdução geral O OpenAI Codex CLI é uma ferramenta de codificação de terminal de código aberto, desenvolvida pela OpenAI, projetada para desenvolvedores acostumados com terminais. Ele gera código, edita arquivos, executa comandos e integra o controle de versão do Git por meio de comandos de linguagem natural.
4 meses atrás
01.2K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: treinamento de 1 hora de um modelo de linguagem visual com 26 milhões de parâmetros

Introdução geral O MiniMind-V é um projeto de código aberto, hospedado no GitHub, criado para ajudar os usuários a treinar um modelo de linguagem visual (VLM) leve com apenas 26 milhões de parâmetros em menos de uma hora. Ele se baseia no modelo de linguagem MiniMind, com novos recursos visuais...
4 meses atrás
01K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: uma ferramenta de geração de vídeo de código aberto para otimizar a consistência facial

Introdução geral O Open-Sora é um projeto de código aberto criado para permitir que qualquer pessoa gere vídeos de alta qualidade com eficiência. Ele foi desenvolvido pela equipe hpcaitech para fornecer ferramentas de geração de vídeo a partir de texto ou imagens, com suporte a várias resoluções e durações. O projeto é totalmente de código aberto, com pesos de modelos públicos...
4 meses atrás
0914
OneLine:生成热点事件时间轴的AI工具

OneLine: uma ferramenta de IA para gerar linhas do tempo de eventos importantes

Introdução geral O OneLine é uma ferramenta de geração de linha do tempo de eventos quentes de código aberto hospedada no GitHub e desenvolvida pelo usuário chengtx809. Ele gera rapidamente uma linha do tempo de eventos por palavras-chave inseridas pelo usuário, mostrando a hora, o título, a descrição e as pessoas relacionadas ao evento...
4 meses atrás
0990
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: uma plataforma de bate-papo de código aberto para interagir com personagens de IA personalizados

Introdução geral O Agnai Chat é uma plataforma de bate-papo de IA de código aberto que permite aos usuários criar personagens de IA personalizados para interação com um ou vários jogadores. Ele é compatível com uma ampla gama de serviços de IA, incluindo OpenAI, Claude, Kobold, etc., e é adequado para entretenimento, interpretação de papéis, educação ou...
4 meses atrás
01.1K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: uma plataforma inteligente de perguntas e respostas baseada em gráficos de conhecimento

O Yuxi-Know é uma plataforma inteligente de perguntas e respostas de código aberto que combina o gráfico de conhecimento e a tecnologia RAG (Retrieval Augmented Generation) para ajudar os usuários a obter rapidamente respostas precisas. Ela se baseia no Neo4j para armazenar o gráfico de conhecimento, usando a estrutura FastAPI e VueJS ...
4 meses atrás
01.2K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: ferramenta de código aberto para extrair e consultar os registros de bate-papo do WeChat

Introdução geral O Chatlog é uma ferramenta de código aberto que se concentra na extração e consulta de registros de bate-papo do banco de dados local do WeChat. Ele é compatível com as versões 3.x e 4.0 do WeChat, abrangendo os sistemas Windows e macOS. Os usuários podem usar a linha de comando, a interface de terminal ou o H...
4 meses atrás
01.5K
VOP:提取复杂图表与数学公式的OCR工具

VOP: ferramenta de OCR para extração de diagramas complexos e fórmulas matemáticas

Introdução abrangente O Versatile OCR Program é uma ferramenta de reconhecimento óptico de caracteres (OCR) de código aberto projetada para trabalhar com documentos acadêmicos e educacionais complexos. Ele pode extrair texto, tabelas, fórmulas matemáticas, diagramas e esquemas de PDFs, imagens e outros documentos e gerar...
4 meses atrás
01.2K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural em chinês

Introdução geral O Orpheus-TTS é um sistema de conversão de texto em fala (TTS) de código aberto desenvolvido na arquitetura Llama-3b com o objetivo de gerar áudio próximo à fala humana natural. Ele foi lançado pela equipe da Canopy AI e é compatível com inglês, espanhol, francês...
4 meses atrás
01.3K
self.so:一键生成精美的个人简历网页

self.so: Gere uma bela página de currículo com um clique!

Introdução geral O self.so é uma ferramenta de código aberto criada para transformar rapidamente um currículo ou perfil do LinkedIn em um site pessoal. Os usuários simplesmente carregam um CV em PDF ou inserem um link do LinkedIn e o sistema o converte em um site pessoal usando a tecnologia de IA (baseada no Tog...
4 meses atrás
01.2K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: a partir de texto e imagens para gerar gráficos vetoriais SVG projeto de código aberto

Introdução geral O OmniSVG é um projeto de código aberto voltado para a geração de gráficos vetoriais (SVG) de alta qualidade por meio de um modelo multimodal. Ele usa modelos visual-linguísticos pré-treinados para dar suporte à geração de SVG a partir de descrições textuais ou entradas de imagens, abrangendo uma ampla gama de cenários, desde ícones simples até personagens complexos de anime. Itens ...
4 meses atrás
01.4K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: upload de wireframes para gerar código de front-end com base no Llama4

Introdução geral O Napkins.dev é um projeto de código aberto gratuito, cuja função principal é permitir que os usuários carreguem capturas de tela ou wireframes da interface para gerar automaticamente um código de front-end executável. Os usuários só precisam fornecer um desenho de projeto, a ferramenta será feita por meio do modelo Llama 4 (por Together ...
4 meses atrás
01K
Agent-Wiz:分析AI智能体工作流程和安全风险

Agent-Wiz: analisando fluxos de trabalho e riscos de segurança da AI Intelligentsia

Introdução geral O Agent-Wiz é uma ferramenta de linha de comando Python de código aberto projetada para desenvolvedores, pesquisadores e equipes de segurança. Ele pode extrair fluxos de trabalho complexos das principais estruturas de inteligências de IA, como LangGraph, CrewAI, AutoGen etc., para gerar...
4 meses atrás
0848
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: estrutura de planejamento e inferência de condução autônoma de ponta a ponta de código aberto da Xiaomi

Introdução abrangente O Orion é um projeto de código aberto desenvolvido pela Xiaomi Labs, com foco na tecnologia de direção autônoma de ponta a ponta (E2E). Ele resolve o problema de raciocínio causal insuficiente em cenários complexos por métodos tradicionais de direção autônoma por meio de modelos de linguagem visual (VLMs) e planejadores generativos.
4 meses atrás
0875
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: ferramenta de renderização para gerar vídeos com várias visualizações a partir de um único vídeo

Introdução geral O ReCamMaster é uma ferramenta de processamento de vídeo de código aberto, cuja função principal é gerar novas visualizações de câmera a partir de um único vídeo. Os usuários podem especificar a trilha da câmera e renderizar novamente o vídeo para obter uma imagem dinâmica com diferentes ângulos. Ele foi desenvolvido por uma equipe da Universidade de Zhejiang e da Racer Technology, com base em...
4 meses atrás
01.1K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: um modelo de compreensão de vídeo de código aberto para gerar descrições de vídeo de alta qualidade

Introdução abrangente O Tarsier é uma família de modelos de linguagem de vídeo de código aberto desenvolvida pela ByteDance para gerar descrições de vídeo de alta qualidade. Ela consiste em uma estrutura simples: o CLIP-ViT processa quadros de vídeo, combinado com um modelo de linguagem grande (LLM) para analisar...
4 meses atrás
01.1K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: uma ferramenta de IA para analisar as relações entre personagens de livros e gerar gráficos

Introdução geral O Austen é uma ferramenta de IA de código aberto que usa a estrutura Angular e a inicialização Analogjs, combinada com a tecnologia Mermaidjs para gerar gráficos que ajudam os usuários a analisar as relações entre personagens em livros. Os usuários podem entrar no Open...
4 meses atrás
01.1K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: ampliação de imagens de qualquer tamanho, ferramentas de código aberto de remoção de serrilhado

Introdução geral O Thera é uma ferramenta de super-resolução de imagens de código aberto desenvolvida por uma equipe da ETH Zurich e da Universidade de Zurich. Ela pode ampliar imagens de baixa resolução em escalas arbitrárias, como 2x, 3,14x ou até mesmo múltiplos não inteiros, e...
4 meses atrás
0957
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google lança protocolo aberto para comunicação entre inteligências de IA

Introdução geral O A2A (Agent2Agent) é um protocolo de código aberto desenvolvido pelo Google para permitir que as inteligências de IA desenvolvidas por diferentes estruturas ou fornecedores se comuniquem e colaborem entre si. Ele fornece um conjunto padronizado de métodos para que as inteligências descubram os recursos umas das outras, compartilhem tarefas e concluam o trabalho...
4 meses atrás
01.3K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: um assistente de programação de IA nativo auto-hospedado que se integra ao VSCode

Introdução geral O Tabby é um assistente de programação de IA de código aberto desenvolvido pela equipe do TabbyML que os usuários podem implantar localmente ou em um servidor. Ele oferece recursos semelhantes aos do GitHub Copilot, como preenchimento automático de código e perguntas e respostas inteligentes, mas o maior...
4 meses atrás
01.2K
LM Speed:快速测试大模型API性能

Velocidade do LM: teste rápido do desempenho de APIs de modelos grandes

Introdução geral O LM Speed é uma ferramenta projetada especificamente para desenvolvedores de IA e também está disponível como um serviço on-line em lmspeed.net Sua principal função é testar e analisar o desempenho das APIs de modelo de linguagem, ajudando os usuários a identificar rapidamente os gargalos de velocidade e otimizar as estratégias de chamada. Esse...
4 meses atrás
01.1K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: um serviço MCP para rastrear e organizar rapidamente a documentação técnica

Introdução geral O DevDocs é uma ferramenta de código aberto totalmente gratuita desenvolvida pela equipe da CyberAGI e hospedada no GitHub. Projetada para programadores e desenvolvedores de software, ela começa com o URL de um documento técnico, rastreia automaticamente as páginas relevantes e as organiza em um ma...
4 meses atrás
01.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: uma ferramenta inteligente para automatizar testes de software usando IA

Introdução geral O TestDriver é um site que usa tecnologia de inteligência artificial para ajudar os desenvolvedores a testar software. Ele automatiza a tarefa de testar software simulando ações humanas, como clicar em um mouse ou digitar um texto. No centro do site está um "computador usando um agente de IA" que opera como uma pessoa real...
4 meses atrás
0935
自动解析PDF内容并提取文字与表格的开源服务

Analise automaticamente o conteúdo do PDF e extraia texto e tabelas de serviços de código aberto

Introdução abrangente Analisa automaticamente o layout de documentos PDF, identifica texto, títulos, imagens, tabelas, fórmulas e outros elementos na página e determina sua ordem correta. A ferramenta oferece suporte à funcionalidade de OCR e pode converter PDFs digitalizados em texto pesquisável. Ela é executada no Docker e oferece dois modelos...
4 meses atrás
0998
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: reconhecimento de idiomas asiáticos e modelagem de fala para texto para idiomas asiáticos

Introdução abrangente O Dolphin é um modelo de código aberto desenvolvido pela DataoceanAI e pela Universidade de Tsinghua, com foco no reconhecimento de fala e de idioma para idiomas asiáticos. Ele é compatível com 40 idiomas do Leste Asiático, Sul da Ásia, Sudeste Asiático e Oriente Médio, além de 22 dialetos chineses...
4 meses atrás
01K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: treinamento de doppelgangers digitais com registros de bate-papo e vozes do WeChat

Introdução abrangente O WeClone é um projeto de código aberto que usa registros de bate-papo e mensagens de voz do WeChat, combinados com grandes modelos de linguagem e tecnologia de síntese de fala, para permitir que os usuários criem doppelgangers digitais personalizados. O projeto pode analisar os hábitos de bate-papo do usuário para treinar o modelo, mas também um pequeno número de amostras de voz para gerar sons realistas...
4 meses atrás
01.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: uma plataforma de código aberto para automatizar a conformidade com SOC 2, ISO 27001 e GDPR

Introdução geral A Comp AI é uma plataforma de código aberto desenvolvida pela Comp AI, Inc., com sede em São Francisco, EUA. Ela ajuda as organizações a concluir rapidamente os requisitos de conformidade, como SOC 2, ISO 27001 e GDPR, por meio de ferramentas automatizadas, com o objetivo de...
4 meses atrás
01.2K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: ferramenta de globalização multilíngue para vídeo com tradução e dublagem em um clique

Introdução abrangente O KrillinAI é uma ferramenta de processamento de vídeo de código aberto que se concentra no uso da inteligência artificial para ajudar os usuários a traduzir vídeos e dublá-los automaticamente. Ela pode começar desde o download do vídeo até a geração do produto final adaptado a diferentes plataformas, e todo o processo é feito com apenas alguns cliques. Os desenvolvedores estão disponíveis no GitHub...
2 meses atrás
01.6K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicativo da Web de bate-papo de IA de código aberto com upload de documentos e suporte a vários modelos

Introdução geral O Zola é um aplicativo de bate-papo com IA gratuito e de código aberto desenvolvido pelo desenvolvedor Julien Thibeaut (nome de usuário ibelick do GitHub) e hospedado no GitHub. Seu melhor recurso é que ele suporta vários modos de IA...
4 meses atrás
01.2K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: IA de condução baseada em aprendizado por reforço para estudar problemas complexos

Introdução abrangente O DeepResearcher é um projeto de código aberto desenvolvido pela equipe GAIR-NLP da Universidade Shanghai Jiao Tong. É uma ferramenta de pesquisa inteligente baseada em modelos de linguagem grandes (LLMs), treinados de ponta a ponta em ambientes reais da Web por meio da aprendizagem por reforço (RL). O projeto ...
4 meses atrás
0890
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: uma ferramenta de código aberto para gerar vídeos de anime e interações de personagens com comandos linguísticos

O AnimeGamer é uma ferramenta de código aberto do ARC Lab da Tencent. Os usuários podem gerar vídeos de anime com comandos de linguagem simples, como "Sousuke drive around in a purple car" (Sousuke dirige um carro roxo), além de permitir que diferentes personagens de anime interajam entre si, como Kiki de Magical Girl's Adventure e Sky City...
4 meses atrás
01.2K