Círculo de compartilhamento de IA

Dia arqueando um peão e compartilhando o rei!
Trackers:用于视频对象跟踪的开源工具库

Trackers: biblioteca de ferramentas de código aberto para rastreamento de objetos de vídeo

Introdução geral Trackers é uma biblioteca de ferramentas Python de código aberto voltada para o rastreamento de vários objetos em vídeo. Ela integra vários dos principais algoritmos de rastreamento, como o SORT e o DeepSORT, e permite que os usuários combinem diferentes modelos de detecção de objetos (como o YOLO...
3 meses atrás
01.9K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: processamento de áudio de código aberto e modelo de base de diálogo

Introdução geral O Kimi-Audio é um modelo de base de áudio de código aberto desenvolvido pela Moonshot AI, com foco na compreensão, geração e diálogo de áudio. Ele oferece suporte a uma ampla gama de tarefas de processamento de áudio, como reconhecimento de fala, P&R de áudio e reconhecimento de emoção de fala. O modelo foi testado em mais de 130...
3 meses atrás
02.3K
Describe Anything:为图像和视频区域生成详细描述的开源工具

Describe Anything: uma ferramenta de código aberto para gerar descrições detalhadas de imagens e áreas de vídeo

Descrição geral O Describe Anything é um projeto de código aberto desenvolvido pela NVIDIA e por várias universidades, com o modelo Describe Anything (DAM) em seu núcleo. Essa ferramenta pode marcar imagens ou vídeos com base nas informações do usuário...
3 meses atrás
02.2K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: criando uma ferramenta de colaboração de tarefas de inteligência múltipla em uma única frase

Introdução geral O Cooragent é uma estrutura de colaboração de agentes de IA de código aberto desenvolvida pelo LeapLab da Universidade de Tsinghua e hospedada no GitHub. Ele permite que os usuários criem agentes de IA inteligentes com uma descrição de uma frase e oferece suporte a vários agentes para colaborar em tarefas complexas. A estrutura oferece dois...
3 meses atrás
02.3K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter: uma ferramenta de código aberto para gerar caracteres consistentes a partir de uma única imagem

Introdução geral O InstantCharacter é um projeto de código aberto desenvolvido pela Tencent Hunyuan e pela equipe do InstantX, hospedado no GitHub. Ele gera mapas de caracteres de aparência consistente com uma imagem de referência e uma descrição de texto...
3 meses atrás
02.6K
Claude生成深度研究报告的MCP服务

Serviço MCP da Claude para gerar relatórios de pesquisa aprofundados

Introdução geral O MCP Server Deep Research é uma ferramenta de código aberto que gera automaticamente relatórios de pesquisa estruturados para problemas complexos por meio de inteligência artificial e pesquisa na Web. Os usuários inserem uma pergunta de pesquisa, e a ferramenta divide a pergunta, procura informações confiáveis, avalia a credibilidade da fonte...
3 meses atrás
01.9K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: uma ferramenta de código aberto que fornece uma estrutura de memória de nível empresarial para modelos grandes

Introdução abrangente O Deep Recall é uma estrutura de memória de código aberto e de classe empresarial projetada para modelos de linguagem grandes (LLMs). Ele oferece capacidade de resposta hiperpersonalizada por meio de recuperação e integração contextuais eficientes. A estrutura usa uma arquitetura de três camadas, incluindo um serviço de memória, um serviço de raciocínio e um coordenador, com suporte...
3 meses atrás
02K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee: assistente de pesquisa de IA de código aberto gera estudos de citação

Introdução geral O CleverBee é um assistente de pesquisa de IA de código aberto hospedado no GitHub e desenvolvido pela SureScaleAI. Ele ajuda os usuários combinando a tecnologia de navegação na Web com grandes modelos de linguagem (como o Gemini e o Claude)...
3 meses atrás
02K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: uma ferramenta de código aberto para gerar retratos falados realistas

Introdução geral O FantasyTalking é um projeto de código aberto desenvolvido pela equipe do Fantasy-AMAP, com foco na geração de vídeos de retratos falados realistas por meio da unidade de áudio. O projeto é baseado no modelo avançado de difusão de vídeo Wan2.1, combinado com o codificador de áudio Wa...
3 meses atrás
02.6K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: transformação automática de documentos de aprendizado de máquina em código executável

Introdução geral O Paper2Code é um projeto de código aberto que visa resolver o problema da falta de implementações de código para artigos de aprendizado de máquina. Ele transforma automaticamente artigos científicos em repositórios de código executáveis por meio do sistema multiagente de modelagem de linguagem grande (LLM) PaperCoder. O sistema usa planejamento ...
3 meses atrás
02K