Círculo de intercambio de inteligencia artificial

¡Día arqueando un peón y compartiendo por el rey!
Trackers:用于视频对象跟踪的开源工具库

Trackers: biblioteca de herramientas de código abierto para el seguimiento de objetos en vídeo

Introducción general Trackers es una biblioteca de herramientas Python de código abierto centrada en el seguimiento multiobjeto en vídeo. Integra varios algoritmos de seguimiento líderes, como SORT y DeepSORT, y permite a los usuarios combinar diferentes modelos de detección de objetos (como YOLO...
hace 3 meses
02K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...
hace 3 meses
02.3K
Describe Anything:为图像和视频区域生成详细描述的开源工具

Describe Anything: herramienta de código abierto para generar descripciones detalladas de imágenes y zonas de vídeo.

Introducción general Describe Anything es un proyecto de código abierto desarrollado por NVIDIA y varias universidades, cuyo núcleo es el modelo Describe Anything (DAM). Esta herramienta puede etiquetar imágenes o vídeos basándose en la...
hace 3 meses
02.3K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: creación de una herramienta de colaboración en tareas multiinteligencia en una frase

Introducción general Cooragent es un marco de colaboración de agentes de IA de código abierto desarrollado por LeapLab en la Universidad de Tsinghua y alojado en GitHub. Permite a los usuarios crear agentes de IA inteligentes con una descripción de una frase y admite múltiples agentes para colaborar en tareas complejas. El marco proporciona dos...
hace 3 meses
02.3K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter: una herramienta de código abierto para generar caracteres coherentes a partir de una sola imagen

Introducción general InstantCharacter es un proyecto de código abierto desarrollado por Tencent Hunyuan y el equipo InstantX, alojado en GitHub. Genera mapas de caracteres de aspecto coherente con una imagen de referencia y una descripción de texto....
hace 3 meses
02.6K
Claude生成深度研究报告的MCP服务

Servicio MCP de Claude para generar informes de investigación en profundidad

Introducción general MCP Server Deep Research es una herramienta de código abierto que genera automáticamente informes de investigación estructurados para problemas complejos mediante inteligencia artificial y búsqueda en la web. Los usuarios introducen una pregunta de investigación y la herramienta la desglosa, busca información autorizada, evalúa la credibilidad de las fuentes...
hace 3 meses
01.9K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: una herramienta de código abierto que proporciona un marco de memoria de clase empresarial para modelos de gran tamaño.

Introducción Deep Recall es un marco de memoria empresarial de código abierto diseñado para grandes modelos lingüísticos (LLM). Proporciona una capacidad de respuesta hiperpersonalizada a través de una recuperación y una integración contextuales eficaces. El marco utiliza una arquitectura de tres niveles, que incluye un servicio de memoria, un servicio de razonamiento y un...
hace 3 meses
02.1K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee: asistente de investigación de código abierto que genera estudios de citas

Introducción general CleverBee es un asistente de investigación de IA de código abierto alojado en GitHub y desarrollado por SureScaleAI. Ayuda a los usuarios combinando tecnología de navegación web con grandes modelos lingüísticos (como Gemini y Claude)....
hace 3 meses
02.1K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: una herramienta de código abierto para generar retratos hablados realistas

Introducción general FantasyTalking es un proyecto de código abierto desarrollado por el equipo Fantasy-AMAP, centrado en la generación de realismo hablando videos retrato a través de la unidad de audio. El proyecto se basa en el modelo avanzado de difusión de vídeo Wan2.1 , combinado con el codificador de audio Wa...
hace 3 meses
02.6K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: conversión automática de documentos de aprendizaje automático en código ejecutable

Introducción general Paper2Code es un proyecto de código abierto que pretende resolver el problema de la falta de implementaciones de código para artículos de aprendizaje automático. Transforma automáticamente artículos científicos en repositorios de código ejecutables a través del sistema multiagente de modelado de grandes lenguajes (LLM) PaperCoder. El sistema utiliza la planificación ...
hace 3 meses
02K