Banana Slides - Herramienta de generación de PPT de AI de código abierto basada en el modelo Nano Banana Pro.
Banana Slides es un generador inteligente de PPT de código abierto basado en el modelo Nano Banana Pro AI, que permite crear rápidamente presentaciones profesionales utilizando comandos de lenguaje natural. Permite a los usuarios describir el tema en una frase (por ejemplo, "Impacto humano en el ecosistema"), que puede ser auto...
Kaleido - Un modelo de generación de vídeo de referencia multisujeto de código abierto creado por Smart Spectrum AI en colaboración con la Universidad de Tsinghua y otras instituciones.
Kaleido es un modelo de generación de vídeo de referencia multisujeto de código abierto desarrollado conjuntamente por la Universidad Tecnológica de Hefei, la Universidad de Tsinghua y Smart Spectrum AI. Genera vídeos coherentes con el sujeto a través de múltiples imágenes de referencia, resolviendo las deficiencias de los modelos existentes en cuanto a coherencia multisujeto y desacoplamiento del fondo.Kaleido genera vídeos a través de un...
Paper2Slides - La Universidad de Hong Kong convierte documentos académicos de código abierto en diapositivas Herramientas de IA
Paper2Slides es una herramienta de IA de código abierto del Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong que convierte documentos académicos en diapositivas o pósters profesionales en un solo clic. Utiliza la tecnología RAG (Retrieval Augmented Generation), analizando directamente el contenido del documento en lugar de basarse en información de la red, para garantizar que el PPT generado sea altamente coherente con el original....
RealVideo - Sistema de generación de vídeo en tiempo real de código abierto de Wisdom Spectrum AI
RealVideo es un sistema de generación de vídeo en tiempo real de código abierto de Smart Spectrum AI que puede generar rápidamente respuestas de vídeo naturales y fluidas en 2 o 3 segundos. Los usuarios solo tienen que subir una foto e introducir un texto, y el sistema genera la voz y el vídeo correspondientes, lo que permite dialogar en tiempo real con personajes de IA....
OpenScreen - Herramienta de grabación de pantalla gratuita y de código abierto para Mac y Windows.
OpenScreen es una herramienta de grabación de pantalla de código abierto y gratuita que proporciona a los usuarios una alternativa fácil de usar y funcional a Screen Studio. Es compatible tanto con Mac como con Windows, es totalmente gratuita y sigue el protocolo del MIT, y puede utilizarse para grabaciones individuales de...
SCAIL - Marco de generación de animación de personajes para cine y televisión de código abierto de Wisdom spectrum y Tsinghua
SCAIL (Studio-Grade Character Animation via In-Context Learning) es un marco de generación de animación de personajes para cine y televisión propuesto por Smart Spectrum en colaboración con el grupo del profesor Liu Yongjin de la Universidad de Tsinghua. A través de...
DeepSearchQA: pruebas de referencia de código abierto de Google para agentes de investigación de IA
DeepSearchQA es la prueba de referencia de código abierto de Google para agentes de investigación de IA, diseñada para evaluar el rendimiento de las inteligencias en tareas de consulta complejas de varios pasos. Consta de 900 tareas de "cadena causal" diseñadas a mano que abarcan 17 dominios y exigen que la IA actúe como un investigador humano y...
Claude-Mem - Complemento de memoria de código abierto de Claude con soporte de memoria persistente entre sesiones
Claude-Mem es un complemento de código abierto para Claude Code que aborda el problema de la pérdida de memoria de la IA entre sesiones. Ayuda a Claude capturando automáticamente el uso que la herramienta hace de las observaciones, generando resúmenes semánticos e inyectando contexto relevante en sesiones posteriores....
KoalaQA - Sistema de AI de código abierto para el servicio postventa que ayuda a las empresas a crear rápidamente plataformas de preguntas y respuestas
KoalaQA es un sistema de servicio posventa inteligente de código abierto desarrollado por el equipo de Chaitin. Basado en el modelo de IA, proporciona funciones de servicio al cliente de IA, búsqueda de IA y gestión de base de conocimientos para ayudar a las empresas a crear rápidamente una plataforma inteligente de preguntas y respuestas. El sistema permite responder en tiempo real 24/7 ...
VoxCPM 1.5 - Modelado de texto a voz de código abierto de extremo a extremo de Faceted Intelligence
VoxCPM 1.5 es un modelo de generación de voz de código abierto publicado por Facade Intelligence, basado en la tecnología de conversión de texto a voz (TTS) sin necesidad de divisor, con varias innovaciones y mejoras. Adoptando una arquitectura autorregresiva de difusión de extremo a extremo, genera formas de onda de habla continua directamente a partir del texto, evitando las limitaciones de los métodos tradicionales de segmentación...









