SCAIL - Marco de generación de animación de personajes para cine y televisión de código abierto de Wisdom spectrum y Tsinghua
SCAIL (Studio-Grade Character Animation via In-Context Learning) es un marco de generación de animación de personajes para cine y televisión propuesto por Smart Spectrum en colaboración con el grupo del profesor Liu Yongjin de la Universidad de Tsinghua. A través de...
DeepSearchQA: pruebas de referencia de código abierto de Google para agentes de investigación de IA
DeepSearchQA es la prueba de referencia de código abierto de Google para agentes de investigación de IA, diseñada para evaluar el rendimiento de las inteligencias en tareas de consulta complejas de varios pasos. Consta de 900 tareas de "cadena causal" diseñadas a mano que abarcan 17 dominios y exigen que la IA actúe como un investigador humano y...
Claude-Mem - Complemento de memoria de código abierto de Claude con soporte de memoria persistente entre sesiones
Claude-Mem es un complemento de código abierto para Claude Code que aborda el problema de la pérdida de memoria de la IA entre sesiones. Ayuda a Claude capturando automáticamente el uso que la herramienta hace de las observaciones, generando resúmenes semánticos e inyectando contexto relevante en sesiones posteriores....
KoalaQA - Sistema de AI de código abierto para el servicio postventa que ayuda a las empresas a crear rápidamente plataformas de preguntas y respuestas
KoalaQA es un sistema de servicio posventa inteligente de código abierto desarrollado por el equipo de Chaitin. Basado en el modelo de IA, proporciona funciones de servicio al cliente de IA, búsqueda de IA y gestión de base de conocimientos para ayudar a las empresas a crear rápidamente una plataforma inteligente de preguntas y respuestas. El sistema permite responder en tiempo real 24/7 ...
VoxCPM 1.5 - Modelado de texto a voz de código abierto de extremo a extremo de Faceted Intelligence
VoxCPM 1.5 es un modelo de generación de voz de código abierto publicado por Facade Intelligence, basado en la tecnología de conversión de texto a voz (TTS) sin necesidad de divisor, con varias innovaciones y mejoras. Adoptando una arquitectura autorregresiva de difusión de extremo a extremo, genera formas de onda de habla continua directamente a partir del texto, evitando las limitaciones de los métodos tradicionales de segmentación...
Mistral Vibe - Asistente de código de línea de comandos de código abierto de Mistral AI
Mistral Vibe es un asistente de codificación de línea de comandos de código abierto de Mistral AI, desarrollado basado en el modelo Devstral, que soporta la interacción del lenguaje natural para completar la búsqueda de código, manipulación de archivos, control de versiones y otras tareas. Puede escanear automáticamente la estructura del proyecto y el estado de Git a través del símbolo @...
GLM-TTS - Sistema de síntesis de voz industrial de código abierto de Smart Spectrum AI
GLM-TTS es un sistema de síntesis de voz industrial de código abierto con potentes funciones de síntesis de voz. Adopta una arquitectura de generación en dos etapas: la primera convierte el texto en secuencias de tokens de voz y la segunda convierte las secuencias de tokens en audio de alta calidad. El sistema admite sólo 3 segundos de muestras de voz para completar la...
Devstral 2 - La nueva generación de modelos de programación de Mistral AI
Devstral 2 es una familia de modelos de programación de nueva generación diseñados para tareas de ingeniería de software de Mistral AI, que consta de las versiones Devstral 2 (parámetro 123B) y Devstral Small 2 (parámetro 24B).D...
GLM-ASR - Serie de modelos de reconocimiento del habla de alto rendimiento y código abierto de Wisdom Spectrum AI
GLM-ASR es una familia de modelos de reconocimiento del habla de alto rendimiento de código abierto de Smart Spectrum AI, que incluye el modelo basado en la nube GLM-ASR-2512 y el modelo de código abierto GLM-ASR-Nano-2512.GLM-ASR-2512 es el modelo de reconocimiento del habla basado en la nube...
OpenAutoGLM - Modelo de agente de IA de código abierto para teléfonos móviles de Smart Spectrum AI
OpenAutoGLM es un modelo corporal inteligente de código abierto con capacidad de "uso del teléfono móvil", que puede comprender el contenido de la pantalla del teléfono móvil mediante la percepción multimodal, y generar automáticamente el flujo de operaciones para completar las tareas especificadas por el usuario. Los usuarios sólo tienen que utilizar el lenguaje natural para describir las necesidades, como "abrir Meituan para buscar una olla caliente cercana...".








