meso- (química)Ling-1T - Modelo lingüístico universal de código abierto del Grupo Ant para billones de parámetros.
Ling-1T es un modelo de lenguaje universal de un billón de parámetros de código abierto de Ant Group, que pertenece al producto estrella de la serie Ling 2.0 de grandes modelos de Bering. El modelo adopta una arquitectura MoE muy eficiente, admite 128.000 ventanas de contexto y supera al GPT en 7 pruebas comparativas, como la generación de código, el razonamiento matemático y las pruebas lógicas....
meso- (química)EchoCare - Modelo grande de base de ultrasonidos de código abierto de la Academia de Ciencias de Hong Kong
EchoCare es un gran modelo de base de ecografía desarrollado por el Centro de Inteligencia Artificial e Innovación Robótica (CAIR) del Instituto de Innovación e Investigación de Hong Kong, Academia China de Ciencias (CAS), entrenado en el mayor conjunto de datos de imágenes de ecografía del mundo (más de 4,5 millones de imágenes) que abarca múltiples centros, regiones, etnias y más de 50...
Code2Video - Marco de generación de vídeos didácticos de IA de código abierto de Show Lab
Code2Video es un innovador proyecto de código abierto que convierte automáticamente fragmentos de código en contenido de vídeo de alta calidad (formato mp4). El proyecto a través de un paradigma único centrado en el código , utilizando herramientas de carbono-ahora-cli para generar código en bellas imágenes , el uso de ffmpeg será estos...
SceneGen - framework de código abierto de la Universidad Jiao Tong de Shanghai para generar escenas 3D a partir de una sola imagen
SceneGen es un método de código abierto para generar escenas 3D a partir de una sola imagen de la Universidad Jiao Tong de Shanghai. A partir de una sola imagen de escena y una máscara de recursos de destino, se genera eficazmente una escena completa que contiene múltiples recursos 3D, incluida la estructura geométrica de los recursos, la textura y la ubicación espacial relativa.
Ming-UniAudio - Modelo de generación multimodal de audio unificado de código abierto Ant
Ming-UniAudio es el modelo de generación multimodal de audio unificado de código abierto de Ant Group que admite entrada y salida mixta de texto, audio, imagen y vídeo. Utilizando la arquitectura de transformadores multiescala y expertos mixtos (MoE) , a través del mecanismo de enrutamiento consciente de la modalidad para manejar eficientemente el cross-modal...
AIMangaStudio - ¡Herramienta gratuita de creación de manga AI para un proceso de creación completo!
AIMangaStudio es una herramienta gratuita de creación de manga AI que proporciona a los creadores una tubería completa de creación de manga, incluyendo la generación de la trama, el diseño de sub-escenas, la configuración de caracteres y otras funciones, que pueden simplificar el proceso de producción desde el guión hasta la página de manga. Soporta la generación en lenguaje natural de guiones de cómic, incluyendo trama, diálogos...
FireRedChat - Sistema de interacción por voz full-duplex de código abierto de Little Red Book
FireRedChat es un sistema de interacción de voz full-duplex de código abierto para Xiaohongshu con capacidad de diálogo bidireccional en tiempo real y soporte para interrupciones controladas. Utilizando un diseño modular , incluyendo módulo de control de transcripción , módulo de interacción y gestor de diálogo , etc., soporta arquitectura en cascada y semi-cascada , despliegue flexible.
Logics-Parsing - Modelo de análisis sintáctico de documentos de código abierto Ali
Logics-Parsing es un modelo de análisis sintáctico de documentos de extremo a extremo de código abierto, basado en Qwen2.5-VL-7B. Optimiza el análisis del diseño de los documentos y la inferencia del orden de lectura mediante el aprendizaje por refuerzo ...
Ring-1T-preview - Modelo de código abierto de un billón de parámetros del Grupo Ant
Ring-1T-preview es un macromodelo de trillones de parámetros de código abierto de Ant Group, basado en la arquitectura Ling 2.0 MoE, preentrenado en el corpus 20T y entrenado en capacidad de razonamiento por ASystem, un sistema de aprendizaje por refuerzo de desarrollo propio. En el razonamiento en lenguaje natural ...
RoboBrain-X0 - Wisdom Source Research Institute modelo de encarnación generalizado de ontología cruzada de muestra cero de código abierto
RoboBrain-X0 es el primer modelo encarnado de código abierto del mundo que admite la generalización entre ontologías de muestra cero, de código abierto por el Wisdom Source Research Institute, que tiene una gran importancia para la industria. Puede controlar varios robots reales de distintas configuraciones para realizar tareas básicas sin necesidad de ajuste fino y, tras un pequeño ajuste fino de la muestra, demuestra la capacidad de reproducir ...