Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
Code2Video - Show Lab开源的AI教学视频生成框架

Code2Video - Marco de generación de vídeos didácticos de IA de código abierto de Show Lab

Code2Video es un innovador proyecto de código abierto que convierte automáticamente fragmentos de código en contenido de vídeo de alta calidad (formato mp4). El proyecto a través de un paradigma único centrado en el código , utilizando herramientas de carbono-ahora-cli para generar código en bellas imágenes , el uso de ffmpeg será estos...
hace 8 meses
040.6K
SceneGen - 上海交大开源的单图像生成3D场景框架

SceneGen - framework de código abierto de la Universidad Jiao Tong de Shanghai para generar escenas 3D a partir de una sola imagen

SceneGen es un método de código abierto para generar escenas 3D a partir de una sola imagen de la Universidad Jiao Tong de Shanghai. A partir de una sola imagen de escena y una máscara de recursos de destino, se genera eficazmente una escena completa que contiene múltiples recursos 3D, incluida la estructura geométrica de los recursos, la textura y la ubicación espacial relativa.
hace 8 meses
031.6K
Ming-UniAudio - 蚂蚁开源的统一音频多模态生成模型

Ming-UniAudio - Modelo de generación multimodal de audio unificado de código abierto Ant

Ming-UniAudio es el modelo de generación multimodal de audio unificado de código abierto de Ant Group que admite entrada y salida mixta de texto, audio, imagen y vídeo. Utilizando la arquitectura de transformadores multiescala y expertos mixtos (MoE) , a través del mecanismo de enrutamiento consciente de la modalidad para manejar eficientemente el cross-modal...
hace 8 meses
038K
AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio - ¡Herramienta gratuita de creación de manga AI para un proceso de creación completo!

AIMangaStudio es una herramienta gratuita de creación de manga AI que proporciona a los creadores una tubería completa de creación de manga, incluyendo la generación de la trama, el diseño de sub-escenas, la configuración de caracteres y otras funciones, que pueden simplificar el proceso de producción desde el guión hasta la página de manga. Soporta la generación en lenguaje natural de guiones de cómic, incluyendo trama, diálogos...
hace 8 meses
045.5K
FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - Sistema de interacción por voz full-duplex de código abierto de Little Red Book

FireRedChat es un sistema de interacción de voz full-duplex de código abierto para Xiaohongshu con capacidad de diálogo bidireccional en tiempo real y soporte para interrupciones controladas. Utilizando un diseño modular , incluyendo módulo de control de transcripción , módulo de interacción y gestor de diálogo , etc., soporta arquitectura en cascada y semi-cascada , despliegue flexible.
hace 8 meses
044.6K
Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing - Modelo de análisis sintáctico de documentos de código abierto Ali

Logics-Parsing es un modelo de análisis sintáctico de documentos de extremo a extremo de código abierto, basado en Qwen2.5-VL-7B. Optimiza el análisis del diseño de los documentos y la inferencia del orden de lectura mediante el aprendizaje por refuerzo ...
hace 8 meses
043.2K
Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview - Modelo de código abierto de un billón de parámetros del Grupo Ant

Ring-1T-preview es un macromodelo de trillones de parámetros de código abierto de Ant Group, basado en la arquitectura Ling 2.0 MoE, preentrenado en el corpus 20T y entrenado en capacidad de razonamiento por ASystem, un sistema de aprendizaje por refuerzo de desarrollo propio. En el razonamiento en lenguaje natural ...
hace 8 meses
051.5K
RoboBrain-X0 - 智源研究院开源的零样本跨本体泛化具身模型

RoboBrain-X0 - Wisdom Source Research Institute modelo de encarnación generalizado de ontología cruzada de muestra cero de código abierto

RoboBrain-X0 es el primer modelo encarnado de código abierto del mundo que admite la generalización entre ontologías de muestra cero, de código abierto por el Wisdom Source Research Institute, que tiene una gran importancia para la industria. Puede controlar varios robots reales de distintas configuraciones para realizar tareas básicas sin necesidad de ajuste fino y, tras un pequeño ajuste fino de la muestra, demuestra la capacidad de reproducir ...
hace 8 meses
037K
Lynx - 字节跳动开源的高保真视频生成模型

Lynx - Modelo de generación de vídeo de alta fidelidad de código abierto de ByteHop

Lynx es un modelo de generación de vídeo personalizado de alta fidelidad de código abierto de ByteDance que puede generar vídeos coherentes con la identidad con una sola foto de retrato. Basado en el modelo de difusión Transformer (DiT), la introducción de ID-adaptador y Ref-adaptador...
hace 8 meses
039K
DeepSeek-V3.2-Exp - DeepSeek最新开源的实验性AI模型

DeepSeek-V3.2-Exp - El último modelo experimental de IA de código abierto de DeepSeek

DeepSeek-V3.2-Exp es un modelo experimental de IA de código abierto de DeepSeek que mejora significativamente la eficiencia del procesamiento de textos largos mediante la introducción del mecanismo DeepSeek Sparse Attention (DSA). El modelo se basa en DeepSeek...
hace 8 meses
040.3K