Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - Sistema de interacción por voz full-duplex de código abierto de Little Red Book

FireRedChat es un sistema de interacción de voz full-duplex de código abierto para Xiaohongshu con capacidad de diálogo bidireccional en tiempo real y soporte para interrupciones controladas. Utilizando un diseño modular , incluyendo módulo de control de transcripción , módulo de interacción y gestor de diálogo , etc., soporta arquitectura en cascada y semi-cascada , despliegue flexible.
hace 6 meses
042.6K
Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing - Modelo de análisis sintáctico de documentos de código abierto Ali

Logics-Parsing es un modelo de análisis sintáctico de documentos de extremo a extremo de código abierto, basado en Qwen2.5-VL-7B. Optimiza el análisis del diseño de los documentos y la inferencia del orden de lectura mediante el aprendizaje por refuerzo ...
hace 6 meses
041.1K
Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview - Modelo de código abierto de un billón de parámetros del Grupo Ant

Ring-1T-preview es un macromodelo de trillones de parámetros de código abierto de Ant Group, basado en la arquitectura Ling 2.0 MoE, preentrenado en el corpus 20T y entrenado en capacidad de razonamiento por ASystem, un sistema de aprendizaje por refuerzo de desarrollo propio. En el razonamiento en lenguaje natural ...
hace 6 meses
048.8K
RoboBrain-X0 - 智源研究院开源的零样本跨本体泛化具身模型

RoboBrain-X0 - Wisdom Source Research Institute modelo de encarnación generalizado de ontología cruzada de muestra cero de código abierto

RoboBrain-X0 es el primer modelo encarnado de código abierto del mundo que admite la generalización entre ontologías de muestra cero, de código abierto por el Wisdom Source Research Institute, que tiene una gran importancia para la industria. Puede controlar varios robots reales de distintas configuraciones para realizar tareas básicas sin necesidad de ajuste fino y, tras un pequeño ajuste fino de la muestra, demuestra la capacidad de reproducir ...
hace 6 meses
034.1K
Lynx - 字节跳动开源的高保真视频生成模型

Lynx - Modelo de generación de vídeo de alta fidelidad de código abierto de ByteHop

Lynx es un modelo de generación de vídeo personalizado de alta fidelidad de código abierto de ByteDance que puede generar vídeos coherentes con la identidad con una sola foto de retrato. Basado en el modelo de difusión Transformer (DiT), la introducción de ID-adaptador y Ref-adaptador...
hace 6 meses
036.4K
DeepSeek-V3.2-Exp - DeepSeek最新开源的实验性AI模型

DeepSeek-V3.2-Exp - El último modelo experimental de IA de código abierto de DeepSeek

DeepSeek-V3.2-Exp es un modelo experimental de IA de código abierto de DeepSeek que mejora significativamente la eficiencia del procesamiento de textos largos mediante la introducción del mecanismo DeepSeek Sparse Attention (DSA). El modelo se basa en DeepSeek...
hace 6 meses
037.8K
HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

HunyuanImage 3.0 - Modelo gratuito de generación de imágenes multimodales de código abierto de Tencent

HunyuanImage 3.0 (Hunyuan Image 3.0) es un modelo nativo de generación de imágenes multimodales publicado y de código abierto por Tencent. El tamaño de los parámetros del modelo de 80B, es actualmente los mejores resultados de evaluación, el mayor número de parámetros del modelo de generación de imágenes de código abierto. Hybrid Image 3.0 soporta la generación de imágenes en tiempo real, los usuarios pueden...
hace 6 meses
047.4K
Hunyuan3D-Part - 腾讯开源的免费3D组件生成模型

Hunyuan3D-Part - Modelo gratuito de generación de componentes 3D de código abierto de Tencent

Hunyuan3D-Part (Hybrid 3D-Part) es un modelo de generación 3D lanzado y de código abierto por Tencent. Compuesto por P3 - SAM y X - Part, es la primera vez que se consigue una generación 3D basada en componentes de alta precisión y controlable, soportando 50 + componentes generados automáticamente. Los usuarios pueden...
hace 6 meses
047.5K
AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - Modelo de IA de sonido para generación de texto de código abierto KU Xunfei

AudioFly es un modelo de IA de código abierto para generar efectos de sonido a partir de texto de KDDI. Basado en la arquitectura del modelo de difusión potencial, con mil millones de parámetros, entrenado en conjuntos de datos de texto de audio diversos y a gran escala, que abarcan conjuntos de datos públicos como AudioSet, AudioCaps, TUT e internos....
hace 6 meses
041.6K
Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

Hunyuan3D-Omni - Marco de generación de modelos 3D de código abierto mixto de Tencent

Hunyuan3D-Omni (Hybrid 3D-Omni) es un marco de generación de activos 3D de código abierto del equipo Hybrid 3D de Tencent, que permite generar modelos 3D precisos mediante múltiples señales de control. Basado en la arquitectura Hunyuan3D 2.1, introduce un codificador de control unificado que puede...
hace 6 meses
045.3K