Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
ViMax - 香港大学开源的多智能体视频生成框架

ViMax - Marco de generación de vídeo corporal multiinteligente de código abierto en la Universidad de Hong Kong

ViMax es un marco de generación de vídeo corporal multiinteligente de código abierto del Data Science Laboratory de la Universidad de Hong Kong, que puede automatizar todo el proceso, desde la entrada creativa hasta la salida de vídeo. La integración de funciones de generación de guiones, diseño de escenas, planificación de tomas y renderización de vídeo permite a los usuarios generar vídeos coherentes de calidad cinematográfica y televisiva mediante la descripción en lenguaje natural ...
hace 6 meses
073.7K
FLUX.2 - 黑森林开源的图像生成与编辑模型

FLUX.2 - Modelo de generación y edición de imágenes de código abierto de Black Forest

FLUX.2 es un modelo de generación y edición de imágenes de código abierto publicado por Black Forest Labs que admite imágenes textuales sin procesar, referencias a varias imágenes y edición de imágenes con detalles más ricos, texturas claras e iluminación estable. Existen cuatro versiones: FLUX.2 [pro] (comparable al...
hace 6 meses
028.9K
Fara-7B - 微软开源的计算机操作Agent助手模型

Fara-7B - Modelo de asistente informático de código abierto de Microsoft

Fara-7B es una versión de código abierto de Microsoft de un modelo de agente operado por ordenador (CUA) a escala de 7.000 millones de parámetros basado en la arquitectura Qwen 2.5-VL-7B. Al analizar visualmente capturas de pantalla de páginas web y realizar clics, entradas, etc. en la pantalla, no necesita depender de árboles de accesibilidad adicionales ni de múltiples modelos de gran tamaño...
hace 6 meses
034.1K
HunyuanOCR - 腾讯混元开源的光学字符识别专家模型

HunyuanOCR - Modelo experto de código abierto de Tencent para el reconocimiento óptico de caracteres

HunyuanOCR es un modelo de reconocimiento óptico de caracteres de alto rendimiento de código abierto creado por el equipo híbrido de Tencent, con sólo 1.000 millones de referencias. Desarrollado sobre la base de la arquitectura multimodal híbrida, adopta un diseño integral y puede gestionar eficazmente tareas de detección y reconocimiento de texto y análisis sintáctico de documentos. El modelo obtuvo 94,1 puntos en la prueba de documentos complejos, superando...
hace 6 meses
035.5K
Supertonic - 开源的高性能AI 文本转语音系统,极速离线运行

Supertonic - Sistema AI de conversión de texto en voz de código abierto y alto rendimiento que funciona offline a velocidades de vértigo.

Supertonic es un sistema de texto a voz (TTS) de código abierto y alto rendimiento centrado en la generación rápida de voz en dispositivos locales. Gracias a la tecnología ONNX Runtime, puede ejecutarse en dispositivos como teléfonos móviles, ordenadores e incluso Raspberry Pi, admite 23 idiomas y clones de voz, y no requiere red....
hace 6 meses
030K
MiMo-Embodied - 小米开源的跨领域具身智能基座模型

MiMo-Embodied: el modelo pedestal de inteligencia incorporada multidominio de código abierto de Xiaomi

MiMo-Embodied es el primer modelo base del mundo basado en la inteligencia artificial y la conducción autónoma. Resuelve el problema de la migración de conocimientos entre la IA incorporada y la conducción autónoma, y logra un modelado unificado de tareas en los dos dominios.
hace 6 meses
035K
MOSS-Speech - 复旦大学开源的语音到语音大模型

MOSS-Speech - Gran modelo de conversión de voz de código abierto de la Universidad de Fudan

MOSS-Speech es un gran modelo de voz a voz (Speech-to-Speech) de código abierto del equipo del profesor Qiu Xipeng, de la Universidad de Fudan. Rompe con el procesamiento tradicional del habla, sin necesidad de guía textual, y comprende y genera directamente el habla, que puede capturar elementos no textuales como la entonación y la emoción, haciendo...
hace 6 meses
030.4K
Parallax - Gradient开源的全球首个全自主AI操作系统

Parallax - El primer sistema operativo de inteligencia artificial totalmente autónomo del mundo, con código abierto de Gradient

Parallax es el primer "sistema operativo de IA totalmente autónomo" del mundo, de código abierto, creado por Gradient, un laboratorio de IA distribuida. Admite el despliegue multiplataforma de grandes modelos en Mac, Windows y otros dispositivos heterogéneos, lo que permite a los usuarios controlar totalmente el modelo, los datos y la memoria de la IA. El sistema es consciente de la red ...
hace 6 meses
085.9K
HunyuanVideo 1.5 - 腾讯混元免费开源的轻量级视频生成模型

HunyuanVideo 1.5 - Modelo de generación de vídeo ligero de código abierto y gratuito Tencent mixed yuan

HunyuanVideo 1.5 es un modelo de generación de vídeo ligero de código abierto de Tencent hybrid big model team , basado en la arquitectura Diffusion Transformer (DiT) , el número de parámetros es de 8.3B. soporta la generación de 5-10 segundos de vídeo de alta definición , sub...
hace 6 meses
037.4K
Awex - 蚂蚁集团开源的高性能权重交换框架

Awex - Marco de intercambio de pesos de código abierto y alto rendimiento del Grupo Ant

Awex es el marco de intercambio de pesos de alto rendimiento y código abierto de Ant Group, diseñado para la sincronización de parámetros a gran escala en el aprendizaje por refuerzo. Puede completar terabytes de intercambio de parámetros en segundos, mejorando significativamente la eficiencia del entrenamiento y la inferencia.Awex tiene un rendimiento de sincronización muy rápido, en un clúster de mil tarjetas, los modelos de parámetros de trillones se pueden completar en 6 segundos de la cantidad total de...
hace 6 meses
083.1K