Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo

escritos487 dirección web273 Libro0 hardware0 comentarios0

Mixed World Model 1.5 - Marco de generación de modelos del mundo en tiempo real de código abierto Tencent Mixed

Hybrid World Model 1.5 (Tencent HY WorldPlay) es el primer marco de modelo mundial en tiempo real de código abierto de la industria lanzado por Tencent, que cubre la cadena completa de despliegue de datos, formación e inferencia de streaming. El núcleo es el modelo de difusión autorregresiva WorldPlay, que utiliza...

Últimos recursos sobre IA

hace 7 meses

054.6K

Molmo 2 - Familia de modelos de comprensión multimodal de imágenes de vídeo de código abierto Ai2

Molmo 2 es un modelo multimodal de código abierto lanzado por el Allen Institute for AI (Ai2) para mejorar la comprensión de vídeos e imágenes múltiples. Incluye tres variantes: Molmo 2 (8B), Molmo 2 (4B) y Molmo 2-O...

Últimos recursos sobre IA

hace 7 meses

060.2K

LongCat-Video-Avatar - Modelo de generación de vídeo avatar de código abierto de Meituan

LongCat-Video-Avatar es un modelo avanzado de generación de vídeo basado en audio, creado a partir de LongCat-Video de código abierto por Meituan, que se centra en la generación de vídeos largos hiperrealistas y sincronizados con los labios, con una dinámica natural y una identidad coherente.

Últimos recursos sobre IA

hace 7 meses

060.2K

MiMo-V2-Flash - Un gran modelo de la arquitectura MoE de código abierto lanzado por Xiaomi

MiMo-V2-Flash es un gran modelo de arquitectura MoE de código abierto lanzado por Xiaomi, con 309.000 millones de parámetros totales y 15.000 millones de parámetros activos, centrado en el razonamiento eficiente y las aplicaciones corporales inteligentes. El modelo adopta una arquitectura de atención híbrida y tecnología de meta-predicción multi-palabra, con una velocidad de inferencia de 150 tokens/segundo, en...

Últimos recursos sobre IA

hace 7 meses

054K

Nemotron 3 - Una familia de modelos de IA de código abierto publicada por NVIDIA

Nemotron 3 es una familia de modelos de IA de código abierto lanzada por NVIDIA en tamaños Nano, Super y Ultra. Nemotron 3 adopta una arquitectura MoE latente que mejora significativamente la eficiencia de la inferencia y reduce los costes operativos. Entre ellos...

Últimos recursos sobre IA

hace 7 meses

054.7K

Wan-Move: el marco de código abierto de Ali Tongyi para la generación de vídeo con inteligencia artificial, en colaboración con Tsinghua y otros organismos.

Wan-Move es un marco de generación de vídeo de IA de código abierto desarrollado conjuntamente por Ali Tongyi Labs, la Universidad de Tsinghua y otras instituciones, centrado en la composición de vídeo de alta calidad mediante una tecnología precisa de control del movimiento. La tecnología central es la "guía de trayectoria potencial", que puede añadir sin problemas el control de movimiento a nivel de punto al modelo existente de imagen a vídeo...

Últimos recursos sobre IA

hace 7 meses

053.1K

PaCoRe - Marco de razonamiento colaborativo paralelo de StepStar para la Inteligencia Artificial

PaCoRe (Parallel Coordinated Reasoning) es el innovador marco de razonamiento colaborativo paralelo de código abierto de StepFun, a través de un mecanismo de pensamiento masivamente paralelo, desde múltiples perspectivas para explorar simultáneamente la solución del problema, rompiendo...

Últimos recursos sobre IA

hace 7 meses

056.5K

Banana Slides - 基于Nano Banana Pro模型的开源AI PPT生成工具

Banana Slides - Herramienta de generación de PPT de AI de código abierto basada en el modelo Nano Banana Pro.

Banana Slides es un generador inteligente de PPT de código abierto basado en el modelo Nano Banana Pro AI, que permite crear rápidamente presentaciones profesionales utilizando comandos de lenguaje natural. Permite a los usuarios describir el tema en una frase (por ejemplo, "Impacto humano en el ecosistema"), que puede ser auto...

Últimos recursos sobre IA

hace 7 meses

064.5K

Kaleido - Un modelo de generación de vídeo de referencia multisujeto de código abierto creado por Smart Spectrum AI en colaboración con la Universidad de Tsinghua y otras instituciones.

Kaleido es un modelo de generación de vídeo de referencia multisujeto de código abierto desarrollado conjuntamente por la Universidad Tecnológica de Hefei, la Universidad de Tsinghua y Smart Spectrum AI. Genera vídeos coherentes con el sujeto a través de múltiples imágenes de referencia, resolviendo las deficiencias de los modelos existentes en cuanto a coherencia multisujeto y desacoplamiento del fondo.Kaleido genera vídeos a través de un...

Últimos recursos sobre IA

hace 7 meses

053.7K

Paper2Slides - La Universidad de Hong Kong convierte documentos académicos de código abierto en diapositivas Herramientas de IA

Paper2Slides es una herramienta de IA de código abierto del Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong que convierte documentos académicos en diapositivas o pósters profesionales en un solo clic. Utiliza la tecnología RAG (Retrieval Augmented Generation), analizando directamente el contenido del documento en lugar de basarse en información de la red, para garantizar que el PPT generado sea altamente coherente con el original....

Últimos recursos sobre IA

hace 7 meses

059.2K

Más información