Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
LongCat-Video-Avatar - 美团开源的虚拟人视频生成模型

LongCat-Video-Avatar - Modelo de generación de vídeo avatar de código abierto de Meituan

LongCat-Video-Avatar es un modelo avanzado de generación de vídeo basado en audio, creado a partir de LongCat-Video de código abierto por Meituan, que se centra en la generación de vídeos largos hiperrealistas y sincronizados con los labios, con una dinámica natural y una identidad coherente.
hace 4 meses
038.2K
MiMo-V2-Flash - 小米发布的开源MoE架构大模型

MiMo-V2-Flash - Un gran modelo de la arquitectura MoE de código abierto lanzado por Xiaomi

MiMo-V2-Flash es un gran modelo de arquitectura MoE de código abierto lanzado por Xiaomi, con 309.000 millones de parámetros totales y 15.000 millones de parámetros activos, centrado en el razonamiento eficiente y las aplicaciones corporales inteligentes. El modelo adopta una arquitectura de atención híbrida y tecnología de meta-predicción multi-palabra, con una velocidad de inferencia de 150 tokens/segundo, en...
hace 4 meses
034.5K
Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 - Una familia de modelos de IA de código abierto publicada por NVIDIA

Nemotron 3 es una familia de modelos de IA de código abierto lanzada por NVIDIA en tamaños Nano, Super y Ultra. Nemotron 3 adopta una arquitectura MoE latente que mejora significativamente la eficiencia de la inferencia y reduce los costes operativos. Entre ellos...
hace 4 meses
031.3K
Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

Wan-Move: el marco de código abierto de Ali Tongyi para la generación de vídeo con inteligencia artificial, en colaboración con Tsinghua y otros organismos.

Wan-Move es un marco de generación de vídeo de IA de código abierto desarrollado conjuntamente por Ali Tongyi Labs, la Universidad de Tsinghua y otras instituciones, centrado en la composición de vídeo de alta calidad mediante una tecnología precisa de control del movimiento. La tecnología central es la "guía de trayectoria potencial", que puede añadir sin problemas el control de movimiento a nivel de punto al modelo existente de imagen a vídeo...
hace 4 meses
031.1K
PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe - Marco de razonamiento colaborativo paralelo de StepStar para la Inteligencia Artificial

PaCoRe (Parallel Coordinated Reasoning) es el innovador marco de razonamiento colaborativo paralelo de código abierto de StepFun, a través de un mecanismo de pensamiento masivamente paralelo, desde múltiples perspectivas para explorar simultáneamente la solución del problema, rompiendo...
hace 4 meses
034.2K
Banana Slides - 基于Nano Banana Pro模型的开源AI PPT生成工具

Banana Slides - Herramienta de generación de PPT de AI de código abierto basada en el modelo Nano Banana Pro.

Banana Slides es un generador inteligente de PPT de código abierto basado en el modelo Nano Banana Pro AI, que permite crear rápidamente presentaciones profesionales utilizando comandos de lenguaje natural. Permite a los usuarios describir el tema en una frase (por ejemplo, "Impacto humano en el ecosistema"), que puede ser auto...
hace 4 meses
039.3K
Kaleido - 智谱AI联合清华大学等开源的多主体参考视频生成模型

Kaleido - Un modelo de generación de vídeo de referencia multisujeto de código abierto creado por Smart Spectrum AI en colaboración con la Universidad de Tsinghua y otras instituciones.

Kaleido es un modelo de generación de vídeo de referencia multisujeto de código abierto desarrollado conjuntamente por la Universidad Tecnológica de Hefei, la Universidad de Tsinghua y Smart Spectrum AI. Genera vídeos coherentes con el sujeto a través de múltiples imágenes de referencia, resolviendo las deficiencias de los modelos existentes en cuanto a coherencia multisujeto y desacoplamiento del fondo.Kaleido genera vídeos a través de un...
hace 4 meses
030.4K
Paper2Slides - 香港大学开源的学术论文转为幻灯片AI工具

Paper2Slides - La Universidad de Hong Kong convierte documentos académicos de código abierto en diapositivas Herramientas de IA

Paper2Slides es una herramienta de IA de código abierto del Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong que convierte documentos académicos en diapositivas o pósters profesionales en un solo clic. Utiliza la tecnología RAG (Retrieval Augmented Generation), analizando directamente el contenido del documento en lugar de basarse en información de la red, para garantizar que el PPT generado sea altamente coherente con el original....
hace 4 meses
032.2K
RealVideo - 智谱 AI 开源的实时流式视频生成系统

RealVideo - Sistema de generación de vídeo en tiempo real de código abierto de Wisdom Spectrum AI

RealVideo es un sistema de generación de vídeo en tiempo real de código abierto de Smart Spectrum AI que puede generar rápidamente respuestas de vídeo naturales y fluidas en 2 o 3 segundos. Los usuarios solo tienen que subir una foto e introducir un texto, y el sistema genera la voz y el vídeo correspondientes, lo que permite dialogar en tiempo real con personajes de IA....
hace 4 meses
028.2K
OpenScreen - 开源免费的屏幕录制工具,支持Mac和Windows双系统

OpenScreen - Herramienta de grabación de pantalla gratuita y de código abierto para Mac y Windows.

OpenScreen es una herramienta de grabación de pantalla de código abierto y gratuita que proporciona a los usuarios una alternativa fácil de usar y funcional a Screen Studio. Es compatible tanto con Mac como con Windows, es totalmente gratuita y sigue el protocolo del MIT, y puede utilizarse para grabaciones individuales de...
hace 4 meses
035.4K