InteriorGS - Conjunto de datos semánticos gaussianos en 3D de Qunar Technology
InteriorGS es un conjunto de datos semánticos gaussianos 3D de alta calidad presentado por Qunar Technology. El conjunto de datos contiene 1.000 escenas 3D que abarcan más de 80 entornos interiores, como viviendas, tiendas, salones de bodas y museos. El conjunto de datos contiene más de 554.000 instancias de objetos en 755 categorías...
DragonV2.1 - Modelos de síntesis de voz sin muestras de Microsoft
DragonV2.1 es un avanzado modelo de conversión de texto a voz (TTS) de muestra cero de Microsoft. Basado en la arquitectura Transformer, el modelo admite la clonación de voz en varios idiomas y sin muestras, y genera un habla natural y expresiva con solo 5-90 segundos de indicaciones de voz.
ScreenCoder - Herramienta de código abierto para la generación de capturas de pantalla de interfaz de usuario
ScreenCoder es una herramienta inteligente de código abierto para convertir rápidamente capturas de pantalla de diseño de interfaz de usuario en código HTML / CSS de alta calidad. Herramientas basadas en la arquitectura modular multi-inteligencia , combinado con la comprensión visual , la planificación de diseño y técnicas de síntesis de código para apoyar la generación de alta precisión y semántica front-end ...
Kimi K2 High-Speed Edition - Edición de alta velocidad del modelo de lenguaje lanzado por Dark Side of the Moon Kimi
Kimi K2 versión de alta velocidad (kimi-k2-turbo-preview) es un modelo de lenguaje de alto rendimiento introducido por Kimi, el Lado Oscuro de la Luna. El modelo está optimizado sobre la base de Kimi K2, y la velocidad de salida se incrementa en gran medida, que puede generar 40 Token por segundo....
dots.ocr - un modelo de análisis sintáctico de documentos multilingües de código abierto del Little Red Book hi lab
dots.ocr es un modelo de análisis sintáctico de documentos multilingües de código abierto del laboratorio Xiaohongshu hi, basado en un modelo de lenguaje visual (VLM) de 1.700 millones de parámetros, que puede realizar con eficacia la detección del diseño y el reconocimiento del contenido de los documentos manteniendo un buen orden de lectura.
HYPIR - Un nuevo gran modelo de restauración de imágenes presentado por un equipo de la Academia China de Ciencias
HYPIR es un gran modelo de restauración de imágenes introducido por el equipo de Dong Chao en los Institutos Shenzhen de Tecnología Avanzada de la Academia China de Ciencias. El modelo combina la prioridad fraccional del modelo de difusión con una red generativa adversarial para lograr una restauración de imágenes eficiente y de alta calidad.HYPIR puede restaurar rápidamente fotos antiguas y mejorar la resolución manteniendo el texto claro....
FLUX.1 Krea [dev] - Modelo gráfico de Vincennes conjunto de Black Forest y Krea AI
FLUX.1 Krea [dev] es un modelo gráfico generado por texto de Black Forest Labs y Krea AI. El modelo genera imágenes realistas de alta calidad basadas en descripciones de texto de entrada, con un estilo estético único que evita las tradicionales A...
Qwen3-Coder-Flash - un modelo de programación de alto rendimiento y código abierto de Ali Tongyi
Qwen3-Coder-Flash es un modelo de programación de alto rendimiento introducido por el equipo de Ali Tongyi Thousand Questions, que tiene excelentes capacidades de programación basada en agentes y de invocación de herramientas, y es bueno en el manejo de tareas de programación complejas. El modelo soporta 256K tokens de comprensión de contexto largo, y puede escalar a 1M ...
Amplia investigación - Colaboración multiinteligencia introducida en la plataforma Manus
Wide Research es una potente función de la plataforma Manus diseñada para gestionar tareas complejas y a gran escala. La plataforma admite cientos de inteligencias de propósito general trabajando simultáneamente mediante mecanismos de procesamiento paralelo a nivel de sistema y protocolos de colaboración entre inteligencias.
Seed Diffusion: el nuevo modelo lingüístico de difusión de ByteHopper
Seed Diffusion es un modelo de lenguaje de difusión experimental introducido por ByteHop que se encarga de tareas de generación de código. El modelo se basa en técnicas como la formación por difusión en dos etapas, el aprendizaje secuencial restringido y la decodificación paralela eficiente mejorada, lo que mejora significativamente la velocidad de inferencia a 2.146 tokens/s, que es más rápida que...