Círculo de intercambio de inteligencia artificial

Puesta en común diaria de los últimos productos, proyectos, marcos, interpretaciones de documentos, etc.~ sobre IA.
AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - Un modelo de generación de audio multimodal de Racer

AudioGen-Omni es un modelo de generación de audio multimodal de Racer que genera audio, voz y canciones de alta calidad a partir de entradas como vídeo, texto, etc.AudioGen-Omni se basa en técnicas avanzadas como el transformador de difusión multimodal y...
hace 8 meses
047.6K
RedOne - 小红书最新推出的社交大模型

RedOne: el último megamodelo social de Little Red Book

RedOne es un gran modelo lingüístico adaptado a las redes sociales presentado por Little Red Book. El modelo se entrena mediante una estrategia de formación en tres fases que incorpora conocimientos sociales y culturales, refuerza las capacidades multitarea y alinea las preferencias humanas.RedOne supera significativamente al modelo base en rendimiento de tareas sociales, en detección de contenidos nocivos y navegación...
hace 8 meses
044.7K
FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - Herramienta de Baidu de alto rendimiento para el razonamiento y despliegue de grandes modelos

FastDeploy es una herramienta de razonamiento y despliegue de alto rendimiento de Baidu, diseñada para grandes modelos lingüísticos (LLM) y modelos lingüísticos visuales (VLM). FastDeploy se ha desarrollado a partir del marco Flying Paddle (PaddlePaddle) y es compatible con diversas plataformas de hardware....
hace 8 meses
045.7K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Conjunto de datos semánticos gaussianos en 3D de Qunar Technology

InteriorGS es un conjunto de datos semánticos gaussianos 3D de alta calidad presentado por Qunar Technology. El conjunto de datos contiene 1.000 escenas 3D que abarcan más de 80 entornos interiores, como viviendas, tiendas, salones de bodas y museos. El conjunto de datos contiene más de 554.000 instancias de objetos en 755 categorías...
hace 8 meses
045K
DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - Modelos de síntesis de voz sin muestras de Microsoft

DragonV2.1 es un avanzado modelo de conversión de texto a voz (TTS) de muestra cero de Microsoft. Basado en la arquitectura Transformer, el modelo admite la clonación de voz en varios idiomas y sin muestras, y genera un habla natural y expresiva con solo 5-90 segundos de indicaciones de voz.
hace 8 meses
043.1K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - Herramienta de código abierto para la generación de capturas de pantalla de interfaz de usuario

ScreenCoder es una herramienta inteligente de código abierto para convertir rápidamente capturas de pantalla de diseño de interfaz de usuario en código HTML / CSS de alta calidad. Herramientas basadas en la arquitectura modular multi-inteligencia , combinado con la comprensión visual , la planificación de diseño y técnicas de síntesis de código para apoyar la generación de alta precisión y semántica front-end ...
hace 8 meses
054.6K
Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型

Kimi K2 High-Speed Edition - Edición de alta velocidad del modelo de lenguaje lanzado por Dark Side of the Moon Kimi

Kimi K2 versión de alta velocidad (kimi-k2-turbo-preview) es un modelo de lenguaje de alto rendimiento introducido por Kimi, el Lado Oscuro de la Luna. El modelo está optimizado sobre la base de Kimi K2, y la velocidad de salida se incrementa en gran medida, que puede generar 40 Token por segundo....
hace 8 meses
060.7K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型

dots.ocr - un modelo de análisis sintáctico de documentos multilingües de código abierto del Little Red Book hi lab

dots.ocr es un modelo de análisis sintáctico de documentos multilingües de código abierto del laboratorio Xiaohongshu hi, basado en un modelo de lenguaje visual (VLM) de 1.700 millones de parámetros, que puede realizar con eficacia la detección del diseño y el reconocimiento del contenido de los documentos manteniendo un buen orden de lectura.
hace 8 meses
066.7K
HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - Un nuevo gran modelo de restauración de imágenes presentado por un equipo de la Academia China de Ciencias

HYPIR es un gran modelo de restauración de imágenes introducido por el equipo de Dong Chao en los Institutos Shenzhen de Tecnología Avanzada de la Academia China de Ciencias. El modelo combina la prioridad fraccional del modelo de difusión con una red generativa adversarial para lograr una restauración de imágenes eficiente y de alta calidad.HYPIR puede restaurar rápidamente fotos antiguas y mejorar la resolución manteniendo el texto claro....
hace 8 meses
055.8K
FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型

FLUX.1 Krea [dev] - Modelo gráfico de Vincennes conjunto de Black Forest y Krea AI

FLUX.1 Krea [dev] es un modelo gráfico generado por texto de Black Forest Labs y Krea AI. El modelo genera imágenes realistas de alta calidad basadas en descripciones de texto de entrada, con un estilo estético único que evita las tradicionales A...
hace 8 meses
050.8K