Círculo de intercambio de inteligencia artificial

Puesta en común diaria de los últimos productos, proyectos, marcos, interpretaciones de documentos, etc.~ sobre IA.

escritos285 dirección web49 Libro0 hardware0 comentarios0

Seedream 4.0: la última generación de modelos de creación de imágenes lanzada por Bytes

Seedream 4.0 es una herramienta avanzada de generación y edición de imágenes lanzada por ByteDance, que se centra en la integración de la generación y la edición, con potentes funciones como la edición precisa de comandos, la alta retención de funciones y la comprensión profunda de intenciones.

Últimos recursos sobre IA

hace 11 meses

0103.8K

rStar2-Agent: el eficiente modelo de inferencia de IA de código abierto de Microsoft

rStar2-Agent es un modelo avanzado de razonamiento matemático de IA de código abierto de Microsoft que demuestra una gran capacidad para resolver problemas matemáticos al alcanzar una precisión de 80,61 TP3T en la prueba AIME24. El modelo está equipado con capacidades de razonamiento científico, logrando en la prueba GPQA-Diamond...

Últimos recursos sobre IA

hace 11 meses

052.5K

InfinityHuman: un modelo de generación humana digital de vídeo largo lanzado por Bytes en colaboración con ZJU.

InfinityHuman es un modelo comercial de generación de vídeos de personajes con series de audio de larga duración lanzado conjuntamente por ByteDance y la Universidad de Zhejiang. El modelo se basa en el audio y puede generar vídeos de personajes de alta resolución, larga duración y coherencia visual.

Últimos recursos sobre IA

hace 11 meses

056.2K

Kimi K2-0905 - ¡El último modelo de Dark Side of the Moon!

Kimi K2-0905 es un modelo avanzado de IA de Dark Side of the Moon Technologies Ltd. que destaca en la asistencia a la programación, genera código de forma eficiente y favorece la generación de código ordenado y estandarizado en el desarrollo front-end. La longitud del contexto del modelo se amplía hasta 256K para gestionar tareas complejas.

Últimos recursos sobre IA

hace 11 meses

093.9K

Meeseeks - Conjunto de evaluación de código abierto Meeseeks para evaluar la capacidad de seguir instrucciones de modelos.

Meeseeks es un conjunto de evaluación de grandes modelos de código abierto utilizado por el equipo M17 de Meituan para evaluar la capacidad de un modelo para seguir instrucciones.Meeseeks utiliza un marco de evaluación de tres niveles para medir de forma exhaustiva si un modelo es capaz de generar respuestas en estricta conformidad con las instrucciones del usuario desde el nivel macro al micro, y no evalúa el conocimiento del contenido de la respuesta como...

Últimos recursos sobre IA

hace 11 meses

058.9K

gpt-realtime - El último modelo de voz con IA de OpenAI

gpt-realtime es un modelo avanzado de habla de OpenAI que admite el procesamiento directo del audio para generar un habla natural y fluida. El modelo admite varios idiomas y estilos, entiende señales no verbales como la risa y puede cambiar de idioma.

Últimos recursos sobre IA

hace 11 meses

063.1K

Youtu-agent - Marco de código abierto de Tencent para cuerpos inteligentes eficientes

Youtu-agent es un marco de código abierto para construir y ejecutar inteligencias autónomas de Tencent Youtu Labs. El marco obtiene buenos resultados en las pruebas comparativas WebWalkerQA y GAIA, con una precisión de 71,47% y 72,8% respectivamente.El marco...

Últimos recursos sobre IA

hace 11 meses

073.1K

HunyuanVideo-Foley - Modelo de generación de sonido de vídeo de código abierto de Tencent

HunyuanVideo-Foley es un modelo de generación de sonido de vídeo de código abierto del equipo Tencent Mixed Yuan que permite añadir efectos de sonido adaptados con precisión a los vídeos silenciosos. El modelo se basa en un conjunto de datos a gran escala de formación , con una arquitectura de convertidor de difusión multimodal , combinado con la representación de la función de pérdida de alineación y técnicas de optimización de audio VAE....

Últimos recursos sobre IA

hace 11 meses

074.4K

PixVerse V5 - Aishi Technologies lanza un modelo de vídeo con inteligencia artificial de desarrollo propio

PixVerse V5 es un gran modelo de generación de vídeo por IA lanzado por Aishi Technology. El modelo puede generar contenidos de vídeo de alta calidad a partir de descripciones de texto o imágenes introducidas por el usuario, y admite diversos estilos, como anime, ciencia ficción y estilo nacional.

Últimos recursos sobre IA

hace 11 meses

065.8K

Ask White 5 - Modelo AI todo en uno de Ask White

Ask White 5 es el modelo insignia "Todo en uno" con un nivel de inteligencia muy alto. El modelo obtiene buenos resultados en muchas evaluaciones, como la puntuación de evaluación compuesta AA-Index de 64,7 y la puntuación de evaluación de la capacidad STEM de 86, que se acerca a la del líder mundial GPT-5.

Últimos recursos sobre IA

hace 11 meses

059.4K

Más información