Meeseeks - Conjunto de evaluación de código abierto Meeseeks para evaluar la capacidad de seguir instrucciones de modelos.
Meeseeks es un conjunto de evaluación de grandes modelos de código abierto utilizado por el equipo M17 de Meituan para evaluar la capacidad de un modelo para seguir instrucciones.Meeseeks utiliza un marco de evaluación de tres niveles para medir de forma exhaustiva si un modelo es capaz de generar respuestas en estricta conformidad con las instrucciones del usuario desde el nivel macro al micro, y no evalúa el conocimiento del contenido de la respuesta como...
gpt-realtime - El último modelo de voz con IA de OpenAI
gpt-realtime es un modelo avanzado de habla de OpenAI que admite el procesamiento directo del audio para generar un habla natural y fluida. El modelo admite varios idiomas y estilos, entiende señales no verbales como la risa y puede cambiar de idioma.
Youtu-agent - Marco de código abierto de Tencent para cuerpos inteligentes eficientes
Youtu-agent es un marco de código abierto para construir y ejecutar inteligencias autónomas de Tencent Youtu Labs. El marco obtiene buenos resultados en las pruebas comparativas WebWalkerQA y GAIA, con una precisión de 71,47% y 72,8% respectivamente.El marco...
HunyuanVideo-Foley - Modelo de generación de sonido de vídeo de código abierto de Tencent
HunyuanVideo-Foley es un modelo de generación de sonido de vídeo de código abierto del equipo Tencent Mixed Yuan que permite añadir efectos de sonido adaptados con precisión a los vídeos silenciosos. El modelo se basa en un conjunto de datos a gran escala de formación , con una arquitectura de convertidor de difusión multimodal , combinado con la representación de la función de pérdida de alineación y técnicas de optimización de audio VAE....
PixVerse V5 - Aishi Technologies lanza un modelo de vídeo con inteligencia artificial de desarrollo propio
PixVerse V5 es un gran modelo de generación de vídeo por IA lanzado por Aishi Technology. El modelo puede generar contenidos de vídeo de alta calidad a partir de descripciones de texto o imágenes introducidas por el usuario, y admite diversos estilos, como anime, ciencia ficción y estilo nacional.
Ask White 5 - Modelo AI todo en uno de Ask White
Ask White 5 es el modelo insignia "Todo en uno" con un nivel de inteligencia muy alto. El modelo obtiene buenos resultados en muchas evaluaciones, como la puntuación de evaluación compuesta AA-Index de 64,7 y la puntuación de evaluación de la capacidad STEM de 86, que se acerca a la del líder mundial GPT-5.
Gemini 2.5 Flash Image - El modelo de generación y edición de imágenes más potente de Google
Gemini 2.5 Flash Image (nombre en clave nano banana) es un modelo de generación y edición de imágenes de última generación de Google que mantiene la coherencia de los caracteres en todas las escenas y admite la edición precisa de imágenes mediante lenguaje natural, como el desenfoque de fondos y la eliminación de manchas.
Wan2.2-S2V - Modelo de generación de vídeo basado en audio de código abierto Ali Tongyi
Wan2.2-S2V es un modelo de generación de vídeo multimodal de código abierto de Ali Tongyi , sólo una imagen estática y un fragmento de audio , puede generar vídeo humano digital de alta calidad , y soporta una variedad de tipos de imagen y marco .
Curso gratuito sobre ingeniería de consejos ChatGPT para desarrolladores por Ernest Ng
ChatGPT Tip Engineering for Developers es un curso conjunto de DeepLearning.AI y OpenAI diseñado para desarrolladores, que cuenta con Isa Fulford, Andrew Ng para enseñar a utilizar Large Language Models (LLM...
Ask o4 - Un modelo de pensamiento paralelo introducido por Ask o4 que abre 8 vías de pensamiento al mismo tiempo
Ask White o4 es un innovador modelo de pensamiento paralelo que abre 8 vías de pensamiento al mismo tiempo, analiza el problema desde múltiples perspectivas y filtra automáticamente la solución óptima. El modelo incorpora técnicas avanzadas de aprendizaje por refuerzo Long-CoT y aprendizaje por recompensa de procesos, tiene potentes capacidades de razonamiento profundo y rinde bien en tareas complejas.