Wenshin Big Model X1.1 - El modelo de pensamiento profundo de Baidu para comprender mejor
Wenxin Big Model X1.1 es un modelo de pensamiento profundo lanzado por Baidu, basado en un marco híbrido de aprendizaje por refuerzo que se centra en mejorar la comprensión y la generación de lenguaje. El modelo destaca en el manejo de preguntas complejas, el seguimiento de instrucciones y la simulación del comportamiento de las inteligencias, y puede proporcionar con precisión respuestas bien fundamentadas y contenidos de texto de alta calidad.
Imagen híbrida 2.1 - Modelo gráfico de proveedor de código abierto de Tencent
HunyuanImage 2.1 es el modelo gráfico de código abierto de Tencent diseñado para la generación de imágenes de alta calidad. El modelo admite resolución 2K nativa, puede renderizar con precisión escenas y detalles complejos, de modo que la expresión y el movimiento de los personajes pueden reproducirse vívidamente.
Curso gratuito de LangChain para el desarrollo de aplicaciones LLM por Ernest Ng
LangChain for LLM Application Development es un curso en línea de DeepLearning.AI en el que participan el fundador de LangChain, Harrison Chase, y Andrew Ng.
Curso gratuito sobre el funcionamiento de los Transformer LLM, por Enda Wu
Los LLM transformadores funcionan según el principio que DeepLearning.AI y Jay Alammar y Maarten Grootend, autores de Hands-On Large Language Models...
Seedream 4.0: la última generación de modelos de creación de imágenes lanzada por Bytes
Seedream 4.0 es una herramienta avanzada de generación y edición de imágenes lanzada por ByteDance, que se centra en la integración de la generación y la edición, con potentes funciones como la edición precisa de comandos, la alta retención de funciones y la comprensión profunda de intenciones.
rStar2-Agent: el eficiente modelo de inferencia de IA de código abierto de Microsoft
rStar2-Agent es un modelo avanzado de razonamiento matemático de IA de código abierto de Microsoft que demuestra una gran capacidad para resolver problemas matemáticos al alcanzar una precisión de 80,61 TP3T en la prueba AIME24. El modelo está equipado con capacidades de razonamiento científico, logrando en la prueba GPQA-Diamond...
InfinityHuman: un modelo de generación humana digital de vídeo largo lanzado por Bytes en colaboración con ZJU.
InfinityHuman es un modelo comercial de generación de vídeos de personajes con series de audio de larga duración lanzado conjuntamente por ByteDance y la Universidad de Zhejiang. El modelo se basa en el audio y puede generar vídeos de personajes de alta resolución, larga duración y coherencia visual.
Kimi K2-0905 - ¡El último modelo de Dark Side of the Moon!
Kimi K2-0905 es un modelo avanzado de IA de Dark Side of the Moon Technologies Ltd. que destaca en la asistencia a la programación, genera código de forma eficiente y favorece la generación de código ordenado y estandarizado en el desarrollo front-end. La longitud del contexto del modelo se amplía hasta 256K para gestionar tareas complejas.
Meeseeks - Conjunto de evaluación de código abierto Meeseeks para evaluar la capacidad de seguir instrucciones de modelos.
Meeseeks es un conjunto de evaluación de grandes modelos de código abierto utilizado por el equipo M17 de Meituan para evaluar la capacidad de un modelo para seguir instrucciones.Meeseeks utiliza un marco de evaluación de tres niveles para medir de forma exhaustiva si un modelo es capaz de generar respuestas en estricta conformidad con las instrucciones del usuario desde el nivel macro al micro, y no evalúa el conocimiento del contenido de la respuesta como...
gpt-realtime - El último modelo de voz con IA de OpenAI
gpt-realtime es un modelo avanzado de habla de OpenAI que admite el procesamiento directo del audio para generar un habla natural y fluida. El modelo admite varios idiomas y estilos, entiende señales no verbales como la risa y puede cambiar de idioma.