Midjourney V7 Alpha Test se lanza con el nuevo "Modo Borrador"
Midjourney, una popular herramienta en el campo de la generación de imágenes con Inteligencia Artificial, ha lanzado recientemente una versión de prueba Alpha de su último modelo, Midjourney V7. Esta actualización llega casi un año después de la última gran versión, V6, y aporta varias mejoras importantes y nuevos...
GitHub Copilot ajusta su estrategia: introduce límites de uso de modelos avanzados y un nuevo sistema de pagos
Recientemente, GitHub, propiedad de Microsoft, ha modificado la estrategia de servicio de su popular asistente de programación de IA GitHub Copilot, introduciendo nuevas restricciones de uso y un mecanismo de pago para algunas de sus funciones avanzadas de modelado de IA. El cambio podría significar...
Augment Code: un asistente de AI para grandes bases de código
Introducción general Augment Code es una herramienta de codificación AI diseñada para ingenieros de software profesionales, con una característica central de comprensión profunda de su base de código. Ocupa el primer puesto en la comparativa SWE-Bench Verified con una puntuación de 65,4%, y combina Cla...
DeepSite: Genere páginas web front-end gratuitas con previsualizaciones en tiempo real mediante DeepSeek V3
Introducción general DeepSite es una herramienta de generación de sitios web basada en IA que permite a los usuarios generar rápidamente una página web front-end ejecutable en vivo introduciendo una simple descripción de texto. Desarrollada por enzostvs, miembro de la comunidad Hugging Face,...
Conversión de vídeo y voz a subtítulos SRT mediante el modelo Gimine 2.5 Pro
Ya he intentado antes convertir voz a subtítulos para varios locutores con Gemini 2.0 gratis, y el resultado es bastante bueno. Lo he vuelto a intentar con Gimine 2.5 pro. En primer lugar, encontré una muestra de subtítulo SRT estándar como base de referencia (hacer el discurso...
uniOCR: herramienta de reconocimiento de texto multiplataforma y de código abierto
Introducción general uniOCR es una herramienta de reconocimiento de texto de código abierto desarrollada por el equipo mediar-ai. Está basada en el lenguaje Rust y es compatible con los sistemas macOS, Windows y Linux. Los usuarios pueden utilizarla para extraer texto de imágenes...
Serena: una herramienta MCP gratuita para la recuperación semántica y la edición de código
Introducción general Serena es una herramienta de programación gratuita y de código abierto desarrollada por el equipo Oraios AI y alojada en GitHub. Es un potente asistente de código que funciona directamente en su base de código para ayudar a los desarrolladores a analizar, editar y ejecutar código.Seren...
AudioX: generación de audio y música a partir de texto referenciado, imágenes, vídeo
Introducción general AudioX es un proyecto de código abierto en GitHub de Zeyue Tian et al. El artículo oficial está publicado en arXiv (número 2503.10522). Se basa en el método de transf...
EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli
Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...
Problemas desafiantes de nivel olímpico: una revisión de 7 puntos de referencia de rendimiento en matemáticas chinas del LLM principal
La capacidad matemática, que abarca la derivación de fórmulas, la construcción de cadenas lógicas y el pensamiento abstracto, se considera desde hace tiempo un área clave para poner a prueba las capacidades de la Inteligencia Artificial (IA), en particular de los modelos lingüísticos a gran escala (LLM). Esto se debe a que no sólo pone a prueba la potencia computacional, sino que también profundiza en la capacidad del modelo para razonar, comprender y resolver problemas complejos....