Círculo de intercambio de inteligencia artificial

¡Día arqueando un peón y compartiendo por el rey!
Midjourney V7 Alpha 测试启动,带来全新“草稿模式”

Midjourney V7 Alpha Test se lanza con el nuevo "Modo Borrador"

Midjourney, una popular herramienta en el campo de la generación de imágenes con Inteligencia Artificial, ha lanzado recientemente una versión de prueba Alpha de su último modelo, Midjourney V7. Esta actualización llega casi un año después de la última gran versión, V6, y aporta varias mejoras importantes y nuevos...
hace 4 meses
02.8K
GitHub Copilot 调整策略:引入高级模型使用限制与新付费方案

GitHub Copilot ajusta su estrategia: introduce límites de uso de modelos avanzados y un nuevo sistema de pagos

Recientemente, GitHub, propiedad de Microsoft, ha modificado la estrategia de servicio de su popular asistente de programación de IA GitHub Copilot, introduciendo nuevas restricciones de uso y un mecanismo de pago para algunas de sus funciones avanzadas de modelado de IA. El cambio podría significar...
hace 4 meses
03.7K
Augment Code:为大型代码库设计的AI编码助手

Augment Code: un asistente de AI para grandes bases de código

Introducción general Augment Code es una herramienta de codificación AI diseñada para ingenieros de software profesionales, con una característica central de comprensión profunda de su base de código. Ocupa el primer puesto en la comparativa SWE-Bench Verified con una puntuación de 65,4%, y combina Cla...
hace 4 meses
04.7K
DeepSite:使用DeepSeek V3免费生成实时预览的前端网页

DeepSite: Genere páginas web front-end gratuitas con previsualizaciones en tiempo real mediante DeepSeek V3

Introducción general DeepSite es una herramienta de generación de sitios web basada en IA que permite a los usuarios generar rápidamente una página web front-end ejecutable en vivo introduciendo una simple descripción de texto. Desarrollada por enzostvs, miembro de la comunidad Hugging Face,...
hace 4 meses
08.7K
使用 Gimine 2.5 Pro 模型将视频、语音转为SRT字幕

Conversión de vídeo y voz a subtítulos SRT mediante el modelo Gimine 2.5 Pro

Ya he intentado antes convertir voz a subtítulos para varios locutores con Gemini 2.0 gratis, y el resultado es bastante bueno. Lo he vuelto a intentar con Gimine 2.5 pro. En primer lugar, encontré una muestra de subtítulo SRT estándar como base de referencia (hacer el discurso...
hace 4 meses
03K
uniOCR:跨平台开源的文字识别工具

uniOCR: herramienta de reconocimiento de texto multiplataforma y de código abierto

Introducción general uniOCR es una herramienta de reconocimiento de texto de código abierto desarrollada por el equipo mediar-ai. Está basada en el lenguaje Rust y es compatible con los sistemas macOS, Windows y Linux. Los usuarios pueden utilizarla para extraer texto de imágenes...
hace 4 meses
03.4K
Serena:语义检索和编辑代码的免费MCP工具

Serena: una herramienta MCP gratuita para la recuperación semántica y la edición de código

Introducción general Serena es una herramienta de programación gratuita y de código abierto desarrollada por el equipo Oraios AI y alojada en GitHub. Es un potente asistente de código que funciona directamente en su base de código para ayudar a los desarrolladores a analizar, editar y ejecutar código.Seren...
hace 4 meses
010.5K
AudioX:参考文本、图像、视频生成音频和音乐

AudioX: generación de audio y música a partir de texto referenciado, imágenes, vídeo

Introducción general AudioX es un proyecto de código abierto en GitHub de Zeyue Tian et al. El artículo oficial está publicado en arXiv (número 2503.10522). Se basa en el método de transf...
hace 4 meses
04.5K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli

Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...
hace 4 meses
04.2K
挑战奥赛级难题:7款主流LLM中文数学性能基准评测

Problemas desafiantes de nivel olímpico: una revisión de 7 puntos de referencia de rendimiento en matemáticas chinas del LLM principal

La capacidad matemática, que abarca la derivación de fórmulas, la construcción de cadenas lógicas y el pensamiento abstracto, se considera desde hace tiempo un área clave para poner a prueba las capacidades de la Inteligencia Artificial (IA), en particular de los modelos lingüísticos a gran escala (LLM). Esto se debe a que no sólo pone a prueba la potencia computacional, sino que también profundiza en la capacidad del modelo para razonar, comprender y resolver problemas complejos....
hace 4 meses
03K