Fish Audio - Herramienta AI de síntesis de voz y clonación de sonidos
Fish Audio es una potente herramienta de síntesis de voz generativa AI que soporta texto a voz (TTS) y la clonación de voz. Los usuarios sólo tienen que introducir texto, la herramienta es compatible con la conversión de voz natural y suave, la plataforma ofrece una variedad de idiomas y estilos de voz para elegir, para satisfacer diferentes escenarios y...
SignGemma - Modelo de traducción del lenguaje de signos de Google DeepMind
SignGemma es el modelo de IA de interpretación del lenguaje de signos más potente del mundo, creado por Google DeepMind, que permite traducir con precisión el lenguaje de signos estadounidense (ASL) a texto en inglés. El modelo se basa en el entrenamiento multimodal, combinando datos visuales y textuales para captar las acciones del lenguaje de signos en tiempo real y traducirlas rápidamente a texto....
FLUX.1 Kontext - Modelo de generación y edición de imágenes de la Selva Negra
FLUX.1 Kontext es un modelo de generación y edición de imágenes de Black Forest Labs que proporciona técnicas de procesamiento de imágenes conscientes del contexto. El modelo entiende las respuestas a las señales de texto e imagen, realiza tareas como la modificación de objetos, la conversión de estilos y la sustitución del fondo, manteniendo la esquina...
WebAgent - Agente AI de búsqueda autónoma de código abierto Ali Tongyi
WebAgent es un agente de búsqueda autónoma de Alibaba Tongyi Labs con una potente capacidad de recuperación de información autónoma de extremo a extremo y de razonamiento en varios pasos. WebAgent puede percibir, decidir y actuar activamente en el entorno de red como los humanos, y se utiliza ampliamente en la investigación académica, la toma de decisiones empresariales...
Lingcode IDE - Tongyi Lingcode lanza herramientas de entorno de desarrollo nativo de IA
Spirit Code IDE es el entorno de desarrollo integrado (IDE) nativo de IA lanzado por Tongyi Spirit Code, que está profundamente adaptado a los 3 modelos principales de Thousand Questions, y tiene un potente modo de cuerpo inteligente de programación para apoyar la realización autónoma de tareas como la percepción del proyecto, la recuperación de código y la ejecución de operaciones terminales. Es compatible con las herramientas de MCP e integra Magic Hitch MCP Square's 3...
BAGEL - Modelo de base multimodal de código abierto lanzado por Wordpress
BAGEL es un modelo base multimodal de código abierto de ByteDance con 14.000 millones de parámetros, de los cuales 7.000 millones están activos. La base del modelo y la Arquitectura Experta de Transformación Mixta (MoT), que captura las características a nivel de píxel y a nivel semántico de una imagen con dos codificadores independientes respectivamente, admite un procesamiento eficiente de imagen, texto, vídeo...
DeepSeek-R1 - Modelo de inferencia de IA de DeepSeek, rendimiento alineado con la versión OpenAI o1
DeepSeek-R1 es un modelo de inferencia de IA de alto rendimiento lanzado por DeepSeek, con sede en Hangzhou, que se compara con la versión oficial o1 de OpenAI. El modelo está post-entrenado sobre la base de técnicas de aprendizaje por refuerzo a gran escala y solo requiere una cantidad muy pequeña de datos etiquetados para razonar en matemáticas, código y lenguaje natural....
Phantom Boat AI - Plataforma única de creación de cortometrajes con IA, generación por lotes de varios tipos de contenidos de vídeo.
Phantom Boat AI es una potente plataforma integral de creación de cortometrajes con IA que permite la generación eficiente por lotes de varios tipos de contenidos de vídeo, incluidos anuncios, promos, animaciones y mucho más. La plataforma se basa en Midjourney, Runway y otros modelos de IA líderes en el mundo, y ofrece a los creadores una amplia gama de servicios, desde la escritura de guiones hasta...
Circuit Tracer - Herramienta de código abierto de Anthropic para visualizar el funcionamiento interno de un modelo.
Circuit Tracer es una herramienta de código abierto de Anthropic para estudiar el funcionamiento interno de grandes modelos lingüísticos. Se basa en la generación de gráficos de atribución (attribution graphs) para revelar los pasos internos que sufre el modelo al generar una determinada salida...
Google AI Edge Gallery - Google lanza una aplicación de IA para ayudar a los teléfonos móviles a ejecutar modelos de IA
Google AI Edge Gallery es una aplicación de IA experimental de Google que permite a los usuarios experimentar y utilizar modelos de aprendizaje automático (ML) e inteligencia artificial generativa (GenAI) en dispositivos nativos. La aplicación es compatible con dispositivos Android.