Proyecto operativo de código abierto que integra múltiples servicios avanzados de síntesis de voz
Introducción general Open-VoiceCanvas es una plataforma de síntesis de voz de código abierto desarrollada por el equipo ItusiAI. Soporta más de 50 idiomas, y puede convertir texto en habla natural, así como clonar voces personalizadas subiendo audio. El proyecto integra Ope...
Libra: un cliente para generar inteligencias IA locales con diálogo (prueba interna)
Introducción general Libra es una innovadora herramienta de Greenbit.ai cuya función principal es generar inteligencias IA que se ejecutan localmente a través del diálogo en lenguaje natural. Denominada "Vibe Agent", permite a los usuarios describir sus necesidades en términos sencillos y crear rápidamente...
VideoMind: proyecto de código abierto de posicionamiento de vídeos por marcas de tiempo y preguntas y respuestas
Introducción general VideoMind es una herramienta de IA multimodal de código abierto centrada en la inferencia, las preguntas y respuestas y la generación de resúmenes para vídeos largos. Fue desarrollada por Ye Liu, de la Universidad Politécnica de Hong Kong, y un equipo del Show Lab de la Universidad Nacional de Singapur. La herramienta imita la comprensión humana del vídeo...
SuperCoder: Asistente de código inteligente para la ejecución de terminales de línea de comandos
Introducción general SuperCoder es una herramienta inteligente que se ejecuta en el terminal y está diseñada para programadores. Utiliza tecnología de IA para ayudar a los usuarios a buscar código, ver la estructura del proyecto, editar archivos y corregir errores.El proyecto es de código abierto por huytd en GitHub y soporta...
Emigo: un asistente para tareas complejas de programación que utiliza IA en Emacs
Introducción general Emigo es un asistente de programación de IA de código abierto diseñado para Emacs, desarrollado por MatthewZMD en GitHub. Ayuda a los programadores a completar el análisis de código en Emacs integrando un modelo de lenguaje a gran escala (LLM)....
SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo
Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...
ChatGPT genera palabras clave de comparación de doble estilo de retrato
Palabra clave Un dramático retrato de Hayao Miyazaki en primer plano. La composición es perfectamente sim...
Cuando Gemini 2.5 se encuentra con Three.js, ¡la solución para animar demostraciones didácticas está completa!
Three.js es una herramienta que permite a las páginas web mostrar imágenes "tridimensionales". Piénsalo así: proporciona un conjunto de herramientas que permiten a los desarrolladores dibujar formas tridimensionales en páginas web, como cubos, esferas, etcétera. También permite que estas formas 3D se muevan, lo que puede hacerse...
GeminiCode: un asistente de programación basado en Gemini 2.5 que funciona en terminales
Introducción general GeminiCode es un asistente de programación de IA que se ejecuta en un terminal, desarrollado por desarrolladores en su tiempo libre los fines de semana. Está basado en el modelo Gemini 2.5 Pro de Google y puede leer y modificar archivos en el directorio actual de tu ordenador. Este...
GenXD: framework de código abierto para generar vídeos de escenas arbitrarias en 3D y 4D
Introducción general GenXD es un proyecto de código abierto desarrollado por la Universidad Nacional de Singapur (NUS) y el equipo de Microsoft. Se centra en la generación de escenas arbitrarias en 3D y 4D , para resolver la generación en 3D y 4D en el mundo real debido a la insuficiencia de datos y la complejidad del diseño del modelo provocada por el problema . El proyecto fue desarrollado por ...