Proyecto AI de código abierto

Total 1020 artículos
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: herramienta de globalización multilingüe para vídeo con traducción y doblaje en un clic

Introducción completa KrillinAI es una herramienta de procesamiento de vídeo de código abierto que se centra en el uso de la inteligencia artificial para ayudar a los usuarios a traducir vídeos y doblarlos automáticamente. Puede empezar desde la descarga del vídeo, hasta generar el producto final adaptado a diferentes plataformas, todo el proceso es cuestión de unos pocos clics. Los desarrolladores están disponibles en GitHub...
hace 2 meses
01.7K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: los documentos PDF se traducirán a herramientas bilingües de código abierto

Introducción general BabelDOC es una herramienta de código abierto diseñada para traducir documentos PDF a un formato bilingüe. Está desarrollado por el equipo funstory-ai , alojado en GitHub , sirviendo principalmente a la necesidad de tratar con usuarios de documentos en lenguas extranjeras , como investigadores...
hace 2 meses
01.5K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: proyecto de código abierto de posicionamiento de vídeos por marcas de tiempo y preguntas y respuestas

Introducción general VideoMind es una herramienta de IA multimodal de código abierto centrada en la inferencia, las preguntas y respuestas y la generación de resúmenes para vídeos largos. Fue desarrollada por Ye Liu, de la Universidad Politécnica de Hong Kong, y un equipo del Show Lab de la Universidad Nacional de Singapur. La herramienta imita la comprensión humana del vídeo...
hace 2 meses
01.2K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: herramienta de código abierto para generar vídeo con sincronización labial directamente a partir de audio

Introducción general LatentSync es una herramienta de código abierto desarrollada por ByteDance y alojada en GitHub. Controla los movimientos labiales de los personajes de un vídeo directamente a través del audio, de modo que la forma de la boca coincide con la voz con precisión. El proyecto se basa en Stable Di...
hace 2 meses
02.5K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: un reproductor de vídeo que genera subtítulos en tiempo real con traducción bilingüe

Introducción general LLPlayer es un reproductor multimedia de código abierto para estudiantes de idiomas, alojado en GitHub y creado por el desarrollador umlx5h. Integra una variedad de características útiles como la visualización de subtítulos bilingües, subtítulos autogenerados por IA, traducción en tiempo real y búsqueda de palabras....
hace 2 meses
02.5K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: un marco para crear y desplegar rápidamente inteligencias de IA a través del lenguaje natural

Introducción general AutoAgent es un marco de inteligencias de IA de código abierto desarrollado por el Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong (HKUDS) y alojado en GitHub.Permite a los usuarios crear y desplegar rápidamente inteligencias de IA personalizadas describiendo sus requisitos en lenguaje puramente natural, sin ninguna base de programación....
hace 2 meses
01.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: modelo de aprendizaje profundo para eliminar rápidamente el fondo de imágenes y vídeos

Introducción exhaustiva BEN2 (Background Erase Network 2) es un modelo de aprendizaje profundo desarrollado por Prama LLC específicamente diseñado para eliminar automáticamente el fondo de una imagen y generar una imagen en primer plano. El modelo utiliza un innovador algoritmo de Confiden...
hace 2 meses
02.1K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: un marco de código abierto para ejecutar inteligencias IA para navegar por la web, permitiendo a la IA manipular automáticamente las páginas web.

Introducción general Browser Use Web UI es un innovador proyecto de código abierto centrado en proporcionar a los agentes de IA capacidades de interacción con el navegador como herramienta de interfaz gráfica. El proyecto está construido sobre el núcleo del framework browser-use, construido con Gradio ...
hace 2 meses
02.8K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: herramienta de traducción automática que conserva toda la tipografía de los PDF

Introducción completa PDFMathTranslate es una herramienta de código abierto centrado en la traducción de artículos científicos , documentos PDF se pueden traducir en su totalidad y generar una versión bilingüe . Utiliza la tecnología AI para conservar el diseño completo del documento original , incluyendo fórmulas , diagramas , tablas de contenido y notas , soporte ...
hace 2 meses
03K