Círculo de intercambio de inteligencia artificial

Puesta en común diaria de los últimos productos, proyectos, marcos, interpretaciones de documentos, etc.~ sobre IA.
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-Avatar - Modelo humano digital de voz híbrido de código abierto de Tencent

HunyuanVideo-Avatar es un modelo humano digital de voz avanzada lanzado conjuntamente por el equipo Tencent Mixed Yuan y Tencent Music Tianqin Lab. El modelo se basa en la innovadora arquitectura de difusión multimodal Transformer, que genera expresiones naturales a partir de imágenes de personajes y audio cargados por el usuario....
hace 10 meses
045.8K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - Plataforma de creación de vídeo humano digital con IA y soporte de traducción y doblaje multilingüe

HeyGen es una plataforma de creación de vídeos humanos digitales impulsada por la IA que facilita un proceso de producción de vídeo racionalizado, permitiendo a los usuarios generar rápidamente vídeos humanos digitales de calibre profesional. La plataforma se basa en una avanzada tecnología de inteligencia artificial que ofrece a los usuarios un control total sobre la imagen y la voz de sus personajes digitales, así como una...
hace 10 meses
043.9K
Keevx - AI 数字人视频创作平台,一键生成脚本和视频

Keevx - Plataforma de creación de vídeos humanos digitales con IA, generación de guiones y vídeos con un solo clic

Keevx es una plataforma para la creación de vídeos humanos digitales con IA, principalmente para PYMES extranjeras y creadores individuales. Basada en la generación de guiones inteligentes de IA y funciones de traducción, con retratos públicos y plantillas de alta calidad, proporciona a los usuarios servicios de generación de vídeo de marketing humano digital con un solo clic.
hace 10 meses
052.8K
Make - AI无代码自动化工作流搭建平台

Make: la plataforma de creación de flujos de trabajo automatizados sin código de AI

Make es una plataforma de automatización sin código basada en IA que ayuda a las organizaciones a mejorar la eficiencia y la innovación mediante procesos automatizados. La plataforma ofrece más de 2.000 aplicaciones preconstruidas que dan soporte a una gran variedad de escenarios empresariales, como marketing, ventas, finanzas, etc. Entre las principales características de Make se incluyen la creación de procesos visuales sin código, la IA...
hace 10 meses
046.2K
MiMo-VL - 小米开源的多模态模型

MiMo-VL: el modelo multimodal de código abierto de Xiaomi

MiMo-VL es el gran modelo multimodal de código abierto de Xiaomi, que consta de un codificador visual, una capa de proyección multimodal y un modelo de lenguaje. El codificador visual se basa en Qwen2.5-ViT, que admite entradas de resolución nativa y conserva más detalles; el modelo de lenguaje es el MiMo-7B de desarrollo propio de Xiaomi, diseñado para proyecciones complejas....
hace 10 meses
049.5K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - Plataforma de ayuda a la escritura académica con IA para un asesoramiento y asistencia precisos en la escritura

Olovka AI es una plataforma de ayuda a la redacción académica para estudiantes, que proporciona asesoramiento y asistencia precisos en función del nivel académico, el campo de especialización y el tipo de trabajo. Basándose en algoritmos inteligentes, Olovka AI ayuda a los estudiantes a escribir rápidamente trabajos académicos de alta calidad que serán...
hace 10 meses
045K
Fish Audio - AI 语音合成与声音克隆工具

Fish Audio - Herramienta AI de síntesis de voz y clonación de sonidos

Fish Audio es una potente herramienta de síntesis de voz generativa AI que soporta texto a voz (TTS) y la clonación de voz. Los usuarios sólo tienen que introducir texto, la herramienta es compatible con la conversión de voz natural y suave, la plataforma ofrece una variedad de idiomas y estilos de voz para elegir, para satisfacer diferentes escenarios y...
hace 10 meses
071K
SignGemma - 谷歌 DeepMind 推出的手语翻译模型

SignGemma - Modelo de traducción del lenguaje de signos de Google DeepMind

SignGemma es el modelo de IA de interpretación del lenguaje de signos más potente del mundo, creado por Google DeepMind, que permite traducir con precisión el lenguaje de signos estadounidense (ASL) a texto en inglés. El modelo se basa en el entrenamiento multimodal, combinando datos visuales y textuales para captar las acciones del lenguaje de signos en tiempo real y traducirlas rápidamente a texto....
hace 10 meses
052K
FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - Modelo de generación y edición de imágenes de la Selva Negra

FLUX.1 Kontext es un modelo de generación y edición de imágenes de Black Forest Labs que proporciona técnicas de procesamiento de imágenes conscientes del contexto. El modelo entiende las respuestas a las señales de texto e imagen, realiza tareas como la modificación de objetos, la conversión de estilos y la sustitución del fondo, manteniendo la esquina...
hace 10 meses
042.8K
WebAgent - 阿里通义开源的自主搜索AI Agent

WebAgent - Agente AI de búsqueda autónoma de código abierto Ali Tongyi

WebAgent es un agente de búsqueda autónoma de Alibaba Tongyi Labs con una potente capacidad de recuperación de información autónoma de extremo a extremo y de razonamiento en varios pasos. WebAgent puede percibir, decidir y actuar activamente en el entorno de red como los humanos, y se utiliza ampliamente en la investigación académica, la toma de decisiones empresariales...
hace 10 meses
050.1K