Últimos recursos sobre IA

共 2759 篇文章
EmemeAI:创建并导出3D虚拟AI角色的互动平台

EmemeAI: plataforma interactiva para crear y exportar personajes virtuales 3D de IA

Introducción general EmemeAI es una plataforma que ayuda a los usuarios a crear personajes 3D de IA. Puedes subir modelos 3D en formato VRM, establecer la personalidad del personaje y generar personajes virtuales que pueden chatear y moverse automáticamente. Estos personajes no sólo pueden hablar contigo, sino también generar expresiones y acciones según el contexto.E...
hace 6 meses
025.6K
Consensus:优秀的学术论文搜索引擎

Consenso: un excelente motor de búsqueda de trabajos académicos

Consensus es un motor de búsqueda que utiliza tecnología de IA para encontrar y resumir artículos de investigación científica. A través de la plataforma, los usuarios pueden hacer preguntas como "¿Puede la creatina ayudar a construir músculo?" o "¿Puede la meditación con pensamiento positivo mejorar el sueño?" y obtener información de más de 200 millones de artículos científicos...
hace 1 año
025.6K
VEED.IO:AI驱动的简单视频编辑平台

VEED.IO: plataforma basada en inteligencia artificial para la edición sencilla de vídeo

Introducción general VEED.IO es una plataforma de edición de vídeo basada en navegador que permite a los usuarios crear rápidamente vídeos profesionales gracias a la tecnología de IA. Ofrece una interfaz intuitiva para que principiantes y equipos profesionales puedan editar, añadir subtítulos y optimizar efectos sin necesidad de software complejo. Entre sus funciones principales se incluyen...
hace 6 meses
025.6K
Noisee AI:用音乐旋律生成风格一致的MV动态视频

Noisee AI: Generación de vídeos de movimiento MV estilísticamente coherentes con melodías musicales

Introducción general Noisee es una herramienta de generación de vídeos musicales mediante IA desarrollada por Tranquilitatis Inc, filial de Dark Side of the Moon, que ha demostrado una gran potencia y una amplia gama de aplicaciones en el campo de la creación musical y las artes visuales. Noisee AI es una innovadora...
hace 12 meses
025.6K
Signs:通过AI技术助力学习和贡献美国手语的互动平台

Signos: una plataforma interactiva para aprender y contribuir al lenguaje de signos americano impulsada por la tecnología de IA.

Introducción general Signs es una innovadora plataforma online diseñada para ayudar a los usuarios a aprender el lenguaje de signos americano (ASL) y contribuir a la comunidad sorda a través de la tecnología de inteligencia artificial. El sitio está impulsado por NVIDIA, la American Society for Deaf Children (ASDC) y la agencia creativa Hello Mond....
hace 8 meses
025.6K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo

Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...
hace 7 meses
025.6K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

AR Drawing: una aplicación que utiliza la tecnología AR y AI para mejorar las habilidades de dibujo a mano realista.

Descripción general AR Drawing es una aplicación que utiliza la tecnología de realidad aumentada (RA) para ayudar a los usuarios a mejorar sus habilidades de dibujo. La aplicación ofrece más de 200 lecciones de dibujo guiadas paso a paso que cubren una variedad de plantillas de dibujo desde niveles principiantes hasta avanzados. Los usuarios pueden utilizar la cámara de su teléfono móvil para proyectar imágenes...
hace 11 meses
025.6K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: una herramienta de código abierto para mejorar la calidad de la generación de imágenes y vídeos

Introducción exhaustiva CFG-Zero-star es un proyecto de código abierto desarrollado por Weichen Fan y el equipo S-Lab de la Universidad Tecnológica de Nanyang. Se centra en la mejora de la técnica Classifier Free Guidance (CFG) en modelos de correspondencia de flujos mediante la optimización de la estrategia de guiado y de la ...
hace 7 meses
025.6K
Spline:交互式3D设计工具,在浏览器中生成专业级3D数字体验

Spline: una herramienta interactiva de diseño 3D que genera experiencias digitales 3D de calidad profesional en el navegador.

Introducción general Spline es una revolucionaria plataforma de diseño 3D basada en web que permite a los diseñadores crear, editar y compartir contenidos 3D de calidad profesional directamente en el navegador. La plataforma rompe con la complejidad de las herramientas tradicionales de diseño 3D al ofrecer una interfaz de usuario intuitiva y un potente conjunto de funciones. A través de...
hace 10 meses
025.6K
堆友:AI设计工具箱与创意平台

Heap Friend: kit de herramientas de diseño de IA y plataforma creativa

Introducción completa PileYou es una plataforma en línea construida por el equipo de diseño de Alibaba que integra una variedad de herramientas de diseño de IA, diseñadas para diseñadores y trabajadores creativos. La plataforma proporciona herramientas de generación de IA desde texto a imágenes, incluyendo herramientas de diseño de la industria vertical, PileYou Camera, Deer Class Marketing Chart, AI Art Characters, Model Change...
hace 1 año
025.6K
Wrtn:优秀简洁的智能写作助手,提供常用写作模板与防御AI检测功能(韩语)

Wrtn: excelente y sencillo asistente de escritura inteligente, que proporciona plantillas de escritura comunes y función de detección de IA defensiva (coreano).

Introducción general Wrtn es una plataforma de generación de contenidos basada en IA diseñada para ayudar a los usuarios a crear rápidamente contenidos de texto de alta calidad. Ya se trate de un trabajo académico, un documento de negocios o un post en las redes sociales, Wrtn proporciona soporte de escritura inteligente a través de su potente tecnología de IA. Los usuarios solo tienen que...
hace 11 meses
025.5K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: ¡Acceso gratuito a GPT-4, Llama-3 y muchos otros modelos de IA a través de Raycast!

Introducción general Raycast-G4F (GPT4Free) es una potente extensión de Raycast que ofrece a los usuarios acceso gratuito a una amplia gama de modelos avanzados de IA, incluyendo GPT-4, Llama-3. La extensión no sólo proporciona transmisión de diálogos en tiempo real...
hace 9 meses
025.5K
Luma Labs:Luma 系列视觉模型,使用丰富的自然语言描述来生成高质量图像和视频

Luma Labs: familia Luma de modelos visuales que utilizan descripciones ricas en lenguaje natural para generar imágenes y vídeos de alta calidad.

Introducción general Luma Labs es una empresa dedicada a la generación de imágenes y vídeos de alta calidad mediante técnicas de inteligencia artificial. Sus principales productos son Luma Photon y Luma Ray2, herramientas que generan imágenes y vídeos fotorrealistas a partir de texto para diversos...
hace 8 meses
025.5K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: plataforma de creación de locuciones profesionales y narraciones de vídeos cortos | locución de persona real | clonar la voz | con un clic en una película

Introducción completa Magic Voice Workshop es una plataforma integral de doblaje de vídeos cortos y de IA con información sobre doblaje por software, doblaje real, bibliotecas de sonido, servicios de clonación y mucho más. La plataforma integra edición de audio, generación de copias de IA, edición de vídeo y herramientas de colaboración para servicios relacionados con el audio y la creación de contenidos. Los usuarios experimentan el editor de audio...
hace 1 año
025.5K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk: Asistente inteligente de búsqueda de empleo, colocación automatizada de CV (sólo en inglés)

Introducción general Auto_Jobs_Applier_AIHawk es una herramienta para automatizar la búsqueda de empleo utilizando tecnología de inteligencia artificial. Ayuda a los usuarios a automatizar el envío de un gran número de CV en un corto periodo de tiempo y a personalizarlos según su información personal y sus intenciones de búsqueda de empleo. La herramienta está diseñada...
hace 10 meses
025.5K
Blooper:智能生成脚本与分镜画面的创作工具

Blooper: una herramienta de creación que genera guiones y pantallas divididas de forma inteligente

Introducción general Blooper es una plataforma de creación basada en IA que se centra en ayudar a los usuarios a generar guiones de vídeo y pantallas divididas. Fue creada por la empresa suiza Blooper AI, con sede en Baar, Zug, y está diseñada para apoyar la preproducción en las industrias de la publicidad, el cine y la televisión. La red...
hace 7 meses
025.5K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: cargue una imagen y migre las funciones de retrato para generar diferentes estilos de imágenes

Introducción completa InstantID es una tecnología avanzada centrada en la generación de imágenes con estilos o poses personalizados en cuestión de segundos, al tiempo que garantiza un alto nivel de fidelidad utilizando una única imagen de identificación de referencia. La tecnología utiliza una solución basada en un modelo de difusión mediante la integración de imágenes faciales, mapas de puntos de referencia...
hace 1 año
025.5K
Relevance AI:让企业轻松创建AI助手的无代码平台

Relevance AI: la plataforma sin código que facilita a las empresas la creación de asistentes de inteligencia artificial

Introducción general Relevance AI es una plataforma que facilita a las empresas la creación de asistentes de IA. No requiere programación y cualquiera puede utilizarla para diseñar IA para tareas cotidianas como responder correos electrónicos, organizar datos o generar contenidos. El objetivo de la web es ayudar a las empresas a ahorrar tiempo y mejorar la eficiencia a través de la IA....
hace 7 meses
025.5K
InboxPilot:学习公司内部知识自动化处理电子邮件的AI工具

InboxPilot: la herramienta de IA que aprende los conocimientos internos de la empresa para automatizar el tratamiento del correo electrónico

Introducción general InboxPilot es una herramienta de automatización de correo electrónico con inteligencia artificial diseñada para que las empresas redacten y envíen respuestas de correo electrónico de forma inteligente utilizando datos internos de la empresa. No sólo ahorra tiempo, sino que también mejora la eficacia y la calidad del servicio al cliente. La herramienta es especialmente adecuada para gestionar grandes volúmenes de...
hace 7 meses
025.5K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: modelo multimodal de código abierto para la comprensión de vídeos y rondas múltiples de diálogo

Introducción CogVLM2 es un modelo multimodal de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), basado en la arquitectura Llama3-8B, y cuyo objetivo es proporcionar un rendimiento comparable o incluso mejor que GPT-4V. El modelo permite la comprensión de imágenes, el diálogo...
hace 8 meses
025.5K
Diffus(GRAVITI Diffus):功能完整的原生云端 Stable Diffusion WebUI(NSFW)

Diffus (GRAVITI Diffus): WebUI nativa de difusión estable en la nube con todas las funciones (NSFW)

Introducción general Diffus es una plataforma de generación de imágenes AI para creadores profesionales y entusiastas del arte, basada en la tecnología Stable Diffusion. Ofrece un rico conjunto de modelos, extensiones y herramientas para ayudar a los usuarios a generar imágenes de alta calidad con sencillas indicaciones....
hace 12 meses
025.5K
ExamFul.AI:智能备考助手,助力AP、IB和A-Level考试,历年真题/论文和AI智能辅导

ExamFul.AI: asistente inteligente para la preparación de exámenes AP, IB y A-Level, preguntas/ensayos de exámenes anteriores y tutoría inteligente con IA.

Introducción general ExamFul es una plataforma de aprendizaje en línea diseñada para estudiantes que se preparan para los exámenes AP, IB y A-Level. La plataforma proporciona abundantes recursos de preguntas de exámenes anteriores y combina la tutoría inteligente de IA para ayudar a los estudiantes a prepararse para los exámenes de manera eficiente. Ya sea consolidando puntos de conocimiento o resolviendo problemas difíciles, Ex...
hace 12 meses
025.5K
Hyperspace(aiOS):分布式AI算力共享网络,aiOS生成式浏览器,深度知识智能体

Hyperspace (aiOS): red distribuida de intercambio aritmético de IA, navegador generativo aiOS, inteligencias de conocimiento profundo.

Introducción general Hyperspace es un innovador navegador generativo (aiOS) basado en la mayor red de IA peer-to-peer del mundo, diseñado para proporcionar a los usuarios potentes herramientas para la investigación y el análisis en profundidad. Al integrar múltiples modelos de IA y fuentes de datos, Hyperspace permite a los usuarios generar rápidamente...
hace 7 meses
025.5K
FliFlik:AI图片处理客户端,一键图像高清化、放大、降噪与水印去除

FliFlik: cliente de procesamiento de imágenes AI, HD de imágenes con un solo clic, ampliación, reducción de ruido y eliminación de marcas de agua.

Introducción general FliFlik es una plataforma de soluciones multimedia centrada en ofrecer servicios de procesamiento digital eficaces y cómodos. Ya sean fotos, audio o vídeo, FliFlik puede optimizarlos y mejorarlos con su avanzada tecnología de IA. La plataforma es compatible con Windows...
hace 10 meses
025.5K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: una herramienta de código abierto para optimizar las palabras clave de los modelos de IA convencionales.

Introducción general Prompt Optimizer es una herramienta de código abierto centrada en la optimización de palabras clave, desarrollada por linshenkx en GitHub. Ayuda a los usuarios a optimizar las palabras clave de los modelos de IA mediante algoritmos inteligentes, mejorando así la calidad del contenido generado...
hace 8 meses
025.5K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: un modelo de vídeo de Vincennes que admite la entrada multilingüe y la generación de vídeos largos

Introducción completa Step-Video-T2V es un modelo avanzado de conversión de texto a vídeo de StepFun AI (StepFun Star). El modelo tiene 3.000 millones de parámetros y es capaz de generar vídeos de hasta 204 fps. Con un Auto-Encoder Variable (VAE) profundamente comprimido, el modelo...
hace 8 meses
025.5K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Navegador Dia: ofrece una experiencia de navegación inteligente con herramientas de inteligencia artificial integradas para automatizar tareas en el navegador (aún no está disponible).

Descripción general Dia Browser es un nuevo navegador inteligente desarrollado por The Browser Company que tiene como objetivo proporcionar a los usuarios una experiencia de navegación más eficiente mediante la integración de herramientas avanzadas de IA. Se espera que el navegador se lance oficialmente a principios de 2025, con características clave...
hace 10 meses
025.5K
Newsful:基于AI的金融新闻摘要网站

Newsful: un sitio de resumen de noticias financieras basado en IA

Introducción general Newsful es una plataforma en línea que utiliza tecnología de inteligencia artificial para ofrecer servicios de noticias financieras, centrándose en la agregación en tiempo real de noticias corporativas y novedades del mercado de todo el mundo. El sitio utiliza tecnologías de procesamiento del lenguaje natural (PLN) y aprendizaje automático para extraer información de múltiples fuentes mediáticas para su uso...
hace 7 meses
025.5K
Eightify:用AI快速总结YouTube视频的高效学习助手

Eightify: un asistente de aprendizaje eficaz para resumir rápidamente vídeos de YouTube con IA

Eightify Introducción general Eightify es una herramienta que utiliza la tecnología de inteligencia artificial de YouTube para ofrecerte puntos clave y resúmenes de tus vídeos en cuestión de segundos. Tanto si estás viendo formación empresarial, podcasts, entrevistas, noticias o conferencias, Eightify te ayuda...
hace 6 meses
025.5K
Outlier:参与AI模型训练的任务发布平台

Outlier: una plataforma de publicación de tareas para participar en el entrenamiento de modelos de IA

Introducción general Outlier es una plataforma en línea que conecta a expertos de todo el mundo para ayudar a los usuarios a participar en la formación y optimización de modelos de IA. Los usuarios pueden aprovechar su experiencia y contribuir al desarrollo de la IA completando tareas mientras obtienen unos ingresos flexibles. La plataforma permite realizar tareas en diversos ámbitos...
hace 6 meses
025.5K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: motor de física generativa de código abierto para la simulación de mundos dinámicos en 4D basados en la física real.

Introducción general Genesis es un mundo de física generativa diseñado para la robótica de propósito general y el aprendizaje de IA personificada. Proporciona una plataforma de simulación unificada que admite la simulación de una amplia gama de materiales y fenómenos físicos.Genesis tiene como objetivo desbloquear la IA generativa y la simulación física mediante la combinación...
hace 10 meses
025.5K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: un servicio todo en uno que utiliza modelos visuales para la ingestión de documentos y la agrupación inteligente basada en la jerarquía de párrafos de texto.

Introducción general Chunkr es una API autoalojada dedicada a convertir archivos PDF, PPTX, DOCX y Excel en datos aptos para su uso en RAG (Retrieval Augmented Generation) y LLM (Large Language Modelling). El proyecto fue desarrollado por Lumina...
hace 10 meses
025.5K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: un modelo unificado de generación de imágenes con entradas multimodales para generar imágenes coherentes con los caracteres

Introducción general OmniGen es un modelo "universal" de generación de imágenes desarrollado por VectorSpaceLab que permite a los usuarios crear efectos visuales diversos y contextualmente ricos con simples indicaciones de texto o entradas multimodales. Es especialmente adecuado para aplicaciones que necesitan reconocer...
hace 11 meses
025.5K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni: un modelo de medición final para entrada multimodal e interacción verbal en tiempo real

Introducción general Qwen2.5-Omni es un modelo de IA multimodal de código abierto desarrollado por el equipo Qwen de Alibaba Cloud. Puede procesar múltiples entradas, como texto, imágenes, audio y vídeo, y generar respuestas de texto o habla natural en tiempo real. El modelo se lanzó en 2025 el 3 ...
hace 7 meses
025.5K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: un marco de diálogo vocal en tiempo real compatible con múltiples idiomas y acentos para modelos de base de diálogo vocal

Introducción general Moshi Chat es un asistente de voz de IA en tiempo real de Kyutai, un laboratorio francés de IA sin ánimo de lucro. No solo escucha en tiempo real, sino que también participa en conversaciones naturales y admite interacciones multimodales, incluida la capacidad de ver, oír y hablar.Moshi Ch...
hace 1 año
025.5K
卡卡字幕助手(VideoCaptioner):基于LLM的智能字幕助手,一键生成高质量字幕

VideoCaptioner: asistente de subtitulación inteligente basado en LLM, que genera subtítulos de alta calidad con un solo clic.

Introducción general Kaka Caption Assistant (VideoCaptioner) es una herramienta inteligente de procesamiento de subtítulos de vídeo basada en el Large Language Model (LLM). Puede generar subtítulos de alta calidad en un solo clic sin necesidad de una GPU de alto rendimiento, y soporta todo el proceso de generación de subtítulos, rotura de frases, optimización y traducción. Soporta todo el proceso de generación de subtítulos, rotura de frases, optimización y traducción...
hace 11 meses
025.4K
反谱 - AI音乐转谱平台,支持音频文件转五线谱和简谱

Anti-score - Plataforma de transcripción de música AI, soporta archivos de audio a partituras pentatónicas y de pentagrama.

AntiSpectrum es una innovadora plataforma en línea de conversión de música AI, basada en tecnología AI avanzada, para convertir archivos de audio (como MP3, FLAC, etc.) en partituras pentatónicas y sencillas. AntiSpectrum tiene una función de separación vocal, que separa las voces del acompañamiento en la música, lo que facilita la producción y mezcla musical. AntiSpectrum admite la conversión de archivos MIDI...
hace 4 meses
025.4K
Chikka:AI语音访谈快速获取用户深度洞察

Chikka: entrevistas de voz con inteligencia artificial para obtener rápidamente información detallada sobre los usuarios

Introducción general Chikka es una plataforma en línea para entrevistas a usuarios y recopilación de información mediante tecnología de inteligencia artificial. Ayuda a los usuarios a diseñar rápidamente esquemas de entrevistas, ejecutar entrevistas personalizadas a gran escala y analizar automáticamente los resultados para descubrir temas ocultos y recomendaciones a través de Ava, un asistente de voz inteligente. No...
hace 7 meses
025.4K
EnConvo:智能AI启动器,专为macOS设计的全能AI助手

EnConvo: Intelligent AI Launcher, un completo asistente de IA para macOS

Descripción general EnConvo es un lanzador inteligente AI asistente para macOS diseñado para impulsar la productividad del usuario mediante la automatización de las tareas diarias. La plataforma integra más de 150 herramientas incorporadas y soporte MCP para aprender y adaptarse al flujo de trabajo del usuario.EnConv...
hace 8 meses
025.4K
PDF.ai:解读法律协议、财务报告、书籍、科学论文等复杂的PDF文档

PDF.ai: ¡Interpreta documentos PDF complejos como acuerdos legales, informes financieros, libros, artículos científicos y mucho más!

Introducción general PDF.ai es una plataforma que utiliza tecnología de inteligencia artificial para interactuar con documentos PDF. Los usuarios pueden cargar archivos PDF y dialogar con los documentos a través de la tecnología de IA para hacer preguntas, obtener resúmenes, encontrar información, etc. La plataforma es adecuada para procesar acuerdos legales, informes financieros, libros,...
hace 10 meses
025.4K
Vega AI:专业的AI绘画工具,拥有特色图像姿态控制插件和风格训练

Vega AI: herramienta profesional para pintar con inteligencia artificial que incluye un complemento de control de gestos de imagen y formación de estilos

Introducción general Vega AI es una plataforma profesional de creación de IA que proporciona principalmente servicios de pintura de IA y procesamiento de imágenes. Los usuarios pueden generar imágenes a partir de descripciones de texto (texto a imagen), convertir imágenes a diferentes estilos (imagen a imagen), mejorar la calidad de la imagen, etc. Vega AI también admite el uso de...
hace 1 año
025.4K
AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

Descripción General AnkiAIUtils es un conjunto de herramientas mejoradas con IA diseñadas para el sistema de aprendizaje de tarjetas flash Anki. Desarrollado por un estudiante de medicina, la herramienta está diseñada para mejorar automáticamente las tarjetas que los usuarios están luchando con durante el proceso de aprendizaje a través de la tecnología de IA. Proporciona a los usuarios...
hace 10 meses
025.4K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: aplicación portátil de diario vocal con inteligencia artificial y conversión de voz a texto.

Introducción general ALog es una aplicación de diario de voz basada en IA diseñada para ayudar a los usuarios a registrar su vida diaria por voz. Está desarrollada por duxins y de código abierto en GitHub. Los usuarios pueden grabar entradas de diario a través de la entrada de voz, y la aplicación convertirá automáticamente la voz en texto ...
hace 9 meses
025.4K
DearBook:一键生成多人朗读的儿童插画故事绘本

DearBook: generación con un solo clic de libros ilustrados de cuentos infantiles para múltiples lectores

Introducción general DearBook es un sitio web que utiliza tecnología de inteligencia artificial para ayudar a los usuarios a crear mágicos cuentos infantiles ilustrados. Los usuarios pueden generar contenidos de cuentos e ilustraciones únicos y creativos mediante sencillas operaciones. El objetivo del sitio es facilitar a todo el mundo la creación de...
hace 10 meses
025.4K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-Foley - Modelo de generación de sonido de vídeo de código abierto de Tencent

HunyuanVideo-Foley es un modelo de generación de sonido de vídeo de código abierto del equipo Tencent Mixed Yuan que permite añadir efectos de sonido adaptados con precisión a los vídeos silenciosos. El modelo se basa en un conjunto de datos a gran escala de formación , con una arquitectura de convertidor de difusión multimodal , combinado con la representación de la función de pérdida de alineación y técnicas de optimización de audio VAE....
hace 2 meses
025.4K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: analiza cada tipo de documento en datos disponibles en LLM, conservando toda la información del documento, como tablas e imágenes, en su totalidad.

Introducción general MegaParse es una potente y versátil herramienta de análisis sintáctico de documentos diseñada para optimizar el procesamiento de datos para el Large Language Model (LLM). Tanto si trabaja con texto, PDF, presentaciones de PowerPoint o documentos de Word, MegaParse...
hace 10 meses
025.4K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: plataforma inteligente de carrozado para la automatización de flujos de trabajo y la ejecución autónoma de tareas

Descripción general AutoGPT es una potente plataforma diseñada para ayudar a los usuarios a crear, desplegar y gestionar agentes de IA en ejecución continua y automatizar flujos de trabajo complejos. Desarrollada por Significant Gravitas, la plataforma ofrece una amplia gama de herramientas y funciones que permiten a los usuarios centrarse...
hace 10 meses
025.4K
Reor:AI个人知识管理工具,自动链接、语义搜索和AI闪卡

Reor: una herramienta de gestión del conocimiento personal con enlaces automáticos, búsqueda semántica y fichas de inteligencia artificial.

Introducción general Reor es una herramienta de gestión del conocimiento diseñada para particulares que utiliza tecnología de IA para ayudar a los usuarios a organizar y gestionar sus notas. Su principal característica es que todos los datos y modelos se ejecutan localmente sin conexión a Internet, lo que garantiza la privacidad y la seguridad. Los usuarios pueden utilizarla para escribir notas, buscar contenidos y pasar...
hace 7 meses
025.4K
Copy.AI:智能营销文案生成工具,适合营销自动化和电商文案写作

Copy.AI: herramienta inteligente de generación de textos de marketing para la automatización del marketing y la redacción de textos de comercio electrónico

Copy.AI Introducción general Copy.ai es una plataforma de inteligencia artificial diseñada para equipos de marketing y ventas. Tanto si necesita escribir entradas de blog, publicaciones en redes sociales, correos electrónicos, descripciones de productos, textos publicitarios o cualquier otro tipo de contenido, Copy.ai puede hacerlo por usted...
hace 1 año
025.4K
Privatemode:提供端到端加密的AI聊天应用,保护企业数据隐私

Privatemode: una aplicación de chat con inteligencia artificial que ofrece cifrado de extremo a extremo para proteger la privacidad de los datos empresariales

Introducción general Privatemode AI es una plataforma de servicios de IA generativa centrada en la privacidad y la seguridad de los datos, diseñada para permitir a los usuarios procesar datos confidenciales sin temor a fugas de privacidad. Garantiza que los datos estén siempre cifrados durante su transmisión, almacenamiento y procesamiento mediante tecnología informática confidencial, incluso...
hace 8 meses
025.4K
Waifu2x Extension GUI:深度学习技术放大、修复图像与视频插帧(Windows x64)

Waifu2x Extension GUI: Técnicas de aprendizaje profundo para ampliar y reparar la interpolación de imágenes y vídeos (Windows x64)

Descripción general Waifu2x-Extension-GUI es una potente herramienta de procesamiento de imágenes y vídeos que utiliza técnicas de redes neuronales convolucionales profundas para el zoom de superresolución y la interpolación de fotogramas de vídeo de imágenes, GIF y vídeos. La herramienta soporta múltiples algoritmos y motores, incluyendo Wai...
hace 10 meses
025.4K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: Marco de Generación Mejorada de Recuperación Simplificada, Índice de Grafos de Entidades Recupera Bloques de Texto Relevantes

Una introducción exhaustiva MiniRAG es un marco de trabajo de Generación Aumentada de Recuperación (RAG) extremadamente sencillo que pretende permitir un buen rendimiento de la RAG incluso para modelos pequeños mediante la indexación de grafos heterogéneos y la recuperación mejorada por topología ligera. Ha sido desarrollado por el Laboratorio de Ciencia de Datos de la Universidad de Hong Kong (HKUDS) para ...
hace 9 meses
025.4K
Craft:内置AI助手进行文档总结和语法检查的写作工具

Craft: una herramienta de escritura con asistente de inteligencia artificial integrado para resumir documentos y revisar la gramática.

Introducción general Craft es una potente herramienta de gestión de notas y documentos diseñada para ayudar a los usuarios a registrar, organizar y compartir información de forma eficaz. Tanto para uso personal como para colaboración en equipo, Craft ofrece una experiencia fluida y una gran funcionalidad. Los usuarios pueden sincronizar sin problemas los bolígrafos entre dispositivos...
hace 1 año
025.4K
Shandu:多轮收集分析信息的AI研究自动化工具

Shandu: una herramienta de automatización de la investigación con IA para recopilar y analizar información en múltiples rondas

Introducción general Shandu es un sistema de investigación basado en inteligencia artificial de código abierto alojado en GitHub y creado por el desarrollador jolovicdev. Utiliza las tecnologías LangChain y LangGraph, y su objetivo es proporcionar...
hace 7 meses
025.4K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: extensión de ayuda de IA que mejora la experiencia de desarrollo de VSCode, la anotación con un solo clic, la conversión y la generación de interfaz de usuario de código.

Introducción general AIDE (AI-assisted Development Extension) es una potente extensión de desarrollo asistido por IA para VSCode, centrada en proporcionar una asistencia de programación de IA única y útil. Es diferente de GitHu...
hace 10 meses
025.4K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente asistente inteligente de chat en grupo de WeChat para Windows

Introducción integral WeChatAI es un chat de grupo WeChat basado en Python y asistente inteligente personal, que soporta una variedad de grandes modelos de lenguaje (como DeepSeek, Gemini, Tongyi Thousand Questions), que puede lograr el diálogo inteligente, auto-respuesta y otras funciones. El proyecto utiliza ...
hace 8 meses
025.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: una plataforma de código abierto para automatizar el cumplimiento de SOC 2, ISO 27001 y GDPR

Introducción general Comp AI es una plataforma de código abierto desarrollada por Comp AI, Inc. con sede en San Francisco, Estados Unidos. Ayuda a las organizaciones a completar rápidamente los requisitos de cumplimiento como SOC 2, ISO 27001 y GDPR a través de herramientas automatizadas, con el objetivo de varios...
hace 6 meses
025.4K
LightLLM:高效的轻量级大语言模型推理和服务框架

LightLLM: un marco ligero y eficiente para razonar y servir grandes modelos lingüísticos

Introducción exhaustiva LightLLM es un marco de razonamiento y servicio basado en Python de Large Language Model (LLM) conocido por su diseño ligero, facilidad de extensión y rendimiento eficiente. El marco aprovecha una variedad de implementaciones de código abierto bien conocidas, incluyendo FasterTransfor...
hace 8 meses
025.4K
aiCoder:使用AST(抽象语法树)自动编写JavaScript代码

aiCoder: Automatice la escritura de código JavaScript mediante AST (Abstract Syntax Tree)

Introducción general aiCoder es una herramienta que utiliza técnicas de inteligencia artificial para simplificar el desarrollo de bibliotecas JavaScript. Ayuda a los desarrolladores a ahorrar tiempo y mejorar la calidad del código mediante sugerencias de código inteligentes y la fusión automática de código. aiCoder es único en su uso de árboles de sintaxis abstractos....
hace 9 meses
025.3K
小视频宝(ClipTurbo):一键生成高质量营销短视频

ClipTurbo: ¡Genere vídeos de marketing de alta calidad con un solo clic!

Introducción general ClipTurbo es una herramienta de generación de vídeos cortos basada en IA diseñada para ayudar a los usuarios a crear fácilmente vídeos de marketing de alta calidad. Al utilizar la tecnología de IA, ClipTurbo puede procesar automáticamente la copia, la traducción, la coincidencia de iconos y la síntesis de voz TTS utilizando m...
hace 9 meses
025.3K
Mango Animate:AI生成数字人讲解的白板动画演示视频

Mango Animate: vídeo de demostración animado de pizarra blanca generado por IA de un explicador humano digital.

Introducción general Mango Animate es una innovadora plataforma de generación de vídeo AI construida para crear vídeos de avatar de texto a voz. La plataforma ofrece una amplia gama de productos de software de animación, incluyendo Mango AI Video Generator, la potente herramienta de creación de vídeo animado Mango AM...
hace 1 año
025.3K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: interfaz de chat para visualizar conversaciones basadas en árboles

Introducción general TreeGPT es una aplicación de chat de código abierto basada en Next.js, centrada en la visualización de conversaciones con grandes modelos lingüísticos (LLMs, por sus siglas en inglés, p. ej., GPTs) a través de estructuras de grafos en árbol (grafos acíclicos dirigidos, DAGs), sustituyendo a los métodos de chat lineales tradicionales para mejorar la velocidad y...
hace 8 meses
025.3K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: herramienta de escaneo de vulnerabilidades LLM de código abierto que proporciona pruebas fuzz y técnicas de ataque exhaustivas.

Introducción general Agentic Security es una herramienta de escaneo de vulnerabilidades LLM (Large Language Model) de código abierto diseñada para proporcionar a los desarrolladores y profesionales de la seguridad pruebas fuzz completas y técnicas de ataque. La herramienta admite conjuntos de reglas personalizadas o ataques basados en agentes y es capaz de integrar LLM AP...
hace 8 meses
025.3K
法行宝:AI法律顾问,人工智能法律咨询,百度AI法律平台

Fa Xing Bao: Asesor Jurídico de IA, Consultoría Jurídica de Inteligencia Artificial, Plataforma Jurídica de IA de Baidu

Introducción general LawXinbao es una plataforma de servicios jurídicos inteligentes lanzada por Baidu, que integra tecnología avanzada de inteligencia artificial con una base de conocimientos jurídicos profesionales. La plataforma se dedica a proporcionar a los usuarios servicios legales inteligentes convenientes y profesionales, incluyendo preguntas y respuestas legales inteligentes, análisis de casos, revisión de contratos y otras funciones. A través del aprendizaje profundo...
hace 9 meses
025.3K
BotGem(原名AMA/问天):优秀的手机端AI对话集成工具

BotGem (antes conocido como AMA/Ask the Sky): excelente herramienta de integración de diálogos de IA para teléfonos móviles.

BotGem Introducción general BotGem (antes conocido como AMA/Ask the Sky) es una aplicación de chat inteligente que utiliza tecnología avanzada de procesamiento del lenguaje natural para comprender y responder a los mensajes de texto de los usuarios. Ya sea para hacer preguntas, compartir ideas, pedir consejo o mantener una charla informal, BotGe...
hace 12 meses
025.3K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: ¡la forma más rápida de ejecutar y ajustar LLM localmente!

Introducción general LlamaEdge es un proyecto de código abierto diseñado para simplificar el proceso de ejecución y puesta a punto de grandes modelos lingüísticos (LLM) en dispositivos locales o edge. El proyecto es compatible con la familia de modelos Llama2 y proporciona servicios API compatibles con OpenAI que permiten a los usuarios crear y ejecutar fácilmente...
hace 9 meses
025.3K
WeShop唯象:AI商拍平台、服装模特拍摄、商品拍摄

WeShop: plataforma de fotografía comercial con IA, fotografía de modelos de ropa, fotografía de productos

Introducción exhaustiva WeShop es la primera plataforma de fotografía comercial con IA de China, centrada en la generación inteligente de imágenes de productos de comercio electrónico. Proporciona una solución para crear imágenes profesionales de productos sin necesidad de modelos, fotógrafos ni ubicaciones físicas, lo que hace que las exposiciones de productos sean más atractivas. Los clientes pueden lograr una alta eficiencia en la producción de imágenes de productos a bajo coste....
hace 1 año
025.3K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: herramienta interactiva de edición de imágenes, control de la posición de las imágenes mediante apuntar y hacer clic y arrastrar y soltar.

Introducción general DragGAN es una herramienta interactiva de edición de imágenes basada en Redes Generativas Adversariales (GAN). Fue lanzada por Xingang Pan et al. en SIGGRAPH 2023 y tiene como objetivo permitir a los usuarios manipular intuitivamente a través de simples operaciones de apuntar y hacer clic y arrastrar y soltar....
hace 10 meses
025.3K
Scam AI:识别和防范AI诈骗的智能工具,检测合成的图像、音频、视频

Scam AI: una herramienta inteligente para identificar y prevenir el fraude de IA, detectando imágenes, audio y vídeo sintetizados.

Introducción general Scam AI es un sitio web centrado en la identificación y prevención de estafas relacionadas con la IA. Con el rápido avance de la tecnología de IA, las estafas son cada vez más sofisticadas y difíciles de identificar.Scam AI proporciona una serie de herramientas y recursos para ayudar a los usuarios a identificar y prevenir diversas formas de estafa de IA....
hace 9 meses
025.3K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Introducción general Devika es un ingeniero de software de IA avanzada que entiende instrucciones humanas de alto nivel, las descompone en pasos, estudia la información relevante y escribe código para lograr un objetivo determinado. Desarrolla software de forma inteligente utilizando modelos lingüísticos a gran escala, algoritmos de planificación y razonamiento y capacidades de navegación web.D...
hace 7 meses
025.3K
ZenUML:基于简单文本代码创建序列图和流程图

ZenUML: Creación de diagramas de secuencia y diagramas de flujo basados en código de texto simple

Introducción general ZenUML es una solución de diagramas como código multiplataforma centrada en la creación de diagramas de secuencia y diagramas de flujo. Evita retrasos en las interacciones del lado del servidor mediante la representación de diagramas en tiempo real en el navegador, de modo que el proceso de pensamiento del usuario no se ve interrumpido por ineficientes operaciones de arrastrar y soltar o lentas animaciones de carga.Z...
hace 10 meses
025.3K
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear: software de transcripción y traducción de voz en tiempo real que funciona nativamente sin conexión a Internet

Descripción general Si utilizas un MacBook, prueba AI Hear: puedes grabar audio, convertir voz local en tiempo real a texto y traducir, y eventualmente exportar subtítulos. Puedes utilizarlo como ayuda para escuchar reuniones internacionales y audiolibros en inglés. AI Hear es un software de ejecución local que proporciona...
hace 12 meses
025.3K
BuildIn.AI:适合 Notion 用户的知识管理工具

BuildIn.AI: una herramienta de gestión del conocimiento para usuarios de Notion

Introducción general BuildIn.AI es una plataforma basada en la nube centrada en la colaboración en tiempo real y la gestión del conocimiento, diseñada para ayudar a los usuarios a crear, gestionar y compartir información de forma eficiente. Es adecuada para individuos, equipos o profesionales, proporcionando un lugar de trabajo digital que combina el almacenamiento de documentos, la edición en tiempo real y la organización de la información....
hace 8 meses
025.2K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件

WhoDB: software ligero de gestión de visualización de bases de datos con interacción en lenguaje natural

Introducción general WhoDB es una herramienta de gestión de bases de datos ligera (~20MB), potente y fácil de usar, diseñada para simplificar las tareas de administración de bases de datos. Combina la simplicidad de Adminer con la experiencia del usuario y mejoras en el rendimiento.WhoDB utiliza Go...
hace 11 meses
025.2K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: un organismo inteligente para el análisis de radiografías de tórax mediante macromodelos multimodales

Introducción completa MedRAX es una inteligencia artificial de última generación diseñada para el análisis de radiografías de tórax (CXR). Integra herramientas de análisis CXR de última generación y grandes modelos de lenguaje multimodal para procesar dinámicamente consultas médicas complejas sin formación adicional.MedRAX, a través de su diseño modular...
hace 7 meses
025.2K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: añade sonido sincronizado a un vídeo mudo

Introducción general FoleyCrafter es un proyecto de código abierto desarrollado por OpenMMLab para generar efectos de sonido vívidos y sincronizados para vídeos mudos. El proyecto utiliza técnicas avanzadas de inteligencia artificial para generar efectos de sonido semánticamente relevantes y sincronizados en el tiempo mediante el análisis del contenido del vídeo....
hace 10 meses
025.2K
5ire:支持本地向量知识库的跨平台大模型桌面客户端

5ire: cliente de sobremesa multiplataforma para grandes modelos con soporte para bases de conocimiento vectoriales locales

Introducción general 5ire es un cliente de escritorio multiplataforma de código abierto diseñado para proporcionar a los usuarios una cómoda gestión de bases de conocimiento vectoriales locales y capacidades de interacción con grandes modelos. El software soporta el análisis sintáctico y el almacenamiento vectorizado de múltiples formatos de documentos con potentes capacidades de generación mejorada de recuperación (RAG). Además, 5i...
hace 12 meses
025.2K