Últimos recursos sobre IA

共 2759 篇文章
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Modelo de razonamiento visual multimodal de código abierto de Smart Spectrum

GLM-4.5V es el modelo de inferencia visual de código abierto líder mundial presentado por Smart Spectrum, con 106.000 millones de parámetros totales y 12.000 millones de parámetros activados. El modelo se entrena a partir del modelo base de texto de nueva generación GLM-4.5-Air, con potentes capacidades de comprensión y razonamiento visual, capaz de manejar imágenes, vídeo...
hace 2 meses
026K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: construcción de módulos de memoria de IA humanizada para guardar y actualizar información sobre interacciones con humanos.

Introducción general Memora es un agente diseñado para replicar los recuerdos humanos en cada IA personalizada. Ayuda a las IAs a recordar detalles de interacciones pasadas, emociones y experiencias compartidas al igual que lo hacen los humanos a través de características como memorias con marca de tiempo, marcadores de emoción y memorias multimodales.Memora soporta multi-tenancy y es capaz de manejar...
hace 9 meses
026K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: clonación de voz rápida y formación de modelos, conversión de texto a voz basada en xtts v2

Introducción completa MockingBird es un proyecto de código abierto que pretende conseguir una rápida clonación de voz y conversión de texto a voz mediante tecnología de IA. Los usuarios sólo tienen que proporcionar 5 segundos de muestras de voz, puede generar cualquier contenido de voz. El proyecto admite una gran variedad de conjuntos de datos chinos ...
hace 10 meses
026K
OpenEvidence - AI医学知识助手,解答临床问题、分析症状、推荐治疗方案

OpenEvidence - Asistente de conocimientos médicos con inteligencia artificial que responde a preguntas clínicas, analiza síntomas y recomienda tratamientos.

OpenEvidence es una plataforma de asistente de conocimientos médicos basada en tecnología de IA para proporcionar un apoyo clínico preciso a médicos y personal sanitario. La plataforma se basa en pequeños modelos especializados y en una arquitectura de integración multimodelo para responder rápidamente a preguntas clínicas, analizar síntomas, recomendar opciones de tratamiento, proporcionar los últimos conocimientos médicos más...
hace 4 meses
026K
Mebot:支持长期记忆多类文档的全终端个人AI助手(推荐)

Mebot: un asistente personal de inteligencia artificial que admite memoria a largo plazo para varios tipos de documentos (recomendado)

Descripción general Me.bot es un asistente personal de inteligencia artificial creado para la vida cotidiana. Actúa como tu segundo cerebro, ayudándote a organizar tus recuerdos, inspirar tu creatividad y amplificar tus ideas.Me.bot está impulsado por un potente modelo personal desarrollado internamente, con funciones avanzadas de cifrado y privacidad para garantizar...
hace 11 meses
026K
悠船:Midjourney官方中文版文生图工具,免费生成25张图像

Yo Boat: Midjourney versión oficial china de la herramienta de generación de texto, gratis para generar 25 imágenes

Introducción general Midjourney China Lab (YoBoat), una marca de Boat Creative (Shanghái) Network Technology Co. Ltd, es un laboratorio innovador centrado en las artes visuales generativas. Se ha comprometido a promover el desarrollo de vanguardia de la creación visual a través del aprendizaje profundo y la tecnología de inteligencia artificial. Su producto principal Yo Boat picks...
hace 10 meses
026K
Aneta:HR提升团队协作和员工敬业度的AI解决方案

Aneta: la solución de inteligencia artificial de RRHH para mejorar el trabajo en equipo y el compromiso de los empleados

Introducción general Aneta es una plataforma de IA diseñada para mejorar el compromiso de los empleados y el trabajo en equipo. Aprovechando la avanzada tecnología de IA, Aneta proporciona a los equipos de RRHH y a los directivos encuestas personalizadas a los empleados, feedback en tiempo real e información basada en datos para mejorar la satisfacción de los empleados y la producción....
hace 9 meses
026K
Mistral OCR:94.89%总体精度,1000 页/30秒,只需1美元

Mistral OCR: 94,89% Precisión global, 1.000 páginas/30 segundos, sólo 1 $.

En la larga historia de la civilización humana, cada salto en la forma de adquirir y analizar la información ha contribuido profundamente al progreso social. Desde los antiguos jeroglíficos hasta el papiro portátil, pasando por la posterior aparición de la imprenta y la actual ola digital, cada innovación tecnológica ha ampliado enormemente el paradigma de la difusión del conocimiento humano...
hace 7 meses
025.9K
Stablecog:多语言开源AI图像生成平台,独家Kandinsky基础模型

Stablecog: plataforma multilingüe de código abierto para la generación de imágenes de IA con el exclusivo modelo base Kandinsky

Stablecog Descripción general Stablecog es un generador de imágenes AI gratuito, de código abierto y multilingüe que utiliza la tecnología Stable Diffusion y Kandinsky para crear impresionantes obras de arte en segundos, con soporte añadido para F...
hace 1 año
025.9K
FinChat:智能股票研究平台,美股公开财报分析

FinChat: Plataforma inteligente de investigación bursátil, análisis de beneficios públicos en EE.UU.

Introducción general FinChat es una plataforma de investigación bursátil impulsada por IA diseñada para proporcionar a los inversores datos financieros y herramientas analíticas de alta calidad. Al integrar datos de más de 750 empresas e información de inversión de más de 100 superinversores, FinChat ayuda a los usuarios a acceder rápidamente a los mercados....
hace 9 meses
025.9K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: compatibilidad con herramientas de generación de imágenes personalizadas mono y multisujeto (adecuadas para gráficos de comercio electrónico).

UNO es un marco de generación de imágenes de código abierto desarrollado por el equipo de creación inteligente ByteDance. Se basa en el modelo FLUX.1 y se centra en la generación de imágenes personalizadas de un único sujeto y de varios sujetos mediante un enfoque de generalización de "menos a más".UNO utiliza el transformador de difusión...
hace 6 meses
025.9K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: una herramienta de pruebas automatizadas con IA que utiliza el lenguaje natural para realizar pruebas de principio a fin

Introducción general Shortest es un marco de pruebas de extremo a extremo en lenguaje natural basado en IA desarrollado por el equipo Anti-Work. Se basa en Playwright y admite la integración con GitHub y la autenticación de dos factores (2FA)....
hace 9 meses
025.9K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...
hace 6 meses
025.9K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG: una solución integral del sistema RAG para simplificar la construcción de datos y el ajuste de modelos

Introducción exhaustiva UltraRAG es una solución de sistema RAG (Retrieval Augmented Generation) propuesta conjuntamente por el grupo THUNLP de la Universidad de Tsinghua, el grupo NEUIR de la Universidad Northeastern, Modelbest.Inc y el equipo 9#AISoft. El marco se basa en el despliegue ágil y la construcción modular...
hace 9 meses
025.9K
Cloud Studio:云端 IDE,编写和运行各类依赖GPU的AI应用,每月免费50000小时GPU

Cloud Studio: IDE en la nube para escribir y ejecutar todo tipo de aplicaciones de IA dependientes de la GPU, 50.000 horas de GPU gratuitas al mes.

Introducción completa Cloud Studio es un entorno de desarrollo integrado (IDE) basado en navegador lanzado por Tencent Cloud, con el objetivo de proporcionar a los desarrolladores una estación de trabajo en la nube estable y eficiente. Los usuarios no necesitan descargar e instalar ningún software, basta con abrir el navegador para programar.Cloud ...
hace 9 meses
025.9K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: herramientas de código abierto para la transcripción de vídeo, la traducción de subtítulos de vídeo y el doblaje localizado.

Descripción general VideoLingo es una herramienta integral de traducción y localización de vídeos diseñada para generar subtítulos de alta calidad propios de Netflix, eliminando la traducción automática sin procesar y los subtítulos multilínea, y añadiendo voces en off de alta calidad para poder compartir conocimientos globales más allá de las barreras lingüísticas. Por...
hace 12 meses
025.9K
Sourcegraph(Cody):代码智能搜索与AI编码平台

Sourcegraph (Cody): una plataforma para la búsqueda inteligente de código y la codificación con IA

Introducción general Sourcegraph es una plataforma de inteligencia de código que ayuda a los desarrolladores a buscar, comprender y escribir código en bases de código complejas. Con la búsqueda de código y la IA consciente del contexto, los desarrolladores pueden realizar la revisión de código, la solución de problemas y el intercambio de conocimientos de manera más eficiente, mejorando significativamente el desarrollo....
hace 12 meses
025.9K
shadcn/ui:组件库构建平台

shadcn/ui: plataforma de creación de bibliotecas de componentes

Introducción general shadcn/ui es una plataforma de construcción de bibliotecas de componentes de código abierto que proporciona componentes de interfaz de usuario atractivos y personalizables que los usuarios pueden copiar y pegar en sus aplicaciones. La plataforma es compatible con diversos marcos de trabajo front-end y proporciona directrices detalladas de instalación y uso para ayudar a los desarrolladores a empezar rápidamente...
hace 1 año
025.9K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...
hace 6 meses
025.9K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown editor: herramientas de diseño gráfico de WeChat sencillas y eficaces, una llave para pegar el artículo al número público de WeChat.

Introducción completa WeChat Markdown Editor (WeChat Markdown Editor) es una herramienta de diseño gráfico WeChat muy conciso diseñado para ayudar a los usuarios a crear fácilmente hermosas mensajes WeChat. El editor es compatible con todos los básicos Markdown ...
hace 9 meses
025.9K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: un macromodelo multimodal de audio para el diálogo de voz en tiempo real de extremo a extremo, una implementación de código abierto de la interacción de voz GPT-4o

Introducción general Ultravox es un innovador modelo multimodal de lenguaje amplio (LLM) diseñado para el procesamiento del habla en tiempo real. A diferencia de los sistemas tradicionales de reconocimiento del habla, Ultravox elimina la necesidad de una etapa separada de reconocimiento del habla de audio (ASR), y es capaz de convertir directamente el audio en un espacio de alta dimensión en...
hace 10 meses
025.9K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: basado en el modelo OCR multimodal de extremo a extremo QWen2 0.5B

Introducción exhaustiva GOT-OCR2.0 es un modelo de reconocimiento óptico de caracteres (OCR) de código abierto co-propuesto por StepStar, cuyo objetivo es impulsar la tecnología OCR hacia OCR-2.0 mediante un modelo unificado de extremo a extremo. El modelo soporta una amplia gama de tareas de OCR, incluyendo el reconocimiento de texto normal, gr...
hace 1 año
025.9K
BabyLoveGrowth:利用AI分析全站内容自动生成SEO文章

BabyLoveGrowth: Utilización de la IA para analizar el contenido de todo el sitio y generar automáticamente artículos SEO

Introducción general BabyLoveGrowth es una plataforma de escritura AI centrada en la optimización de motores de búsqueda (SEO), diseñada para ayudar a los usuarios a generar rápidamente artículos de alta calidad que coincidan con su estilo de marca. Proporciona apoyo automatizado de creación de contenido para empresas y particulares mediante el análisis inteligente de las lagunas de SEO, ahorrando...
hace 8 meses
025.9K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI face swap: open source second duck camera, deploy front and back-end complete enterprise AI face swap applet (arithmetic service payment, can be two open)

Introducción Completa LunaAI face swap applet es una aplicación de intercambio de caras desarrollada en base a uniapp y Vue framework. La aplicación hace uso de PHP, MySQL, Nginx y Redis para lograr la función de la operación de cambio de cara del usuario a través del applet. Los usuarios pueden utilizar este pequeño...
hace 10 meses
025.9K
ClipZap AI换脸工具:快速实现照片和视频的AI换脸(免费)

ClipZap AI Face Swap Tool: intercambio rápido de caras por IA para fotos y vídeos (gratis)

Descripción General ClipZap AI Face Replacement Tool es una herramienta líder de reemplazo de rostros por IA diseñada para las necesidades de reemplazo de rostros en fotos y vídeos. Utiliza tecnología avanzada de IA para reconocer automáticamente a las personas en vídeos e imágenes y realizar un reemplazo de caras de alta calidad. Ya sea para crear divertidos emoji...
hace 9 meses
025.9K
即时AI:快速生成UI设计稿的创新AI工具

Instant AI: una innovadora herramienta de IA para generar rápidamente borradores de diseño de interfaz de usuario.

Introducción completa Instant AI es una herramienta de diseño generativo de vanguardia que puede generar rápidamente diseños que se ajusten a sus necesidades a través de simples descripciones en lenguaje natural. Tanto si se trata de un simple diseño de página como de una compleja interfaz de aplicación, Instant AI puede hacerlo en tan solo 60 segundos, mejorando enormemente la eficiencia del trabajo de los diseñadores....
hace 1 año
025.9K
匠邦AI:教师教学辅助AI助手,为老师提供备案教案/PPT课件/课题论文/出题组卷

Artisan AI: Asistente AI de ayuda a la docencia, que proporciona a los profesores planes de clase archivados / material didáctico PPT / documentos de asignaturas / preguntas y trabajos.

Introducción general Artisan AI es un asistente inteligente centrado en el campo de la educación, cuyo objetivo es mejorar la eficiencia del trabajo de los profesores y la calidad de la enseñanza mediante la tecnología de inteligencia artificial. El sitio ofrece diversas funciones, como el diseño de planes de clase, la orientación de informes de asignaturas, la comprobación y reducción de peso de tesis, la generación de cursos PPT, etc., para ayudar a los profesores en la enseñanza, la investigación...
hace 9 meses
025.9K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: una herramienta de evaluación visual para optimizar los sistemas de generación de mejoras de la recuperación

Introducción completa XRAG (eXamining the Core) es un marco de evaluación comparativa diseñado para evaluar los componentes subyacentes de los sistemas avanzados de generación de aumento de la recuperación (RAG). Mediante el perfilado y análisis de cada módulo central, XRAG proporciona información sobre cómo afectan las distintas configuraciones y componentes a los sistemas RAG....
hace 9 meses
025.9K
Image AI:集成多类AI图片编辑工具,免费视频换脸,简单上手

Image AI: herramientas integradas de edición de fotos AI de varias clases, intercambio de caras en vídeo gratuito, ¡fácil de empezar!

Introducción completa Image AI es una notable plataforma de imagen AI todo-en-uno que ofrece una amplia gama de herramientas avanzadas de imagen para ayudar a los usuarios a lograr fácilmente efectos visuales de alta calidad. Ya sea intercambio de caras, reconocimiento de imágenes, texto para generar imágenes o descontextualización de imágenes, Image AI puede satisfacer...
hace 1 año
025.8K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Herramienta paramétrica de generación de aumentos de recuperación para mejorar el rendimiento de los sistemas de preguntas y respuestas.

Introducción exhaustiva PRAG (Parametric Retrieval-Augmented Generation) es una innovadora herramienta de generación aumentada por recuperación que pretende mejorar la generación de conocimiento externo incrustándolo directamente en el espacio de parámetros de un Large Language Model (LLM)....
hace 8 meses
025.8K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: un marco de flujo de trabajo de código abierto de IA que integra muchas palabras clave para gestionar eficazmente una variedad de transacciones.

Introducción general Fabric es un marco de IA de código abierto desarrollado por Daniel Miessler para simplificar y automatizar las tareas informáticas cotidianas y facilitar el uso de la inteligencia artificial. Ayuda a los usuarios de forma eficiente a través de un diseño modular y de palabras clave predefinidas (Patrones)...
hace 12 meses
025.8K
VocalRemover:免费分离歌曲人声与伴奏的在线工具

VocalRemover: herramienta en línea gratuita para separar las voces de las pistas de acompañamiento en las canciones

Introducción general VocalRemover es una plataforma gratuita de procesamiento de audio en línea que ayuda principalmente a los usuarios a separar las voces y las pistas de acompañamiento en las canciones. Los usuarios sólo tienen que subir archivos de audio y el sitio web utiliza tecnología de inteligencia artificial para analizar y generar rápidamente pistas vocales y de acompañamiento separadas. Esta herramienta es adecuada para...
hace 6 meses
025.8K
Relingo:智能单词学习chrome翻译插件|掌握生词|双语字幕|网页翻译

Relingo: Plugin de traducción de cromo para el aprendizaje inteligente de palabras|Master Vocabulary|Bilingual Subtitles|Web Translation

Introducción general Relingo es una herramienta inteligente de aprendizaje de palabras basada en tecnología de IA, cuyo objetivo es ayudar a los usuarios a dominar fácilmente el vocabulario de idiomas extranjeros navegando por páginas web y viendo vídeos.Relingo soporta múltiples idiomas, incluyendo inglés, japonés, chino, etc. Los usuarios pueden navegar por sus intereses dentro de...
hace 12 meses
025.8K
Lipdub:翻译视频,打破语言障碍,多语言字幕并支持口型同步

Lipdub: traduce vídeos, rompe las barreras lingüísticas, subtitula en varios idiomas y admite sincronización labial.

Introducción general Lipdub es una innovadora aplicación de traducción de vídeo con IA diseñada para ayudar a los usuarios a traducir y sincronizar labialmente contenidos de vídeo a varios idiomas. Con Lipdub, los usuarios pueden grabar vídeos fácilmente y traducirlos a 27 idiomas diferentes en tiempo real. La aplicación ...
hace 10 meses
025.8K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: plataforma de producción de cursos humanos digitales de código abierto, clonación de vídeos de conferencias humanas digitales de generación PPT con un solo clic

Introducción exhaustiva Easegen es una plataforma de creación de cursos humanos digitales de código abierto que tiene como objetivo mejorar la eficiencia de la producción y gestión de contenidos de enseñanza a través de la tecnología de IA. La plataforma proporciona una solución integral desde la producción de cursos, la gestión de vídeo hasta el interrogatorio inteligente, que permite a los usuarios crear cursos digitales de vídeo explicados por humanos....
hace 1 año
025.8K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - Modelo de generación de voz de MiniMax

MiniMax Speech 2.5 es un modelo avanzado de generación del habla desarrollado por el equipo MiniMax. Supone un avance significativo en el campo de la síntesis del habla, especialmente en términos de expresividad multilingüe, precisión en la reproducción del timbre y cobertura lingüística. El modelo admite 40 idiomas...
hace 2 meses
025.8K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

Whisk: carga varias imágenes y mezcla temas, escenas y estilos para crear obras de arte únicas.

Introducción general Whisk es una innovadora herramienta de generación de imágenes AI de Google Labs diseñada para mezclar diferentes temas, escenas y estilos mediante la carga de varias imágenes. A diferencia de las herramientas tradicionales de generación de imágenes que se basan en indicaciones de texto, Whisk utiliza principalmente imágenes como entrada...
hace 4 meses
025.8K
Pictory:简化内容营销的视频创作平台|博客文章转视频

Pictory: Una plataforma de creación de vídeo que simplifica el marketing de contenidos | De post de blog a vídeo

Introducción general Pictory es una plataforma para crear y editar vídeos rápidamente utilizando tecnología de inteligencia artificial. Si usted es un anfitrión de YouTube, comercializador de contenidos, o usuario de negocios, Pictory le permite convertir guiones, entradas de blog, o vídeos de formato largo en cuestión de minutos en...
hace 11 meses
025.8K
Class Companion: K12教师设计的课后作业管理系统,为学生提供AI辅导和作业批改

Class Companion: un sistema de gestión de deberes extraescolares diseñado por profesores de K12 para proporcionar tutoría y corrección de deberes a los alumnos mediante IA.

Descripción general Class Companion es una plataforma de educación en línea diseñada para profesores y estudiantes que utiliza tecnología de inteligencia artificial para proporcionar retroalimentación instantánea y tutoría personalizada. La plataforma es compatible con una amplia gama de asignaturas y niveles, y ayuda a los profesores a ahorrar tiempo, mejorar la eficacia de la enseñanza y proporcionar a los estudiantes más práctica...
hace 10 meses
025.8K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: revolucionaria tecnología de generación de imágenes de altísima resolución con gran riqueza de detalles

Introducción general UltraPixel es una tecnología avanzada de generación de imágenes de ultra alta resolución diseñada para crear imágenes de altísima calidad y ricas en detalles. Fue desarrollada por el usuario de GitHub catcathh y presentada en NeurIPS 2024.U...
hace 1 año
025.8K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: una aplicación de traducción de voz en tiempo real para Android, ¡gratis y sin conexión!

Introducción general RTranslator es una aplicación de traducción en tiempo real, prácticamente gratuita y de código abierto diseñada para dispositivos Android. Los usuarios pueden mantener su teléfono en el bolsillo mediante la conexión de un auricular Bluetooth y mantener una conversación con otros como si estuvieran hablando su propio idioma.RTransla...
hace 9 meses
025.7K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: ¡Sube una foto de una habitación y rediseña su diseño con IA!

Introducción general RoomGPT es un proyecto de código abierto desarrollado por el usuario de GitHub Nutlope que permite a los usuarios subir fotos de habitaciones y generar versiones rediseñadas de las mismas utilizando tecnología de inteligencia artificial. El objetivo del proyecto es ofrecer a los usuarios acceso a un diseño de interiores profesional sin tener que pagar...
hace 11 meses
025.7K
Boxo:无侵入式为移动应用整合多种服务

Boxo: integración de múltiples servicios para aplicaciones móviles sin intrusión

Introducción general Boxo es una plataforma que ayuda a las aplicaciones móviles a transformarse rápidamente en superaplicaciones. Con una única integración SDK, los desarrolladores pueden integrar una amplia gama de servicios en sus aplicaciones, como comercio electrónico, reservas de viajes, pago de facturas, eSIM y seguros, etc. Boxo ofrece miniaplicaciones de marca blanca compatibles con pin...
hace 6 meses
025.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: una herramienta virtual de alta fidelidad para mejorar la autenticidad de los detalles de la ropa

Introducción exhaustiva FitDiT es un sistema de ajuste virtual de alta fidelidad basado en transformadores de difusión (Diffusion Transformers). Desarrollado por Tencent AI Lab, el proyecto pretende abordar las limitaciones de los sistemas tradicionales de ajuste virtual a la hora de mostrar los detalles de las prendas.FitD...
hace 9 meses
025.7K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: un modelo de audio de extremo a extremo para la interacción vocal en tiempo real

Introducción completa Baichuan-Audio es un proyecto de código abierto desarrollado por Baichuan Intelligence (baichuan-inc), alojado en GitHub, centrado en la tecnología de interacción de voz de extremo a extremo. El proyecto proporciona un marco completo de procesamiento de audio que permite ...
hace 8 meses
025.7K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: un backend de gestión local para Dify

Introducción completa Dify-Plus es una plataforma de desarrollo de aplicaciones de IA basada en el desarrollo secundario del proyecto de código abierto Dify. Añade un nuevo centro de gestión basado en Dify y optimiza la funcionalidad para escenarios empresariales. El proyecto fue inicialmente para uso interno de las empresas , y más tarde se encontró que la comunidad tiene necesidades similares,...
hace 7 meses
025.7K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalación con un solo clic de modelos de inteligencia artificial e interfaces de chat en ordenadores personales (con DeepSeek)

Introducción general AingDesk es un software de código abierto y gratuito diseñado para ayudar a los usuarios a implementar y ejecutar fácilmente varios modelos de IA en sus ordenadores locales. Ya se trate de un modelo DeepSeek o Llama, AingDesk permite una sencilla...
hace 8 meses
025.7K
阿里妈妈创意中心:淘宝生态下的智能化营销创意支持平台

Centro Creativo AliMama: Plataforma inteligente de apoyo creativo al marketing bajo la ecología de Taobao

Introducción completa Alimama Creative Centre es la plataforma inteligente de soporte creativo de marketing de Alibaba, diseñada para proporcionar a los comerciantes de Taobao, Tmall y otras plataformas de comercio electrónico una gama completa de soporte creativo, desde gráficos hasta vídeos y páginas de destino. Mediante la combinación de capacidades de redacción inteligente de AI y plantillas masivas, el Centro Creativo mejora drásticamente la eficiencia del diseño...
hace 1 año
025.7K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: herramienta de narración y edición automatizada generada por texto para cine y televisión

Introducción general NarratoAI es una herramienta totalmente automatizada que integra narración de películas y vídeos, edición automatizada, doblaje y generación de subtítulos. Se basa en la tecnología de modelado lingüístico a gran escala (LLM) para generar automáticamente copias y editar automáticamente vídeos con sus correspondientes locuciones y subtítulos, proporcionando a los usuarios un...
hace 1 año
025.7K
RWKV Runner:开源大型语言模型RWKV管理工具

RWKV Runner: herramienta de código abierto para la gestión de modelos lingüísticos a gran escala RWKV

Introducción general RWKV-Runner es una herramienta de gestión y lanzamiento diseñada específicamente para modelos RWKV, con el objetivo de proporcionar una herramienta de gestión y lanzamiento RWKV fácil de usar. Es totalmente automatizado y de pequeño tamaño, sólo 8MB de tamaño, y ofrece tanto con la API OpenAI...
hace 11 meses
025.7K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 8 meses
025.7K
VidAU:视频换脸与视频多语言翻译工具

VidAU: Herramienta de intercambio de caras y traducción multilingüe de vídeos

Introducción general VidAU.AI es una herramienta de IA todo en uno para la generación de vídeo y audio, que ofrece una amplia gama de funciones como portavoz de vídeo, intercambio de caras, traducción multilingüe, eliminación de subtítulos y marcas de agua, mezcla y edición de vídeo y mucho más. Permite crear vídeos como sketches, anuncios, discursos de ventas, contenidos para redes sociales y formación...
hace 1 año
025.7K
editGPT:专业的文章校对、编辑与内容变更追踪工具

editGPT: Herramienta profesional de corrección de artículos, edición y seguimiento de cambios de contenido

Introducción general editGPT es una herramienta de corrección y edición en línea basada en IA que admite más de 20 idiomas. Ayuda a los usuarios a mejorar el tono y la estructura de los artículos, personalizar el contenido para audiencias específicas y proporcionar funciones de edición en formatos específicos de la industria y académicos. Los usuarios pueden importar y exportar micro...
hace 1 año
025.7K
WriteWise:喜马拉雅推出的专业AI小说写作工具

WriteWise: una herramienta profesional de Himalaya para escribir novelas con inteligencia artificial

Introducción exhaustiva WriteWise es una plataforma de servicios en línea centrada en la creación de novelas lanzada por Himalaya. Proporciona asistencia profesional para la escritura de IA, abarcando la configuración de personajes, el diseño de diálogos y la lucha de artes marciales. Además, también ofrece una versión para ordenador que puede descargarse, admite configuraciones de formato de editor...
hace 1 año
025.7K
Hallo2:音频驱动生成口型/表情同步的肖像视频(Windows一键安装)

Hallo2: generación basada en audio de vídeos de retratos sincronizados con los labios y las expresiones (instalación con un solo clic para Windows)

Introducción general Hallo2 es un proyecto de código abierto desarrollado conjuntamente por la Universidad de Fudan y Baidu, cuyo objetivo es generar animaciones de retratos de alta resolución mediante la generación basada en audio. El proyecto utiliza redes generativas adversariales (GAN) avanzadas y técnicas de alineación temporal para lograr una resolución 4K y generar vídeos de hasta una hora de duración....
hace 9 meses
025.7K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: un modelo para transformar el lenguaje natural en consultas SQL de alta calidad

Introducción general OmniSQL es un proyecto de código abierto desarrollado por el equipo RUCKBReasoning y alojado en GitHub. Su función principal es transformar las preguntas en lenguaje natural introducidas por el usuario en sentencias de consulta SQL de alta calidad , para ayudar a los usuarios fácilmente con el número de...
hace 7 meses
025.7K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: herramienta profesional de edición de audio en línea|producción de audiolibros|de texto a voz|separación de acompañamientos

Introducción general XAudioPro es una herramienta avanzada de edición y transcodificación de audio en tiempo real en línea que es a la vez profesional y portátil. Soporta funciones profesionales de edición de audio como cortar, recortar, copiar, borrar, restaurar y controlar la ganancia de amplitud. También ofrece servicios de eliminación de ruido, como reducción de ruido por sustracción espectral,...
hace 1 año
025.7K
阿布量化交易系统:基于Python的开源量化交易平台

Abu quantitative trading system: plataforma de negociación cuantitativa de código abierto basada en Python

Introducción general Abu Quantitative Trading System es una plataforma de código abierto basada en Python. Fue creada por el usuario "bbfamily" para ayudar a los inversores a aplicar estrategias de negociación cuantitativa mediante código. El sistema soporta backtesting y trading de varios productos financieros como acciones, opciones, futuros y bitcoin. Es...
hace 7 meses
025.7K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

Analytics GBI (XiYan-SQL): Análisis inteligente de datos de texto a SQL para ChatBI simplificado

Introducción completa Analyse GBI es un producto de análisis inteligente de datos basado en big models lanzado por AliCloud Bailian. El producto utiliza tecnología avanzada de procesamiento del lenguaje natural para ayudar a los usuarios a consultar y analizar datos a través del lenguaje natural, sin tener que dominar la compleja sintaxis SQL. Analizar GBI soporta múltiples fuentes de datos, incluyendo...
hace 10 meses
025.7K
Slidesgo:免费PPT模板下载,辅助AI生成演示文稿,提供教育版工具

Slidesgo: plantillas PPT gratuitas para descargar, ayuda a la IA a generar presentaciones, proporciona una versión educativa de la herramienta

Introducción general Slidesgo es una plataforma que ofrece un gran número de plantillas de presentación de Google Slides y PowerPoint gratuitas y personalizables. Los usuarios pueden elegir plantillas de diferentes estilos o colores según sus necesidades, como temas empresariales, educativos o médicos. El sitio ofrece iconos, letras...
hace 1 año
025.7K
CSM(Cube):提供3D生成AI工具,支持从图像、文本生成3D模型

CSM (Cube): Proporciona herramientas de IA para la generación de 3D, admite la generación de modelos 3D a partir de imágenes, texto

Introducción general Common Sense Machines (CSM) es una empresa centrada en la tecnología de IA generativa 3D, que proporciona herramientas para generar modelos 3D a partir de imágenes y texto. Los usuarios pueden generar rápidamente modelos 3D de alta calidad cargando imágenes 2D o introduciendo texto....
hace 12 meses
025.7K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos

Introducción general LivePortrait es una herramienta avanzada de animación dinámica de retratos AI desarrollada por Racer Technology. Utiliza una innovadora tecnología de IA para transformar imágenes fijas en vívidas animaciones de vídeo. Tanto si utiliza fotos reales, estilos de animación o retratos artísticos, LivePo...
hace 11 meses
025.7K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: dobles de IA entrenados localmente con recuerdos y hábitos personales.

Second Me es un proyecto de código abierto desarrollado por el equipo Mindverse que te permite crear una IA en tu ordenador que actúa como un "doble digital", aprendiendo tus patrones y hábitos de habla a través de tus palabras y recuerdos, y convirtiéndose en una persona inteligente que entiende tus...
hace 7 meses
025.7K
arXiv Paper Visualizer:arXiv论文推荐与可视化解读

arXiv Paper Visualizer: Recomendación e interpretación visual de arXiv Paper

Introducción arXiv Paper Visualizer es una herramienta en línea que ayuda a los usuarios a comprender y filtrar rápidamente los artículos académicos de la plataforma arXiv. Utiliza tecnología de inteligencia artificial para transformar el complejo contenido de los artículos en una forma visual intuitiva, permitiendo a los investigadores y...
hace 8 meses
025.7K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Interfaz web de generación de texto: interfaz de chat basada en modelos lingüísticos de gran tamaño de Gradio y compatible con varios servicios backend.

Introducción general La interfaz web de generación de texto es una interfaz web basada en Gradio diseñada para el Large Language Model (LLM). Soporta una variedad de backends de generación de texto, incluyendo Transformers, llama.cp...
hace 11 meses
025.6K
通义听悟:阿里通义音视频内容转录AI助手

Tongyi Listening and Understanding: Ali Tongyi Asistente de Inteligencia Artificial para la transcripción de contenidos de audio y vídeo

Introducción exhaustiva Tongyi Listening and Understanding es un asistente de IA para el trabajo lanzado por Aliyun, centrado en la transcripción y el análisis de contenidos de audio y vídeo. Se basa en los potentes modelos de IA de AliCloud para transcribir contenido de audio y vídeo a texto en tiempo real, y proporciona funciones de traducción, resumen, posicionamiento y otras. Tongyi Listening Woo es compatible con varios idiomas y escenarios...
hace 1 año
025.6K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

ModelBest: el líder mundial en modelos grandes ligeros y de alto rendimiento de extremo a extremo

Introducción general ModelBest es una empresa centrada en el desarrollo de grandes modelos ligeros y de alto rendimiento, y se dedica a aplicar tecnologías avanzadas de IA a la electrónica de consumo convencional y a todo tipo de dispositivos finales de la vida cotidiana. Su serie MiniCPM de modelos finales con extrema potencia aritmética y eficiencia en el uso de la memoria...
hace 12 meses
025.6K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot backend proxy service: hacerse cargo del servidor de plugins de GitHub Copilot con otros modelos

Introducción general El Copilot Backend Agent Service es un proyecto de código abierto diseñado para gestionar el servidor de plugins de GitHub Copilot aprovechando otros modelos FIM como DeepSeek, a la vez que soporta que varias personas compartan cuentas oficiales. El servicio soporta una variedad de IDEs, incluyendo V...
hace 10 meses
025.6K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - Ali lanza un modelo de generación de vídeo de IA de código abierto

Tongyi Wanphase Wan2.2 es un modelo avanzado de generación de vídeo de IA de código abierto de Alibaba con 27.000 millones de referencias totales. El modelo contiene tres modos: vídeo generado por texto, vídeo generado por gráficos y generación de vídeo unificada, que pueden generar vídeos de alta calidad basados en descripciones de texto, imágenes o una combinación de ambos.
hace 3 meses
025.6K
Interviewcoder:辅助远程技术面试的隐形AI工具

Interviewcoder: la herramienta de IA invisible que facilita las entrevistas técnicas a distancia

Introducción general Interviewcoder es una herramienta asistida por IA para entrevistas técnicas, diseñada para ayudar a los usuarios a generar rápidamente soluciones, optimizar código y depurar en tiempo real durante las entrevistas de programación. Se ejecuta como una aplicación de escritorio oculta que los usuarios pueden utilizar en Zoom, Googl...
hace 7 meses
025.6K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: Confiar en MCP para consultar y resumir los mensajes de WeChat en Claude

Introducción general MCP Server ChatSum es un proyecto de código abierto diseñado para ayudar a los usuarios a consultar y resumir los mensajes de chat. El proyecto está alojado en GitHub y proporciona un potente conjunto de herramientas que permite a los usuarios consultar los registros de chat basándose en parámetros específicos y generar los resúmenes correspondientes....
hace 7 meses
025.6K
JENOVA:整合多模型与搜索的AI对话助手,根据问题动态选择模型

JENOVA: asistente de diálogo de inteligencia artificial que integra múltiples modelos y búsquedas y selecciona dinámicamente modelos en función de los problemas.

Introducción general JENOVA es una plataforma global líder en IA diseñada para proporcionar a los usuarios potentes servicios de integración de IA. Mediante la integración de modelos de IA de última generación (por ejemplo, GPT-4o, Claude 3.5, Gemini 2), JENOVA es capaz de adaptar las necesidades de los usuarios...
hace 9 meses
025.6K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: una herramienta basada en grafos heterogéneos para la recuperación y generación de información precisa

Una introducción completa NodeRAG es un sistema de código abierto de Generación Aumentada de Recuperación (RAG) alojado en GitHub y desarrollado por Terry-Xu-666. Optimiza la recuperación y generación de información a través de estructuras de grafos heterogéneos, mejorando significativamente la precisión de la recuperación y la relevancia contextual.Nod...
hace 6 meses
025.6K
Questgen:智能测验题目生成工具,AI生成多项选择题, 判断题, 填空题

Questgen: generador inteligente de preguntas tipo test, preguntas de opción múltiple generadas por IA, de juicio, de rellenar espacios en blanco

Introducción General Questgen es una herramienta de generación de cuestionarios basada en Inteligencia Artificial que puede generar rápidamente muchos tipos de preguntas a partir de cualquier texto. Tanto si se trata de preguntas de opción múltiple, de juicio, de rellenar espacios en blanco o de orden superior, Questgen las genera en cuestión de segundos. El trabajo...
hace 1 año
025.6K
Signs:通过AI技术助力学习和贡献美国手语的互动平台

Signos: una plataforma interactiva para aprender y contribuir al lenguaje de signos americano impulsada por la tecnología de IA.

Introducción general Signs es una innovadora plataforma online diseñada para ayudar a los usuarios a aprender el lenguaje de signos americano (ASL) y contribuir a la comunidad sorda a través de la tecnología de inteligencia artificial. El sitio está impulsado por NVIDIA, la American Society for Deaf Children (ASDC) y la agencia creativa Hello Mond....
hace 8 meses
025.6K
EmemeAI:创建并导出3D虚拟AI角色的互动平台

EmemeAI: plataforma interactiva para crear y exportar personajes virtuales 3D de IA

Introducción general EmemeAI es una plataforma que ayuda a los usuarios a crear personajes 3D de IA. Puedes subir modelos 3D en formato VRM, establecer la personalidad del personaje y generar personajes virtuales que pueden chatear y moverse automáticamente. Estos personajes no sólo pueden hablar contigo, sino también generar expresiones y acciones según el contexto.E...
hace 6 meses
025.6K
Vsub:输入文字或模板生成无需露脸的病毒营销视频

Vsub: Introduce texto o plantillas para generar vídeos de marketing viral que no requieran mostrar tu cara

Introducción general Vsub es una plataforma centrada en la automatización de la creación de contenidos de vídeo, diseñada para ayudar a los creadores de contenidos a generar rápidamente vídeos sin rostro (faceless videos). Utiliza tecnología de inteligencia artificial para permitir a los usuarios crear vídeos introduciendo texto o seleccionando plantillas preestablecidas adecuadas para YouT...
hace 9 meses
025.6K
Noisee AI:用音乐旋律生成风格一致的MV动态视频

Noisee AI: Generación de vídeos de movimiento MV estilísticamente coherentes con melodías musicales

Introducción general Noisee es una herramienta de generación de vídeos musicales mediante IA desarrollada por Tranquilitatis Inc, filial de Dark Side of the Moon, que ha demostrado una gran potencia y una amplia gama de aplicaciones en el campo de la creación musical y las artes visuales. Noisee AI es una innovadora...
hace 12 meses
025.6K
PR Agent:自动化拉取请求分析工具

PR Agent: herramienta automatizada de análisis de pull requests

Introducción general PR-Agent es una herramienta de código abierto desarrollada por Qodo para automatizar el procesamiento de pull requests (solicitudes de extracción) mediante tecnología de IA. La herramienta es capaz de proporcionar retroalimentación automatizada, sugerencias y análisis para ayudar a los desarrolladores a realizar revisiones de código de manera más eficiente....
hace 9 meses
025.6K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

AR Drawing: una aplicación que utiliza la tecnología AR y AI para mejorar las habilidades de dibujo a mano realista.

Descripción general AR Drawing es una aplicación que utiliza la tecnología de realidad aumentada (RA) para ayudar a los usuarios a mejorar sus habilidades de dibujo. La aplicación ofrece más de 200 lecciones de dibujo guiadas paso a paso que cubren una variedad de plantillas de dibujo desde niveles principiantes hasta avanzados. Los usuarios pueden utilizar la cámara de su teléfono móvil para proyectar imágenes...
hace 11 meses
025.6K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: un sistema avanzado de recuperación de IA (RAG) para el análisis sintáctico de contenidos multimodales y la combinación del grafo de conocimiento con la búsqueda híbrida

Introducción completa R2R (RAG to Riches) es un sistema avanzado de recuperación de IA que admite la funcionalidad de generación aumentada de recuperación (RAG) con características listas para la producción. Construido sobre una API RESTful en contenedores, el sistema proporciona análisis de contenido multimodal, funcionalidad de búsqueda híbrida...
hace 10 meses
025.6K