Proyecto AI de código abierto

Total 1020 artículos
sensitive-word:敏感词过滤工具,高效DFA算法实现

sensitive-word: herramienta de filtrado de palabras sensibles, aplicación eficaz del algoritmo DFA

Introducción completa Sensitive Word Filtering Tool (Sensitive Word) es una herramienta Java de alto rendimiento para el filtrado de palabras sensibles basada en la implementación del marco del algoritmo DFA . La herramienta es capaz de detectar y filtrar eficientemente palabras sensibles , soporta una variedad de conversión de formatos y estrategias de reemplazo personalizadas. Su objetivo de diseño es proporcionar ...
hace 1 año
026.6K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): plataforma de código abierto para crear y gestionar grafos de conocimiento, con soporte nativo para aplicaciones RAG.

Introducción Knowledge Graph Studio (KGS) es una plataforma de código abierto diseñada para simplificar el proceso de creación y gestión de grafos de conocimiento nativos de RAG. La plataforma ofrece resolución de entidades basada en reglas, construcción modular de grafos,...
hace 10 meses
026.5K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: un marco de código abierto para construir aplicaciones modulares de GAR y probar rápidamente diversas estrategias de GAR.

Introducción general Cognita es un marco de código abierto desarrollado por TrueFoundry para simplificar el desarrollo de aplicaciones basadas en RAG (Retrieval-Augmented Generation). El framework proporciona un entorno estructurado, mod...
hace 9 meses
026.5K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: una herramienta sencilla para crear grandes conjuntos de datos de modelos afinados

Introducción exhaustiva Easy Dataset es una herramienta de código abierto diseñada específicamente para el ajuste fino de grandes modelos (LLM), alojada en GitHub. Ofrece una interfaz fácil de usar que permite a los usuarios cargar archivos, segmentar automáticamente el contenido, generar preguntas y respuestas y, en última...
hace 7 meses
026.5K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: una aplicación web comercial que integra servicios de IA multimodal (código abierto gratuito)

Introducción general 99AI es un proyecto de aplicación web de IA de código abierto cuyo objetivo es proporcionar una plataforma de servicios de IA integrada de bajo umbral y fácil de desplegar. El proyecto admite diálogos inteligentes, modelos multimodales, plazas de aplicaciones, búsquedas en red e integra pintura, música y vídeo de IA....
hace 11 meses
026.5K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Eliminación de marca de agua:open source image watermark removal tool, picture watermark recovery original image

Introducción general Watermark Removal es un proyecto de código abierto que utiliza técnicas de aprendizaje automático y aprendizaje profundo para la restauración de imágenes, concretamente para eliminar marcas de agua de imágenes. El proyecto fue desarrollado por Chimzuruoke Okafor y se inspira en Con...
hace 8 meses
026.5K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: generador de logotipos de código abierto que utiliza inteligencia artificial para generar logotipos de marca profesionales.

Introducción general LogoCreator es un generador de logotipos de código abierto basado en el modelo Together AI y Flux, centrado en proporcionar servicios de diseño de logotipos rápidos y profesionales para empresas y particulares. El proyecto es desarrollado y de código abierto por el desarrollador Nutlope en Git...
hace 10 meses
026.5K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Agente TARS: una inteligencia de código abierto que utiliza la visión y los comandos para manejar ordenadores

El agente de introducción integral TARS es una inteligencia artificial multimodal de código abierto de ByteDance, con características básicas que ayudan a los usuarios a completar tareas informáticas complejas mediante la comprensión visual del contenido web y la combinación de operaciones de línea de comandos y del sistema de archivos. En lugar de requerir operaciones manuales como las herramientas tradicionales, puede auto...
hace 7 meses
026.5K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: AI digital people con interacción fluida en tiempo real en tarjetas gráficas de la serie 30/40

Introducción general DH_live es un proyecto de humano digital en tiempo real basado en el aprendizaje sin muestras, cuyo objetivo es proporcionar a los usuarios una experiencia de transmisión en directo fluida e interactiva. El proyecto es compatible con las tarjetas gráficas NVIDIA de las series 30 y 40 y es capaz de funcionar en tiempo real a más de 25 fps. Los usuarios pueden...
hace 11 meses
026.4K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: lectura de archivos de texto de repositorios git y fragmentación rápida de modelos de gran tamaño

Introducción general Yek es una herramienta rápida basada en Rust para leer archivos de texto de repositorios o directorios, trocearlos y serializarlos para su uso en grandes modelos lingüísticos (LLM). La herramienta utiliza la regla .gitignore por defecto para omitir archivos innecesarios, y utiliza...
hace 9 meses
026.4K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

DreamTalk Introducción DreamTalk es un marco de generación de cabezas parlantes basado en modelos de difusión y expresión desarrollado conjuntamente por la Universidad Tsinghua, Alibaba Group y la Universidad Huazhong de Ciencia y Tecnología. Consta principalmente de tres partes: una red de reducción de ruido, un experto en labios consciente del estilo y un predictor de...
hace 10 meses
026.4K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: despliegue sin servidor de un sitio de diálogo multimodal Gemini

Introducción General Gemini Playground es un proyecto de código abierto diseñado para ayudar a los usuarios a implementar rápidamente un sitio de diálogo multimodal . El proyecto es desarrollado por el camarón de rastreo técnico , apoyar el uso de Gemini API Key en 10 segundos para completar el despliegue . Si el usuario es ...
hace 8 meses
026.3K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: generación y evaluación automáticas de presentaciones PPT, documentos a PPT

Introducción general PPTAgent es un sistema innovador diseñado para generar automáticamente presentaciones a partir de documentos. El sistema se inspira en el enfoque humano de la creación de presentaciones, utilizando un proceso de dos pasos para garantizar la calidad del contenido y el impacto visual. Además, PPTAgent presenta PPTEval, un completo...
hace 9 meses
026.3K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: Genera copias de vídeo y vídeos cortos en HD en un clic introduciendo un tema de vídeo

Introducción completa MoneyPrinterTurbo es un proyecto de código abierto que utiliza la tecnología avanzada AI big model para lograr la función de generar vídeos cortos de alta definición con un solo clic. Los usuarios sólo tienen que proporcionar un tema de vídeo o palabras clave, el sistema generará automáticamente la copia de vídeo, clips de vídeo, subtítulos de vídeo y...
hace 7 meses
026.3K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: PDF local para generar podcasts de voz de herramientas de código abierto

Introducción completa Local-NotebookLM es un proyecto de código abierto que tiene como objetivo proporcionar localmente ejecutar herramientas inteligentes de procesamiento de documentos y generación de contenidos. Está inspirado en Google NotebookLM , centrándose en ayudar a los usuarios a PDF y otros documentos en una variedad de ...
hace 7 meses
026.3K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicación web de chat con inteligencia artificial de código abierto con carga de documentos y compatibilidad multimodelo

Introducción general Zola es una aplicación de chat de IA gratuita y de código abierto desarrollada por el desarrollador Julien Thibeaut (nombre de usuario de GitHub ibelick) y alojada en GitHub. Su mejor característica es que soporta múltiples modos de IA...
hace 6 meses
026.2K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelización autorregresiva por bits de la generación de imágenes de alta resolución para una generación ilimitada de imágenes de alta resolución

Introducción general Infinity es un innovador marco de generación de imágenes de alta resolución desarrollado por el equipo de FoundationVision. El proyecto rompe con las limitaciones de los modelos tradicionales de generación de imágenes a través de un innovador enfoque de modelado autorregresivo visual a nivel de bits.Las principales características de Infinity...
hace 10 meses
026.2K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: aplicación local de chat en tiempo real basada en Nuxt 3 y Ollama

Introducción general ChatOllama es un proyecto de aplicación de chat en línea de código abierto basado en un modelo lingüístico a gran escala (LLM), que admite numerosos modelos lingüísticos y la gestión de la base de conocimientos. Los usuarios pueden utilizar la plataforma para la gestión de modelos ( visualización de listas , descarga , eliminación ) , chatear con los modelos y otras funciones . El proyecto utiliza ...
hace 1 año
026.2K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: uso ilimitado de AI IDEs mediante herramientas de automatización (por ejemplo, Cursor y Windsurf)

Descripción general AI Auto Free es una potente herramienta de automatización diseñada para ayudar a los usuarios a hacer un uso ilimitado de los Entornos de Desarrollo Integrado (IDE) basados en IA, como Cursor y Windsurf. El proyecto ofrece soporte multiplataforma e incluye múltiples funciones de lenguaje...
hace 9 meses
026.2K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: un editor de código colaborativo multijugador de alto rendimiento desarrollado por Rust

Introducción general Zed es un editor de código colaborativo multiusuario de alto rendimiento desarrollado por los creadores de Atom y Tree-sitter.Escrito en el lenguaje Rust, Zed está diseñado para proporcionar una experiencia de codificación rápida y fluida. Entre sus principales características se incluye la compatibilidad con...
hace 10 meses
026.2K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: un cliente de diálogo con IA que utiliza la inteligencia MCP para realizar tareas complejas.

Introducción general HyperChat es un cliente de chat de código abierto desarrollado por BigSweetPotatoStudio y alojado en GitHub, diseñado para proporcionar una visión global del modelo lingüístico de BigSweetPotatoStudio mediante la integración de API de varios grandes modelos lingüísticos (LLM) como OpenAI, Cla...
hace 7 meses
026.2K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): generación de activos 3D de alta resolución, múltiples flujos de trabajo de generación de materiales 3D

Introducción Tencent Hunyuan3D (Hunyuan3D 2.0) es un avanzado sistema de composición 3D a gran escala de Tencent diseñado para generar activos 3D texturizados de alta resolución. El sistema consta de dos componentes principales: Hunyuan3D-DiT, un modelo de generación de formas a gran escala, y Hunyuan3D-DiT, un...
hace 9 meses
026.1K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...
hace 8 meses
026.1K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: herramienta de código abierto para detectar vulnerabilidades LLM y asegurar la IA generativa

Introducción completa NVIDIA Garak es una herramienta de código abierto diseñada específicamente para detectar vulnerabilidades en Large Language Models (LLMs). Comprueba el modelo en busca de múltiples debilidades como ilusiones, fugas de datos, inyección de pistas, generación de mensajes de error, generación de contenido dañino, etc. mediante sondeos estáticos, dinámicos y adaptativos....
hace 11 meses
026.1K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: una herramienta de código abierto para editar imágenes con instrucciones de lenguaje natural

Introducción general Step1X-Edit es un marco de edición de imágenes de código abierto desarrollado por el equipo Stepfun AI y alojado en GitHub. Combina un modelo de lenguaje multimodal de gran tamaño (Qwen-VL) y un transformador de difusión (DiT) para permitir a los usuarios crear imágenes a través de un...
hace 5 meses
026.1K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道

Yutu: herramienta de gestión de línea de comandos de YouTube, acceso a la IA para automatizar completamente los canales de YouTube

Introducción general Yutu es una potente herramienta de línea de comandos de código abierto diseñada para usuarios de YouTube, alojada en GitHub y desarrollada por el equipo eat-pray-ai. Funciona a través de la terminal para lograr los vídeos de YouTube, listas de reproducción, frecuencia...
hace 7 meses
026.1K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio): solución integral de B/C para aplicaciones de agregación de IA con facturación flexible y compatibilidad con el modelo de suscripción.

Introducción general CoAI.Dev (antes Chat Nio) es una plataforma de chat que integra múltiples modelos de IA y soporta streaming distribuido, generación de imágenes, sincronización y compartición de conversaciones entre dispositivos. Implementa un sistema de facturación por suscripción y Token, servicio de tránsito de claves y múltiples...
hace 11 meses
026.1K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: bot de WeChat para inserción de noticias, diálogo con inteligencia artificial y gestión de grupos de chat

Introducción completa NGCBot es un mecanismo HOOK basado en el desarrollo de WeChat robot proyecto de código abierto , creado por el desarrollador ngc660sec (Yunshan/eXM) y alojado en GitHub Después de dos años de iteración , la versión actual de V2.3 , la función de la inicial simple ...
hace 7 meses
026K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统

OpenPilot: sistema de conducción autónoma de código abierto, hazte tu propio sistema de conducción inteligente para tu coche

Introducción general OpenPilot es un sistema de conducción autónoma de código abierto desarrollado por comma.ai para mejorar la experiencia de conducción y la seguridad de los vehículos existentes con funciones avanzadas de asistencia al conductor. Desde su primer lanzamiento en 2016, OpenPilot ha dado soporte a más de 2...
hace 8 meses
026K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流

Fast-Agent: gramática declarativa e integración con MCP para crear rápidamente flujos de trabajo corporales multiinteligentes

Introducción general Fast-Agent es una herramienta de código abierto mantenida por el equipo evalstate en GitHub, diseñada para ayudar a los desarrolladores a definir, probar y construir rápidamente flujos de trabajo multiinteligencia. Se basa en una sintaxis declarativa sencilla y admite el uso de MCP (Modo...
hace 7 meses
026K
RLAMA:命令行操作的本地文档智能问答 RAG 系统

RLAMA: un sistema RAG de interrogación inteligente de documentos locales operado desde la línea de comandos

Introducción general RLAMA es un sistema RAG (Retrieval Augmentation Generation) de cuestionario de inteligencia documental desarrollado por DonTizi de código abierto y alojado en GitHub, cuya característica principal es la funcionalidad a través de operaciones de línea de comandos. Los usuarios pueden utilizar simples comandos de terminal para conectarse a ...
hace 7 meses
026K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: flujos de trabajo corporales inteligentes basados en lenguaje natural para la automatización de escritorios y navegadores

Introducción general Eko es un marco JavaScript de nivel de producción diseñado para construir flujos de trabajo de agentes inteligentes eficientes mediante descripciones en lenguaje natural. Está diseñado para permitir a los desarrolladores automatizar tareas cotidianas utilizando tecnologías de IA sin necesidad de programac...
hace 7 meses
025.9K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: una herramienta segura y fiable para probar aplicaciones LLM

Introducción completa promptfoo es una herramienta de línea de comandos de código abierto y la biblioteca dedicada a la evaluación y la prueba de red-teaming Large Language Model (LLM) aplicaciones. Proporciona a los desarrolladores un conjunto completo de herramientas para la construcción de prompts fiables, modelos, y la generación basada en la recuperación (RAGs) con auto...
hace 8 meses
025.9K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings: garabatos infantiles dibujados a mano convertidos en animación, herramienta automatizada de generación de animaciones de dibujos infantiles.

Introducción general AnimatedDrawings es un proyecto de código abierto desarrollado por Facebook Research para transformar dibujos infantiles en personajes animados mediante técnicas de automatización. El proyecto se basa en el artículo "A Method for A...
hace 10 meses
025.9K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: modelo de aprendizaje profundo para eliminar rápidamente el fondo de imágenes y vídeos

Introducción exhaustiva BEN2 (Background Erase Network 2) es un modelo de aprendizaje profundo desarrollado por Prama LLC específicamente diseñado para eliminar automáticamente el fondo de una imagen y generar una imagen en primer plano. El modelo utiliza un innovador algoritmo de Confiden...
hace 4 meses
025.9K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: herramienta de globalización multilingüe para vídeo con traducción y doblaje en un clic

Introducción completa KrillinAI es una herramienta de procesamiento de vídeo de código abierto que se centra en el uso de la inteligencia artificial para ayudar a los usuarios a traducir vídeos y doblarlos automáticamente. Puede empezar desde la descarga del vídeo, hasta generar el producto final adaptado a diferentes plataformas, todo el proceso es cuestión de unos pocos clics. Los desarrolladores están disponibles en GitHub...
hace 4 meses
025.8K
Flock:低代码工作流编排快速构建聊天机器人

Flock: orquestación de flujos de trabajo de bajo código para la creación rápida de chatbots

Introducción general Flock es una plataforma de código abierto para flujos de trabajo, alojada en GitHub y desarrollada por el equipo Onelevenvy. Se basa en las tecnologías LangChain y LangGraph y se centra en ayudar a los usuarios a construir rápidamente máquinas de chat....
hace 8 meses
025.8K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG: una solución integral del sistema RAG para simplificar la construcción de datos y el ajuste de modelos

Introducción exhaustiva UltraRAG es una solución de sistema RAG (Retrieval Augmented Generation) propuesta conjuntamente por el grupo THUNLP de la Universidad de Tsinghua, el grupo NEUIR de la Universidad Northeastern, Modelbest.Inc y el equipo 9#AISoft. El marco se basa en el despliegue ágil y la construcción modular...
hace 9 meses
025.8K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: compatibilidad con herramientas de generación de imágenes personalizadas mono y multisujeto (adecuadas para gráficos de comercio electrónico).

UNO es un marco de generación de imágenes de código abierto desarrollado por el equipo de creación inteligente ByteDance. Se basa en el modelo FLUX.1 y se centra en la generación de imágenes personalizadas de un único sujeto y de varios sujetos mediante un enfoque de generalización de "menos a más".UNO utiliza el transformador de difusión...
hace 6 meses
025.7K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: construcción de módulos de memoria de IA humanizada para guardar y actualizar información sobre interacciones con humanos.

Introducción general Memora es un agente diseñado para replicar los recuerdos humanos en cada IA personalizada. Ayuda a las IAs a recordar detalles de interacciones pasadas, emociones y experiencias compartidas al igual que lo hacen los humanos a través de características como memorias con marca de tiempo, marcadores de emoción y memorias multimodales.Memora soporta multi-tenancy y es capaz de manejar...
hace 9 meses
025.7K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: una herramienta de pruebas automatizadas con IA que utiliza el lenguaje natural para realizar pruebas de principio a fin

Introducción general Shortest es un marco de pruebas de extremo a extremo en lenguaje natural basado en IA desarrollado por el equipo Anti-Work. Se basa en Playwright y admite la integración con GitHub y la autenticación de dos factores (2FA)....
hace 9 meses
025.7K
Agent S:像人类一样操作电脑的开源智能体框架

Agente S: un marco de código abierto para que los cuerpos inteligentes manejen los ordenadores como humanos

Introducción general Agent S es un marco de código abierto desarrollado por Simular AI que permite a las inteligencias manejar ordenadores como si fueran humanos a través de una interfaz gráfica de usuario (GUI). Utiliza un gran modelo de lenguaje multimodal y técnicas de aprendizaje empírico para realizar tareas como navegar por la web, editar documentos, utilizar software...
hace 6 meses
025.7K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: basado en el modelo OCR multimodal de extremo a extremo QWen2 0.5B

Introducción exhaustiva GOT-OCR2.0 es un modelo de reconocimiento óptico de caracteres (OCR) de código abierto co-propuesto por StepStar, cuyo objetivo es impulsar la tecnología OCR hacia OCR-2.0 mediante un modelo unificado de extremo a extremo. El modelo soporta una amplia gama de tareas de OCR, incluyendo el reconocimiento de texto normal, gr...
hace 1 año
025.7K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...
hace 6 meses
025.7K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus: herramienta de IA para generar vídeos cortos con un solo clic, mezcla por lotes gratuita

Introducción completa MoneyPrinterPlus es un proyecto de código abierto destinado a generar y mezclar todo tipo de vídeos cortos con un solo clic a través de la tecnología de IA y publicarlos automáticamente en múltiples plataformas de vídeo, como Jieyin, Shutterbugs, Xiaohongshu y Video Number. La herramienta admite modelos de voz locales y basados en la nube,...
hace 1 año
025.7K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: clonación de voz rápida y formación de modelos, conversión de texto a voz basada en xtts v2

Introducción completa MockingBird es un proyecto de código abierto que pretende conseguir una rápida clonación de voz y conversión de texto a voz mediante tecnología de IA. Los usuarios sólo tienen que proporcionar 5 segundos de muestras de voz, puede generar cualquier contenido de voz. El proyecto admite una gran variedad de conjuntos de datos chinos ...
hace 10 meses
025.7K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: un marco de flujo de trabajo de código abierto de IA que integra muchas palabras clave para gestionar eficazmente una variedad de transacciones.

Introducción general Fabric es un marco de IA de código abierto desarrollado por Daniel Miessler para simplificar y automatizar las tareas informáticas cotidianas y facilitar el uso de la inteligencia artificial. Ayuda a los usuarios de forma eficiente a través de un diseño modular y de palabras clave predefinidas (Patrones)...
hace 12 meses
025.6K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: un macromodelo multimodal de audio para el diálogo de voz en tiempo real de extremo a extremo, una implementación de código abierto de la interacción de voz GPT-4o

Introducción general Ultravox es un innovador modelo multimodal de lenguaje amplio (LLM) diseñado para el procesamiento del habla en tiempo real. A diferencia de los sistemas tradicionales de reconocimiento del habla, Ultravox elimina la necesidad de una etapa separada de reconocimiento del habla de audio (ASR), y es capaz de convertir directamente el audio en un espacio de alta dimensión en...
hace 10 meses
025.6K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: revolucionaria tecnología de generación de imágenes de altísima resolución con gran riqueza de detalles

Introducción general UltraPixel es una tecnología avanzada de generación de imágenes de ultra alta resolución diseñada para crear imágenes de altísima calidad y ricas en detalles. Fue desarrollada por el usuario de GitHub catcathh y presentada en NeurIPS 2024.U...
hace 1 año
025.6K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: una herramienta de evaluación visual para optimizar los sistemas de generación de mejoras de la recuperación

Introducción completa XRAG (eXamining the Core) es un marco de evaluación comparativa diseñado para evaluar los componentes subyacentes de los sistemas avanzados de generación de aumento de la recuperación (RAG). Mediante el perfilado y análisis de cada módulo central, XRAG proporciona información sobre cómo afectan las distintas configuraciones y componentes a los sistemas RAG....
hace 9 meses
025.6K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...
hace 6 meses
025.6K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: una herramienta virtual de alta fidelidad para mejorar la autenticidad de los detalles de la ropa

Introducción exhaustiva FitDiT es un sistema de ajuste virtual de alta fidelidad basado en transformadores de difusión (Diffusion Transformers). Desarrollado por Tencent AI Lab, el proyecto pretende abordar las limitaciones de los sistemas tradicionales de ajuste virtual a la hora de mostrar los detalles de las prendas.FitD...
hace 9 meses
025.5K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: Confiar en MCP para consultar y resumir los mensajes de WeChat en Claude

Introducción general MCP Server ChatSum es un proyecto de código abierto diseñado para ayudar a los usuarios a consultar y resumir los mensajes de chat. El proyecto está alojado en GitHub y proporciona un potente conjunto de herramientas que permite a los usuarios consultar los registros de chat basándose en parámetros específicos y generar los resúmenes correspondientes....
hace 7 meses
025.5K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: ¡Sube una foto de una habitación y rediseña su diseño con IA!

Introducción general RoomGPT es un proyecto de código abierto desarrollado por el usuario de GitHub Nutlope que permite a los usuarios subir fotos de habitaciones y generar versiones rediseñadas de las mismas utilizando tecnología de inteligencia artificial. El objetivo del proyecto es ofrecer a los usuarios acceso a un diseño de interiores profesional sin tener que pagar...
hace 11 meses
025.5K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Interfaz web de generación de texto: interfaz de chat basada en modelos lingüísticos de gran tamaño de Gradio y compatible con varios servicios backend.

Introducción general La interfaz web de generación de texto es una interfaz web basada en Gradio diseñada para el Large Language Model (LLM). Soporta una variedad de backends de generación de texto, incluyendo Transformers, llama.cp...
hace 11 meses
025.5K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: herramienta de desarrollo de código abierto de Shangtang para crear aplicaciones corporales multiinteligentes

Introducción exhaustiva LazyLLM es una herramienta de código abierto desarrollada por el equipo LazyAGI, centrada en simplificar el proceso de desarrollo de aplicaciones de grandes modelos de inteligencia múltiple. Ayuda a los desarrolladores a construir rápidamente aplicaciones complejas de IA a través de la implementación con un solo clic y mecanismos de puerta de enlace ligeros, ahorrando la tediosa configuración de ingeniería....
hace 8 meses
025.5K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalación con un solo clic de modelos de inteligencia artificial e interfaces de chat en ordenadores personales (con DeepSeek)

Introducción general AingDesk es un software de código abierto y gratuito diseñado para ayudar a los usuarios a implementar y ejecutar fácilmente varios modelos de IA en sus ordenadores locales. Ya se trate de un modelo DeepSeek o Llama, AingDesk permite una sencilla...
hace 8 meses
025.5K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: una aplicación de traducción de voz en tiempo real para Android, ¡gratis y sin conexión!

Introducción general RTranslator es una aplicación de traducción en tiempo real, prácticamente gratuita y de código abierto diseñada para dispositivos Android. Los usuarios pueden mantener su teléfono en el bolsillo mediante la conexión de un auricular Bluetooth y mantener una conversación con otros como si estuvieran hablando su propio idioma.RTransla...
hace 9 meses
025.5K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: plataforma de producción de cursos humanos digitales de código abierto, clonación de vídeos de conferencias humanas digitales de generación PPT con un solo clic

Introducción exhaustiva Easegen es una plataforma de creación de cursos humanos digitales de código abierto que tiene como objetivo mejorar la eficiencia de la producción y gestión de contenidos de enseñanza a través de la tecnología de IA. La plataforma proporciona una solución integral desde la producción de cursos, la gestión de vídeo hasta el interrogatorio inteligente, que permite a los usuarios crear cursos digitales de vídeo explicados por humanos....
hace 1 año
025.5K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Herramienta paramétrica de generación de aumentos de recuperación para mejorar el rendimiento de los sistemas de preguntas y respuestas.

Introducción exhaustiva PRAG (Parametric Retrieval-Augmented Generation) es una innovadora herramienta de generación aumentada por recuperación que pretende mejorar la generación de conocimiento externo incrustándolo directamente en el espacio de parámetros de un Large Language Model (LLM)....
hace 8 meses
025.5K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: un modelo para transformar el lenguaje natural en consultas SQL de alta calidad

Introducción general OmniSQL es un proyecto de código abierto desarrollado por el equipo RUCKBReasoning y alojado en GitHub. Su función principal es transformar las preguntas en lenguaje natural introducidas por el usuario en sentencias de consulta SQL de alta calidad , para ayudar a los usuarios fácilmente con el número de...
hace 7 meses
025.5K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: un backend de gestión local para Dify

Introducción completa Dify-Plus es una plataforma de desarrollo de aplicaciones de IA basada en el desarrollo secundario del proyecto de código abierto Dify. Añade un nuevo centro de gestión basado en Dify y optimiza la funcionalidad para escenarios empresariales. El proyecto fue inicialmente para uso interno de las empresas , y más tarde se encontró que la comunidad tiene necesidades similares,...
hace 7 meses
025.5K
PR Agent:自动化拉取请求分析工具

PR Agent: herramienta automatizada de análisis de pull requests

Introducción general PR-Agent es una herramienta de código abierto desarrollada por Qodo para automatizar el procesamiento de pull requests (solicitudes de extracción) mediante tecnología de IA. La herramienta es capaz de proporcionar retroalimentación automatizada, sugerencias y análisis para ayudar a los desarrolladores a realizar revisiones de código de manera más eficiente....
hace 9 meses
025.5K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 8 meses
025.5K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown editor: herramientas de diseño gráfico de WeChat sencillas y eficaces, una llave para pegar el artículo al número público de WeChat.

Introducción completa WeChat Markdown Editor (WeChat Markdown Editor) es una herramienta de diseño gráfico WeChat muy conciso diseñado para ayudar a los usuarios a crear fácilmente hermosas mensajes WeChat. El editor es compatible con todos los básicos Markdown ...
hace 9 meses
025.5K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: un modelo de audio de extremo a extremo para la interacción vocal en tiempo real

Introducción completa Baichuan-Audio es un proyecto de código abierto desarrollado por Baichuan Intelligence (baichuan-inc), alojado en GitHub, centrado en la tecnología de interacción de voz de extremo a extremo. El proyecto proporciona un marco completo de procesamiento de audio que permite ...
hace 8 meses
025.5K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: cargue una imagen y migre las funciones de retrato para generar diferentes estilos de imágenes

Introducción completa InstantID es una tecnología avanzada centrada en la generación de imágenes con estilos o poses personalizados en cuestión de segundos, al tiempo que garantiza un alto nivel de fidelidad utilizando una única imagen de identificación de referencia. La tecnología utiliza una solución basada en un modelo de difusión mediante la integración de imágenes faciales, mapas de puntos de referencia...
hace 1 año
025.4K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: dobles de IA entrenados localmente con recuerdos y hábitos personales.

Second Me es un proyecto de código abierto desarrollado por el equipo Mindverse que te permite crear una IA en tu ordenador que actúa como un "doble digital", aprendiendo tus patrones y hábitos de habla a través de tus palabras y recuerdos, y convirtiéndose en una persona inteligente que entiende tus...
hace 7 meses
025.4K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: modelo multimodal de código abierto para la comprensión de vídeos y rondas múltiples de diálogo

Introducción CogVLM2 es un modelo multimodal de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), basado en la arquitectura Llama3-8B, y cuyo objetivo es proporcionar un rendimiento comparable o incluso mejor que GPT-4V. El modelo permite la comprensión de imágenes, el diálogo...
hace 8 meses
025.4K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: herramienta de narración y edición automatizada generada por texto para cine y televisión

Introducción general NarratoAI es una herramienta totalmente automatizada que integra narración de películas y vídeos, edición automatizada, doblaje y generación de subtítulos. Se basa en la tecnología de modelado lingüístico a gran escala (LLM) para generar automáticamente copias y editar automáticamente vídeos con sus correspondientes locuciones y subtítulos, proporcionando a los usuarios un...
hace 1 año
025.4K
阿布量化交易系统:基于Python的开源量化交易平台

Abu quantitative trading system: plataforma de negociación cuantitativa de código abierto basada en Python

Introducción general Abu Quantitative Trading System es una plataforma de código abierto basada en Python. Fue creada por el usuario "bbfamily" para ayudar a los inversores a aplicar estrategias de negociación cuantitativa mediante código. El sistema soporta backtesting y trading de varios productos financieros como acciones, opciones, futuros y bitcoin. Es...
hace 7 meses
025.4K
Oliva:语音控制的多智能体产品搜索助手

Oliva: un asistente de búsqueda de productos con inteligencia múltiple controlado por voz

Introducción general Oliva es una herramienta de asistente multi-inteligencia de código abierto desarrollada por Deluxer en GitHub. Ayuda a los usuarios a buscar información sobre productos en la base de datos Qdrant mediante la colaboración de múltiples inteligencias IA. Su principal característica es que soporta la operación por voz....
hace 7 meses
025.4K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk: Asistente inteligente de búsqueda de empleo, colocación automatizada de CV (sólo en inglés)

Introducción general Auto_Jobs_Applier_AIHawk es una herramienta para automatizar la búsqueda de empleo utilizando tecnología de inteligencia artificial. Ayuda a los usuarios a automatizar el envío de un gran número de CV en un corto periodo de tiempo y a personalizarlos según su información personal y sus intenciones de búsqueda de empleo. La herramienta está diseñada...
hace 10 meses
025.4K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

ModelBest: el líder mundial en modelos grandes ligeros y de alto rendimiento de extremo a extremo

Introducción general ModelBest es una empresa centrada en el desarrollo de grandes modelos ligeros y de alto rendimiento, y se dedica a aplicar tecnologías avanzadas de IA a la electrónica de consumo convencional y a todo tipo de dispositivos finales de la vida cotidiana. Su serie MiniCPM de modelos finales con extrema potencia aritmética y eficiencia en el uso de la memoria...
hace 12 meses
025.3K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: un sistema avanzado de recuperación de IA (RAG) para el análisis sintáctico de contenidos multimodales y la combinación del grafo de conocimiento con la búsqueda híbrida

Introducción completa R2R (RAG to Riches) es un sistema avanzado de recuperación de IA que admite la funcionalidad de generación aumentada de recuperación (RAG) con características listas para la producción. Construido sobre una API RESTful en contenedores, el sistema proporciona análisis de contenido multimodal, funcionalidad de búsqueda híbrida...
hace 10 meses
025.3K