Proyecto AI de código abierto

Total 1020 artículos
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.

Introducción completa PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Admite el reconocimiento de más de 80 idiomas y proporciona herramientas de anotación y síntesis de datos para...
hace 12 meses
049.1K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...
hace 7 meses
048.7K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: herramienta de pizarra virtual estilo dibujo a mano | Diagrama de flujo de generación de texto basado en IA | Tutoriales de Excalidraw

Excalidraw Descripción General Excalidraw es una herramienta de dibujo de pizarra virtual de código abierto que le permite dibujar fácilmente diagramas con un estilo dibujado a mano. Puede utilizar Excalidraw para crear hermosas ilustraciones de estilo dibujado a mano, diagramas...
hace 1 año
048.5K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: los documentos PDF se traducirán a herramientas bilingües de código abierto

Introducción general BabelDOC es una herramienta de código abierto diseñada para traducir documentos PDF a un formato bilingüe. Está desarrollado por el equipo funstory-ai , alojado en GitHub , sirviendo principalmente a la necesidad de tratar con usuarios de documentos en lenguas extranjeras , como investigadores...
hace 6 meses
048.5K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: herramienta asíncrona de código abierto para extraer datos estructurados sin LLM

Introducción general Crawl4AI es una herramienta de rastreo web asíncrona de código abierto diseñada para grandes modelos lingüísticos (LLM) y aplicaciones de inteligencia artificial (IA). Simplifica el rastreo web y el proceso de extracción de datos, soporta el rastreo web eficiente, y proporciona formatos de salida LLM-amigable para...
hace 1 año
048.4K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: Creación de tablas inteligentes en múltiples bases de datos, alternativa de código abierto a Airtable

Introducción general NocoDB es una alternativa de código abierto a Airtable diseñada para proporcionar una herramienta de gestión de bases de datos en línea potente y fácil de usar. Con NocoDB, los usuarios pueden crear, leer, actualizar y eliminar fácilmente datos de bases de datos sin escribir código. La plataforma soporta ...
hace 1 año
048.2K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir eBooks en múltiples formatos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de e...
hace 11 meses
048.2K
OpenSPG:开源知识图谱引擎

OpenSPG: motor de grafos de conocimiento de código abierto

Introducción OpenSPG es un motor de grafos de conocimiento de código abierto desarrollado por Ant Group en colaboración con OpenKG, basado en el marco SPG (Semantic Augmented Programmable Graph). El motor está diseñado para proporcionar características tales como la representación semántica explícita, la definición de reglas lógicas y el marco operativo para apoyar la construcción y gestión de grafos de conocimiento de dominio...
hace 1 año
048K
Suna:集成浏览器操作与数据分析的智能代理

Suna: agentes inteligentes que integran operaciones de navegación y análisis de datos

Introducción general Suna es un agente de IA de propósito general de código abierto desarrollado por Kortix AI, alojado en GitHub, basado en la licencia Apache 2.0, que permite a los usuarios descargarlo, modificarlo y autoalojarlo gratuitamente. Utiliza el diálogo en lenguaje natural para ayudar a los usuarios con...
hace 7 meses
047.9K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: descargador gratuito de cómics de código abierto, compatible con cómics en formato PDF, EPUB, CBR, CBZ para descargar.

Introducción general Comics Downloader es una herramienta de código abierto diseñada para ayudar a los usuarios a descargar cómics y tebeos de varios sitios web. La herramienta soporta una variedad de formatos de archivo, incluyendo PDF, EPUB, CBR y CBZ, permitiendo a los usuarios...
hace 11 meses
047.8K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: Asistente conversacional de IA para análisis de datos con acceso directo a respuestas, consultas SQL e informes analíticos

Introducción general WrenAI es un asistente SQL AI de código abierto diseñado específicamente para ayudar a los equipos de datos, equipos de productos y equipos de negocios a obtener información de datos a través de conversaciones en lenguaje natural. Es capaz de convertir el lenguaje natural en consultas SQL, generar gráficos, hojas de cálculo e informes,...
hace 11 meses
047.8K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Introducción Linly-Dubbing es una herramienta inteligente de traducción y doblaje multilingüe diseñada para proporcionar a los usuarios servicios de traducción de subtítulos y doblaje de vídeo multilingüe de alta calidad mediante la integración de tecnología avanzada de IA. La herramienta es especialmente adecuada para la educación internacional, la localización de contenidos globales y otros escenarios, ayudando...
hace 10 meses
047.7K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de preguntas y respuestas con base de conocimientos de inteligencia artificial para un servicio de atención al cliente inteligente y una base de conocimientos interna.

Introducción general MaxKB (Max Knowledge Base) es un sistema de preguntas y respuestas de base de conocimientos de código abierto basado en grandes modelos lingüísticos y RAG (Retrieval Augmented Generation). El sistema es ampliamente utilizado en el servicio al cliente inteligente, base de conocimiento interno de la empresa, la investigación académica y la educación y otros escenarios.MaxKB...
hace 10 meses
047.5K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Marco completo de generación de vídeo humano digital | Retrato a vídeo | Pose a vídeo | Sincronización de labios

Introducción general MuseV es un proyecto público en GitHub cuyo objetivo es la generación de vídeo avatar de longitud ilimitada y alta fidelidad. Se basa en la tecnología de difusión y proporciona Image2Video, Text2Image2Video, Video2Video...
hace 12 meses
047.4K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: plataforma de observación y depuración de código abierto para aplicaciones LLM

Introducción general Langfuse es una plataforma de ingeniería LLM (Large Language Model) de código abierto. Ayuda a los desarrolladores a rastrear, depurar y optimizar aplicaciones LLM proporcionando herramientas para observar llamadas, gestionar palabras clave, ejecutar experimentos y evaluar resultados. La plataforma ha sido desarrollada por el equipo Langfuse...
hace 8 meses
047.3K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本

Restablecer Cursor: Un script para restablecer el identificador de dispositivo para las versiones de Cursor 0.45.x y superiores.

Descripción General Cursor Reset es una herramienta de scripting PowerShell para resetear identificadores de dispositivos en el IDE de Cursor, soportando la versión 0.45.x de Cursor. La herramienta está diseñada para ayudar a los usuarios a restablecer los identificadores de dispositivo en el IDE de Cursor....
hace 10 meses
047.2K
E2B:安全云沙箱中的AI代码运行平台

E2B: plataforma de ejecución de código de inteligencia artificial en un entorno seguro en la nube

Introducción general E2B es una plataforma de código abierto diseñada para ejecutar código generado por IA en un entorno seguro en la nube. Es compatible con una amplia gama de lenguajes y marcos de programación y proporciona un entorno virtual aislado para garantizar la seguridad y la fiabilidad de la ejecución del código.
hace 11 meses
047.2K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: un motor RAG de código abierto basado en la comprensión profunda de los documentos, que proporciona flujos de trabajo de generación eficientes y mejorados por la recuperación.

Introducción exhaustiva RAGFlow es un motor de generación aumentada de recuperación (RAG) de código abierto basado en la tecnología de comprensión profunda de documentos. Proporciona un flujo de trabajo RAG eficiente para empresas de todos los tamaños, incorporando un modelo de lenguaje a gran escala (LLM) que puede proporcionar datos en formatos complejos basados en...
hace 10 meses
047.1K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: Plataforma de desarrollo de aplicaciones de IA generativa, orquestación visual, soporte de despliegue privado

Introducción completa Dify es una plataforma de desarrollo de aplicaciones de IA generativa de código abierto diseñada para ayudar a los desarrolladores a construir y operar rápidamente aplicaciones nativas de IA basadas en Grandes Modelos de Lenguaje (LLMs). La plataforma proporciona todo, desde la construcción de agentes hasta la orquestación de flujos de trabajo de IA, la recuperación de RAG...
hace 10 meses
046.9K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter: implementación con un solo clic de la herramienta de exportación de artículos por lotes de números públicos de wechat

Introducción completa wechat-article-exporter es una herramienta de código abierto diseñada para ayudar a los usuarios a exportar por lotes artículos WeChat número público. La herramienta es compatible con la exportación de audio y vídeo incrustado en el artículo sin la construcción de cualquier entorno , puede 100% restaurar el estilo del artículo , y el apoyo a la parte privada ...
hace 1 año
046.9K
Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Introducción completa Smolagents es una biblioteca ligera de agentes inteligentes desarrollada por HuggingFace que se centra en simplificar el proceso de desarrollo de sistemas de agentes de IA. El proyecto es conocido por su simplicidad en la filosofía de diseño, con sólo alrededor de 1000 líneas de código del núcleo, sin embargo, proporciona potentes capacidades de integración de características. Es más ...
hace 11 meses
046.9K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: herramienta de conversión de voz a texto en tiempo real para el reconocimiento del habla en streaming de baja latencia basada en Whisper.

Introducción general RealtimeSTT es una eficaz biblioteca de conversión de voz a texto en tiempo real de baja latencia con detección avanzada de la actividad del habla y activación de la palabra de despertador. Ha sido desarrollada por Kolja Beigel para dar soporte a aplicaciones que requieren una conversión de voz a texto...
hace 10 meses
046.8K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboración multiagente para el asistente de explotación de dispositivos móviles

Introducción general MobileAgent es un potente asistente de operación de dispositivos móviles diseñado para mejorar la eficiencia y la automatización de la operación de dispositivos móviles a través de la colaboración multi-agente y módulos de percepción visual mejorada. Está desarrollado por el equipo de X-PLUG y es compatible con Android y ...
hace 10 meses
046.8K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: un marco de recuperación de conocimientos multisalto basado en la memoria a largo plazo

Introducción general HippoRAG es un marco de código abierto desarrollado por el grupo OSU-NLP de la Ohio State University, inspirado en los mecanismos de la memoria humana a largo plazo. Combina técnicas de Retrieval Augmented Generation (RAG), Knowledge Graph y Personalised PageRank para ayudar a los grandes modelos lingüísticos...
hace 9 meses
046.7K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: un sistema de mejora de la memoria basado en la extensión de código Roo

Introducción completa RooFlow es una herramienta de programación asistida por IA de código abierto con la funcionalidad principal de preservar el código, las decisiones y el progreso de las tareas durante el desarrollo mediante el registro de proyectos. Se basa en la extensión Roo Code e integra cinco modos: arquitectura, codificación, pruebas, depuración y preguntas y respuestas. Estos modos inter...
hace 7 meses
046.6K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: un marco de código abierto para ejecutar inteligencias IA para navegar por la web, permitiendo a la IA manipular automáticamente las páginas web.

Introducción general Browser Use Web UI es un innovador proyecto de código abierto centrado en proporcionar a los agentes de IA capacidades de interacción con el navegador como herramienta de interfaz gráfica. El proyecto está construido sobre el núcleo del framework browser-use, construido con Gradio ...
hace 6 meses
046.3K
Void:基于VSCode的开源Cursor替代品

Void: alternativa de código abierto a Cursor basada en VSCode

Introducción general Void es una alternativa de código abierto a Cursor basada en una rama del repositorio vscode. Proporciona un potente entorno de desarrollo diseñado para proporcionar a los desarrolladores una experiencia de codificación más eficiente.El objetivo de Void es mejorar continuamente su funcionalidad y estabilidad a través de las contribuciones de la comunidad y la rápida iteración....
hace 1 año
046.2K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1: Generación de vídeo de alta calidad en GPU de consumo

Introducción completa Wan2.1 es un conjunto de herramientas de generación de vídeo desarrollado por el equipo de Wan-Video y de código abierto en GitHub, centrado en ampliar los límites de la creación de vídeo mediante técnicas de inteligencia artificial. Se basa en una arquitectura de transformador de difusión avanzada que integra un sistema de...
hace 9 meses
046.1K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Descarga rápidamente WeChat Video No. de vídeo, soporta múltiples formatos y plataformas

Introducción completa WeChat Video No. Downloader es un proyecto de código abierto diseñado para ayudar a los usuarios a descargar rápidamente el contenido de vídeo de los números de vídeo WeChat. La herramienta es compatible con una gran variedad de formatos de vídeo y plataformas, y los usuarios pueden utilizarla fácilmente en sistemas Windows y macOS. El proyecto está desarrollado por ltaoo y alojado en...
hace 11 meses
046K
RF-DETR:实时视觉对象检测开源模型

RF-DETR: un modelo de código abierto para la detección visual de objetos en tiempo real

Introducción general RF-DETR es un modelo de detección de objetos de código abierto desarrollado por el equipo Roboflow. Se basa en la arquitectura Transformer y su característica principal es la eficiencia en tiempo real. Por primera vez, el modelo alcanza más de 60 AP de tiempo real en el conjunto de datos COCO de Microsoft....
hace 8 meses
046K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google lanza un protocolo abierto para la comunicación entre inteligencias artificiales

Introducción general A2A (Agent2Agent) es un protocolo de código abierto desarrollado por Google para permitir que las inteligencias artificiales desarrolladas por diferentes marcos o proveedores se comuniquen y colaboren entre sí. Proporciona un conjunto estandarizado de métodos para que las inteligencias descubran las capacidades de las demás, compartan tareas y completen el trabajo....
hace 8 meses
046K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: proyecto de código abierto para generar gráficos vectoriales SVG a partir de texto e imágenes

Introducción general OmniSVG es un proyecto de código abierto centrado en la generación de gráficos vectoriales (SVG) de alta calidad mediante un modelo multimodal. Utiliza modelos visual-lingüísticos preentrenados para apoyar la generación de SVG a partir de descripciones textuales o entradas de imágenes, cubriendo una amplia gama de escenarios, desde simples iconos hasta complejos personajes de anime. Elementos ...
hace 8 meses
045.9K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive: grabación en directo no supervisada y autocorte, herramienta de carga para la estación B

Introducción bilive es una herramienta diseñada para la grabación en directo de estaciones B, que proporciona una grabación en directo extremadamente rápida, corte automático, renderización de ventanas emergentes y generación de subtítulos. La herramienta es compatible con máquinas de configuración ultrabaja, soporta grabación desatendida 7x24 horas, identifica y renderiza automáticamente pop-ups y subtítulos, trocea y...
hace 10 meses
045.9K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: herramienta dinámica de construcción y consulta de grafos de conocimiento (programa de memoria larga consciente del tiempo)

Introducción general Graphiti es una herramienta desarrollada por getzep para construir y consultar grafos de conocimiento dinámicos y temporales. Es capaz de representar relaciones complejas y evolutivas entre entidades y consultarlas mediante diversos métodos, como algoritmos temporales, de texto completo, semánticos y de grafos.Grap...
hace 9 meses
045.8K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: una plantilla de código abierto para crear rápidamente un entorno local de IA

Introducción completa El n8n Self-Hosted AI Starter Kit es una plantilla Docker Compose de código abierto diseñada para inicializar rápidamente una IA local completa y un entorno de desarrollo de código bajo. Creado por el equipo de n8n, el paquete combina la plataforma autoalojada n8n con una gama de...
hace 10 meses
045.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: sistema de diálogo inteligente para personas digitales que combina grandes modelos lingüísticos y modelos visuales para nuevas experiencias interactivas.

Introducción general Linly-Talker es un innovador sistema digital de diálogo humano que combina grandes modelos lingüísticos (LLM) con modelos visuales para crear un enfoque novedoso de la interacción persona-ordenador. El sistema integra diversas tecnologías como Whisper, Linly, Micros...
hace 10 meses
045.5K
Qlib:微软开发的AI量化投资研究工具

Qlib: una herramienta de investigación cuantitativa de inversiones desarrollada por Microsoft

Introducción general Qlib es una plataforma de código abierto desarrollada por Microsoft que se centra en el uso de la tecnología de IA para ayudar a los usuarios a investigar inversiones cuantitativas. Parte del procesamiento de datos más básico y ayuda a los usuarios a explorar ideas de inversión y convertirlas en estrategias utilizables. La plataforma es sencilla y fácil de usar, y es adecuada para quienes deseen utilizar el aprendizaje automático para mejorar su investigación de inversiones....
hace 8 meses
045.3K
Onyx:连接企业知识库的智能AI聊天平台

Onyx: una plataforma de chat inteligente que conecta las bases de conocimiento de las empresas

Introducción general Onyx (antes conocido como Danswer) es una plataforma de chat de IA de código abierto desarrollada por el equipo onyx-dot-app para ayudar a las organizaciones a integrar y gestionar documentos, aplicaciones y datos de empleados. Proporciona una rica funcionalidad de chat con soporte para conectar cualquier Large Language Model (LLM...
hace 9 meses
045.2K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt: descargador universal de vídeos, YouTube, Vimeo, Twitter, Reddit, SoundCloud ¡y mucho más!

Introducción general A menudo tengo que descargar vídeos de YouTube y Twitter, así que encontré este descargador de vídeo gratuito y sin publicidad.Cobalt es un descargador multimedia de código abierto diseñado para proporcionar una experiencia de descarga fácil de usar. Admite la descarga de contenidos de vídeo y audio desde múltiples plataformas, incluyendo...
hace 11 meses
045.1K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: un complemento de código abierto que impulsa las pruebas de automatización del navegador con IA

Introducción general Midscene.js es una herramienta de automatización del navegador impulsada por IA que controla páginas web, realiza aserciones y extrae datos a través de comandos de lenguaje natural. Es compatible con extensiones de Chrome, SDK de JavaScript y scripts YAML, lo que simplifica la medición de la IU....
hace 10 meses
044.9K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: un marco de colaboración multiinteligencia para la creación de equipos de desarrollo de software de IA para la programación en lenguaje natural

Introducción exhaustiva MetaGPT es un innovador marco de trabajo para organismos multiinteligencia diseñado para simular el funcionamiento de una empresa de software de IA completa. Creado por geekan (Alexander Wu), el objetivo del proyecto es combinar modelos GPT con diferentes roles en una entidad colaborativa....
hace 9 meses
044.9K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix: empaquetado de la base de código en un archivo de texto para la recuperación de modelos de gran tamaño.

Introducción general Repomix (antes conocido como Repopack) es una herramienta de código abierto diseñada para empaquetar todo un código base en un único archivo compatible con IA. Esta herramienta permite a los desarrolladores poner fácilmente su código base a disposición de grandes modelos lingüísticos (como Claude, Chat...
hace 10 meses
044.8K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: un marco RAG de código abierto para la construcción basada en grafos de conocimiento, aprendizaje de prompts básicos

Introducción general Cognee es una solución de capa de datos fiable diseñada para aplicaciones de IA y agentes de IA. Diseñado para cargar y construir contextos LLM (Large Language Models) para crear soluciones de IA precisas e interpretables a través de grafos de conocimiento y almacenes de vectores. El marco de trabajo favorece el ahorro de costes,...
hace 10 meses
044.5K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: AI Generated PPT, Generación de presentaciones

Introducción completa AiPPT es una herramienta de generación de PPT basada en tecnología de inteligencia artificial, diseñada para ayudar a los usuarios a crear rápidamente presentaciones profesionales. Genera automáticamente diapositivas ricas en contenido y bellamente diseñadas introduciendo temas, cargando archivos o proporcionando URL, etc. Es compatible con gráficos nativos, animaciones y...
hace 9 meses
044.4K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 9 meses
044.3K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: creación de multiinteligentes de ejecución autónoma, un marco de desarrollo de organismos inteligentes de IA de código abierto totalmente funcional

Introducción general Eliza es un marco avanzado de desarrollo de múltiples cuerpos inteligentes (Multi-Agente) , se compromete a simplificar la construcción y el despliegue del proceso de cuerpo inteligente autónomo (Agente Autónomo) . Soporta el despliegue de múltiples cuerpos inteligentes con diferentes configuraciones de roles , puede lograr ...
hace 11 meses
044.2K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio: versión con interfaz fácil de usar del sistema multiagente AutoGen

Descripción general AutoGen Studio 2.0 es una interfaz de usuario impulsada por AutoGen diseñada para simplificar el proceso de creación y gestión de soluciones multiagente. La plataforma permite a los usuarios definir y modificar de forma declarativa los agentes y sus flujos de trabajo a través de una interfaz intuitiva....
hace 10 meses
044.1K
Abogen:将多种文本格式转换为有声读物的工具

Abogen: una herramienta para convertir múltiples formatos de texto en audiolibros

Introducción general Abogen es una herramienta de código abierto diseñada para convertir rápidamente archivos ePub, PDF o de texto plano en audio de alta calidad. Utiliza el modelo Kokoro-82M para generar un habla natural y fluida, y admite la generación simultánea de subtítulos, lo que resulta idóneo para producir audiolibros....
hace 7 meses
044.1K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: Asistente de Código Inteligente Contextualizado, Generación y Modificación de Código, Soporte Multi-IDE

Introducción general J.A.R.V.I.S. (Just A Rather Very Intelligent System) es un asistente de código inteligente diseñado para ayudar a los desarrolladores en la generación, modificación y discusión técnica de código utilizando múltiples modelos de lenguaje de última generación....
hace 11 meses
043.9K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código abierto para la eliminación por lotes de fondos de imágenes y vídeos, optimizado para RMBG 2.0

Introducción general RMBG-2-Studio es una aplicación mejorada de eliminación y sustitución de fondos desarrollada sobre la base del modelo BRIA-RMBG-2.0. La aplicación está diseñada para proporcionar a los usuarios capacidades de procesamiento de fondo de imagen eficientes y precisas para una variedad de tipos de imágenes, incluyendo comercio electrónico, juegos y...
hace 12 meses
043.9K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: marco de código abierto para la inferencia y planificación de la conducción autónoma de Xiaomi

Introducción Orion es un proyecto de código abierto desarrollado por Xiaomi Labs, centrado en la tecnología de conducción autónoma de extremo a extremo (E2E). Resuelve el problema del insuficiente razonamiento causal en escenarios complejos por parte de los métodos tradicionales de conducción autónoma mediante modelos de lenguaje visual (VLM) y planificadores generativos.Orion integra largas...
hace 8 meses
043.9K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: herramienta profesional de creación de ilustraciones manga de cuatro paneles, generación de imágenes, edición de páginas manga

Introducción general SP-MangaEditer es una plataforma independiente de edición de manga diseñada para creadores de manga. La plataforma soporta generación de imágenes, edición por capas, ajuste de imágenes, aplicación de filtros y muchas otras funciones para ayudar a los usuarios a crear fácilmente ilustraciones manga de alta calidad. Los usuarios pueden manipular...
hace 11 meses
043.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Una interfaz fácil de usar para ComfyUI para agilizar el flujo de trabajo

Introducción general ComfyUI-disty-Flow es un nodo personalizado que proporciona una interfaz de usuario amigable para ComfyUI. Está pensado para simplificar la ejecución de flujos de trabajo proporcionando una interfaz de usuario alternativa a la creación de flujos de trabajo.ComfyUI-disty...
hace 10 meses
043.8K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: un modelo de lenguaje visual experto para la comprensión multimodal avanzada

Introducción exhaustiva DeepSeek-VL2 es una serie de modelos avanzados de lenguaje visual Mixture-of-Experts (MoE) que mejoran significativamente el rendimiento de su predecesor, DeepSeek-VL. Los modelos son útiles en preguntas y respuestas visuales, reconocimiento óptico de caracteres,...
hace 10 meses
043.7K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: un marco de inteligencia colaborativa multirol para simplificar tareas complejas

Introducción exhaustiva CrewAI es un marco avanzado diseñado para orquestar la colaboración entre agentes de rol y de IA autónoma. Al facilitar la inteligencia colaborativa, CrewAI permite a los agentes trabajar juntos sin problemas para resolver tareas complejas. Tanto si está creando una plataforma de asistente inteligente, automatizando equipos de atención al cliente o...
hace 11 meses
043.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Convierta rápidamente los repositorios de código de Github en texto apto para la comprensión del LLM

Introducción general GitIngest es una herramienta de código abierto diseñada para transformar los repositorios de código de GitHub en texto adecuado para las sugerencias de Large Language Model (LLM). Con una sencilla operación, los usuarios pueden extraer y formatear el contenido de cualquier repositorio de GitHub para adaptarlo al LLM...
hace 12 meses
043.6K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: framework backend basado en SpringBoot para chat y dibujo con inteligencia artificial

Introducción completa RuoYi AI es un proyecto back-end basado en el marco ruoyi-plus , centrándose en la integración de chat AI y funciones de pintura . Es completamente de código abierto y gratuito , utilizando Java17 y SpringBoot 3.X pila de tecnología , backend de gestión ...
hace 9 meses
043.5K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror: despliegue en un clic de sitios espejo Grok rentables

Introducción completa Grok-Mirror es una estación de espejo doméstica Grok3 de despliegue rápido sin servidor basada en la construcción de una estación de espejo Grok operable. Permite a los usuarios implementar quioscos Grok locales con un solo clic a través de Docker.Grok es una inteligencia artificial de xAI...
hace 8 meses
043.5K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: herramienta de código abierto para extraer el vídeo para especificar el retrato de destino, generar el vídeo de retrato de destino

Introducción general MatAnyone es un proyecto de código abierto centrado en la codificación de vídeo, desarrollado y publicado en GitHub por un equipo de investigación de S-Lab, Universidad Tecnológica de Nanyang, Singapur. Proporciona a los usuarios capacidades de procesamiento de vídeo estables y eficientes mediante técnicas de propagación de memoria coherente, especialmente...
hace 9 meses
043.5K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: herramienta de código abierto de Tencent para la generación de modelos 3D de alta resolución

Introducción general Hunyuan3D-2 es un proyecto de código abierto desarrollado por Tencent para generar modelos 3D de alta resolución a partir de texto o imágenes. Consta de dos componentes principales: modelo de generación de formas (Hunyuan3D-DiT) y modelo de generación de texturas (Hunyuan3D...
hace 8 meses
043.5K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: modelo experimental de conversión de texto en voz, TTS implementado mediante un enfoque de modelado lingüístico puro.

Introducción general OuteTTS es un modelo experimental de conversión de texto en habla (TTS) que utiliza un enfoque de modelado lingüístico puro para generar habla de alta calidad. A diferencia de los sistemas TTS tradicionales, OuteTTS no requiere adaptadores externos ni arquitecturas complejas. El modelo se basa en la arquitectura LLaMa...
hace 10 meses
043.4K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: Construcción de un marco para inteligencias multimodales con memoria, conocimiento y herramientas

Introducción general Agno es una biblioteca Python de código abierto desarrollada por el equipo agno-agi y alojada en GitHub, dedicada a facilitar a los desarrolladores la creación de inteligencias IA con memoria, conocimientos y herramientas. Es compatible con texto multimodal, imagen, audio y vídeo....
hace 9 meses
043.4K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser: API automatizada de navegación web para crear inteligencia y aplicaciones que controlen el funcionamiento del navegador.

Introducción general Steel Browser es una API de navegador de código abierto diseñada para agentes y aplicaciones de IA. Proporciona una instancia de navegador completa que permite a los usuarios automatizar operaciones web sin preocuparse por la infraestructura.Steel Browser soporta...
hace 12 meses
043.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversión de imágenes a Markdown, modelo visual OCR de alta precisión

Introducción general Zerox es un proyecto de código abierto diseñado para convertir PDF, DOCX, imágenes y otros documentos a formato Markdown a través de modelos visuales. El proyecto ha sido desarrollado por el equipo getomni-ai y proporciona una solución OCR (Reconocimiento Óptico de Caracteres) sencilla y eficiente.
hace 10 meses
043.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: herramienta de código abierto para el intercambio de rostros en tiempo real con IA, una foto para el intercambio de rostros en tiempo real

Introducción general Deep Live Cam es una herramienta de inteligencia artificial de código abierto diseñada para permitir la sustitución de caras en tiempo real y la generación de vídeos falsos a partir de una sola foto. Utilizando algoritmos avanzados de aprendizaje profundo, la herramienta es capaz de reemplazar caras en tiempo real durante transmisiones en directo o videollamadas, protegiendo la privacidad del usuario y añadiendo diversión...
hace 1 año
043.3K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: complemento del asistente web para el diálogo nativo con modelos de IA y la recuperación de documentos

Introducción general Page Assist es una extensión de navegador de código abierto diseñada para proporcionar a los usuarios una forma sencilla de interactuar con modelos locales de IA. Con esta extensión, los usuarios pueden abrir una barra lateral en cualquier página web para interactuar con modelos de IA que se ejecutan localmente.Page Assi...
hace 8 meses
043.1K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: el asistente inteligente de código abierto de LangChain para la investigación profunda

Introducción exhaustiva Open Deep Research es un asistente de investigación basado en web capaz de generar informes de investigación exhaustivos sobre cualquier tema. El sistema utiliza un flujo de trabajo de "planificar y hacer" que permite a los usuarios planificar y revisar la estructura del informe antes de pasar a la fase de investigación, que lleva mucho tiempo...
hace 8 meses
043.1K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: una herramienta de código abierto para optimizar las palabras clave de los modelos de IA convencionales.

Introducción general Prompt Optimizer es una herramienta de código abierto centrada en la optimización de palabras clave, desarrollada por linshenkx en GitHub. Ayuda a los usuarios a optimizar las palabras clave de los modelos de IA mediante algoritmos inteligentes, mejorando así la calidad del contenido generado...
hace 9 meses
042.9K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: Creación de una interfaz de arrastrar y soltar nodos para aplicaciones LLM personalizadas

Introducción general FlowiseAI es una herramienta de código abierto y bajo código diseñada para ayudar a los desarrolladores a crear aplicaciones LLM (Large Language Model) personalizadas y agentes de IA. Con una sencilla interfaz de arrastrar y soltar, los usuarios pueden crear e iterar rápidamente aplicaciones LLM, haciendo más eficiente el proceso desde las pruebas hasta la producción....
hace 10 meses
042.9K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

Esquemas: genera salidas de texto estructurado mediante expresiones regulares, JSON o modelos Pydantic.

Introducción general Outlines es una biblioteca de código abierto desarrollada por dottxt-ai para mejorar la aplicación de Large Language Models (LLMs) a través de la generación de texto estructurado. La biblioteca admite diversas integraciones de modelos, como OpenAI, transformadores...
hace 10 meses
042.8K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: un cliente de diálogo inteligente de escritorio basado en la API de Dify, que proporciona capacidades de diálogo AI de nivel empresarial.

Introducción general Dify-WebUI es una moderna aplicación de diálogo inteligente de escritorio basada en la API de Dify, diseñada para proporcionar a las empresas potentes capacidades de diálogo AI. La aplicación es compatible con una variedad de colores de temas preestablecidos para satisfacer las necesidades individuales de las empresas, y tiene una función de gestión de base de conocimientos para apoyar...
hace 11 meses
042.7K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): control mágico de la iluminación de la imagen, controla la luz y la sombra de la imagen y el fondo

Introducción general IC-Light es un proyecto para el control de la iluminación de imágenes que pretende manipular los efectos lumínicos de las imágenes mediante modelos avanzados de IA. Desarrollado por Lvmin Zhang et al, el proyecto ofrece dos modelos principales: un modelo de reiluminación condicional al texto y un modelo condicional al fondo. Los usuarios pueden pasar...
hace 12 meses
042.7K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: servicios MCP para controlar software CAD mediante comandos de lenguaje natural

Introducción General CAD-MCP es un proyecto de código abierto que permite a los usuarios controlar el software CAD a través de comandos de lenguaje natural para las operaciones de dibujo. Combina el procesamiento del lenguaje natural y la tecnología de automatización CAD , de modo que los usuarios no necesitan operar manualmente la interfaz CAD , basta con introducir comandos de texto simples que...
hace 7 meses
042.7K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: generación y evaluación automáticas de presentaciones PPT, documentos a PPT

Introducción general PPTAgent es un sistema innovador diseñado para generar automáticamente presentaciones a partir de documentos. El sistema se inspira en el enfoque humano de la creación de presentaciones, utilizando un proceso de dos pasos para garantizar la calidad del contenido y el impacto visual. Además, PPTAgent presenta PPTEval, un completo...
hace 10 meses
042.6K
小红书AI运营助手:自动生成和发布小红书文章

Asistente de operaciones Xiaohongshu AI: genera y publica automáticamente artículos Xiaohongshu.

Introducción completa Xiaohongshu AI Operation Assistant (xhsaipublisher) es una herramienta de automatización diseñada para publicar artículos en la plataforma Xiaohongshu. El proyecto combina una interfaz gráfica de usuario con scripts de automatización para generar contenido utilizando la tecnología big model e iniciar sesión y publicar automáticamente a través del navegador....
hace 11 meses
042.6K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: modelo de generación de activos 3D desarrollado por Microsoft, compatible con múltiples formatos y de edición flexible.

Introducción general TRELLIS es un modelo de generación de activos 3D a gran escala desarrollado por Microsoft. Es capaz de recibir indicaciones de texto o imágenes y generar activos 3D de alta calidad en diversos formatos, como campos radiales, gaussianos 3D y mallas.
hace 12 meses
042.6K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D con audio de personas digitales interactivas en tiempo real, que funcionan a 30 fps en la CPU.

Introducción general LiteAvatar es una herramienta de código abierto desarrollada por el equipo HumanAIGC (parte de Ali) que se centra en generar animaciones faciales a partir de avatares 2D controlados por audio en tiempo real. Funciona a 30 fotogramas por segundo (fps) dependiendo únicamente de la CPU, y está especialmente indicada para...
hace 9 meses
042.5K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

No estructurados: preprocesamiento de documentos no estructurados de código abierto, herramientas de tratamiento de datos no estructurados

Introducción completa Unstructured-IO proporciona un conjunto de componentes de código abierto para el procesamiento y preprocesamiento de imágenes y documentos de texto como PDF, HTML, documentos de Word, etc. Su principal objetivo es simplificar y optimizar los flujos de trabajo de procesamiento de datos, especialmente para grandes modelos de lenguaje (LL...
hace 1 año
042.4K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): proyecto de código abierto que imita a Perplexity, integrando diálogo AI, búsqueda web, consulta meteorológica, etc.

Introducción general MiniPerplx (rebautizado Scira) es un motor de búsqueda minimalista basado en IA que integra una variedad de características útiles para proporcionar a los usuarios una gama completa de servicios de recuperación de información. El proyecto utiliza una moderna pila tecnológica que incluye Next.js, Tailwi...
hace 11 meses
042.4K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: Monitoriza las actividades de los usuarios de OpenWebUI, gestiona los límites de uso, soporta el despliegue con un solo clic.

Introducción General OpenWebUI-Monitor es un panel de control para monitorizar las actividades de los usuarios de OpenWebUI y gestionar las cuotas de uso. Te permite establecer eficientemente cuotas de usuario, ver datos de usuario e información visual en tiempo real, soporta despliegue con un clic, y facilita la gestión y monitorización de usuarios....
hace 1 año
042.4K