Proyecto AI de código abierto

Total 1020 artículos
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: creador de flujos de trabajo de código abierto para agentes de IA

Introducción exhaustiva Sim Studio es una plataforma de código abierto para la creación de flujos de trabajo de agentes de IA que se centra en ayudar a los usuarios a diseñar, probar y desplegar rápidamente flujos de trabajo de modelos lingüísticos (LLM) a gran escala a través de una interfaz visual ligera e intuitiva. Los usuarios pueden crear flujos de trabajo complejos sin necesidad de programar...
hace 8 meses
068K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: Creación de tablas inteligentes en múltiples bases de datos, alternativa de código abierto a Airtable

Introducción general NocoDB es una alternativa de código abierto a Airtable diseñada para proporcionar una herramienta de gestión de bases de datos en línea potente y fácil de usar. Con NocoDB, los usuarios pueden crear, leer, actualizar y eliminar fácilmente datos de bases de datos sin escribir código. La plataforma soporta ...
hace 1 año
067.9K
Vexa:实时会议转录与智能知识提取工具

Vexa: una herramienta inteligente de transcripción de reuniones y extracción de conocimientos en tiempo real

Introducción completa Vexa es una plataforma de código abierto para la transcripción de reuniones en tiempo real y la gestión del conocimiento diseñada para proporcionar servicios eficientes de grabación de reuniones y extracción inteligente del conocimiento para empresas y particulares. Se une automáticamente a plataformas como Google Meet, Zoom, etc. mediante robots de reuniones basados en API....
hace 9 meses
067.6K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter: implementación con un solo clic de la herramienta de exportación de artículos por lotes de números públicos de wechat

Introducción completa wechat-article-exporter es una herramienta de código abierto diseñada para ayudar a los usuarios a exportar por lotes artículos WeChat número público. La herramienta es compatible con la exportación de audio y vídeo incrustado en el artículo sin la construcción de cualquier entorno , puede 100% restaurar el estilo del artículo , y el apoyo a la parte privada ...
hace 1 año
066.8K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicación de escritorio de Intelligentsia para controlar ordenadores mediante lenguaje natural

Introducción general UI-TARS Desktop es una aplicación de agente de interfaz gráfica basada en UI-TARS (Visual Language Model) desarrollada por ByteDance. La aplicación permite a los usuarios controlar los ordenadores a través del lenguaje natural para una interacción humano-ordenador más intuitiva y eficiente.UI-TAR...
hace 12 meses
066.6K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: descargador gratuito de cómics de código abierto, compatible con cómics en formato PDF, EPUB, CBR, CBZ para descargar.

Introducción general Comics Downloader es una herramienta de código abierto diseñada para ayudar a los usuarios a descargar cómics y tebeos de varios sitios web. La herramienta soporta una variedad de formatos de archivo, incluyendo PDF, EPUB, CBR y CBZ, permitiendo a los usuarios...
hace 1 año
066.6K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展

Plate: editor de texto enriquecido basado en inteligencia artificial y compatible con extensiones de plug-in enriquecidas.

Descripción general Plate es un editor de texto enriquecido impulsado por IA construido sobre React y TypeScript, diseñado para proporcionar una experiencia de edición altamente personalizable y extensible. Utiliza Slate.js en su núcleo, combinado con una moderna interfaz de usuario ...
hace 1 año
066.4K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: proyecto de código abierto de diálogo por IA que imita la interacción de la interfaz ChatGPT

Introducción general LibreChat es una plataforma de chat de IA gratuita y de código abierto con amplias opciones de personalización y soporte para múltiples proveedores, servicios e integraciones de IA. Reúne todas las conversaciones de IA en un solo lugar con una interfaz familiar y características innovadoras, soportando múltiples modelos de IA, plugins y múltiples idiomas. Por...
hace 1 año
066.2K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir eBooks en múltiples formatos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de e...
hace 1 año
066K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: un motor RAG de código abierto basado en la comprensión profunda de los documentos, que proporciona flujos de trabajo de generación eficientes y mejorados por la recuperación.

Introducción exhaustiva RAGFlow es un motor de generación aumentada de recuperación (RAG) de código abierto basado en la tecnología de comprensión profunda de documentos. Proporciona un flujo de trabajo RAG eficiente para empresas de todos los tamaños, incorporando un modelo de lenguaje a gran escala (LLM) que puede proporcionar datos en formatos complejos basados en...
hace 12 meses
065.7K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: plataforma de observación y depuración de código abierto para aplicaciones LLM

Introducción general Langfuse es una plataforma de ingeniería LLM (Large Language Model) de código abierto. Ayuda a los desarrolladores a rastrear, depurar y optimizar aplicaciones LLM proporcionando herramientas para observar llamadas, gestionar palabras clave, ejecutar experimentos y evaluar resultados. La plataforma ha sido desarrollada por el equipo Langfuse...
hace 10 meses
065.5K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.

Introducción completa PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Admite el reconocimiento de más de 80 idiomas y proporciona herramientas de anotación y síntesis de datos para...
hace 1 año
065.3K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: proyecto de código abierto para generar gráficos vectoriales SVG a partir de texto e imágenes

Introducción general OmniSVG es un proyecto de código abierto centrado en la generación de gráficos vectoriales (SVG) de alta calidad mediante un modelo multimodal. Utiliza modelos visual-lingüísticos preentrenados para apoyar la generación de SVG a partir de descripciones textuales o entradas de imágenes, cubriendo una amplia gama de escenarios, desde simples iconos hasta complejos personajes de anime. Elementos ...
hace 9 meses
064.9K
RF-DETR:实时视觉对象检测开源模型

RF-DETR: un modelo de código abierto para la detección visual de objetos en tiempo real

Introducción general RF-DETR es un modelo de detección de objetos de código abierto desarrollado por el equipo Roboflow. Se basa en la arquitectura Transformer y su característica principal es la eficiencia en tiempo real. Por primera vez, el modelo alcanza más de 60 AP de tiempo real en el conjunto de datos COCO de Microsoft....
hace 10 meses
064.7K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: la API del modelo Gemini es compatible con el formato OpenAI, desbloquea las restricciones regionales y admite el sondeo de claves multiAPI.

Introducción completa Gemini Balance es un servicio proxy de API OpenAI desarrollado sobre la base del marco FastAPI, con el objetivo de proporcionar una gestión eficaz de claves multiAPI y funciones de optimización. El proyecto es compatible con las llamadas al modelo Gemini, y entre sus principales...
hace 9 meses
064.6K
Void:基于VSCode的开源Cursor替代品

Void: alternativa de código abierto a Cursor basada en VSCode

Introducción general Void es una alternativa de código abierto a Cursor basada en una rama del repositorio vscode. Proporciona un potente entorno de desarrollo diseñado para proporcionar a los desarrolladores una experiencia de codificación más eficiente.El objetivo de Void es mejorar continuamente su funcionalidad y estabilidad a través de las contribuciones de la comunidad y la rápida iteración....
hace 1 año
064.2K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: herramienta de código abierto de Tencent para la generación de modelos 3D de alta resolución

Introducción general Hunyuan3D-2 es un proyecto de código abierto desarrollado por Tencent para generar modelos 3D de alta resolución a partir de texto o imágenes. Consta de dos componentes principales: modelo de generación de formas (Hunyuan3D-DiT) y modelo de generación de texturas (Hunyuan3D...
hace 10 meses
064.2K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: sistema de diálogo inteligente para personas digitales que combina grandes modelos lingüísticos y modelos visuales para nuevas experiencias interactivas.

Introducción general Linly-Talker es un innovador sistema digital de diálogo humano que combina grandes modelos lingüísticos (LLM) con modelos visuales para crear un enfoque novedoso de la interacción persona-ordenador. El sistema integra diversas tecnologías como Whisper, Linly, Micros...
hace 11 meses
064.1K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: una herramienta de código abierto para optimizar las palabras clave de los modelos de IA convencionales.

Introducción general Prompt Optimizer es una herramienta de código abierto centrada en la optimización de palabras clave, desarrollada por linshenkx en GitHub. Ayuda a los usuarios a optimizar las palabras clave de los modelos de IA mediante algoritmos inteligentes, mejorando así la calidad del contenido generado...
hace 11 meses
063.4K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: herramienta de conversión de voz a texto en tiempo real para el reconocimiento del habla en streaming de baja latencia basada en Whisper.

Introducción general RealtimeSTT es una eficaz biblioteca de conversión de voz a texto en tiempo real de baja latencia con detección avanzada de la actividad del habla y activación de la palabra de despertador. Ha sido desarrollada por Kolja Beigel para dar soporte a aplicaciones que requieren una conversión de voz a texto...
hace 12 meses
063.4K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: evaluación de la memoria RAG Precisión de la GC y correlación de respuestas

Introducción exhaustiva Ragas es una herramienta diseñada específicamente para evaluar y optimizar sistemas de Generación Aumentada de Recuperación (RAG). Proporciona un amplio conjunto de métricas de evaluación mediante el análisis de las relaciones entre consultas, contextos de recuperación y respuestas generadas. Estas métricas incluyen fidelidad, relevancia de la respuesta, relevancia del contexto, on...
hace 12 meses
063.3K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: Asistente conversacional de IA para análisis de datos con acceso directo a respuestas, consultas SQL e informes analíticos

Introducción general WrenAI es un asistente SQL AI de código abierto diseñado específicamente para ayudar a los equipos de datos, equipos de productos y equipos de negocios a obtener información de datos a través de conversaciones en lenguaje natural. Es capaz de convertir el lenguaje natural en consultas SQL, generar gráficos, hojas de cálculo e informes,...
hace 1 año
063.2K
OpenSPG:开源知识图谱引擎

OpenSPG: motor de grafos de conocimiento de código abierto

Introducción OpenSPG es un motor de grafos de conocimiento de código abierto desarrollado por Ant Group en colaboración con OpenKG, basado en el marco SPG (Semantic Augmented Programmable Graph). El motor está diseñado para proporcionar características tales como la representación semántica explícita, la definición de reglas lógicas y el marco operativo para apoyar la construcción y gestión de grafos de conocimiento de dominio...
hace 1 año
063.2K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: Construcción de un marco para inteligencias multimodales con memoria, conocimiento y herramientas

Introducción general Agno es una biblioteca Python de código abierto desarrollada por el equipo agno-agi y alojada en GitHub, dedicada a facilitar a los desarrolladores la creación de inteligencias IA con memoria, conocimientos y herramientas. Es compatible con texto multimodal, imagen, audio y vídeo....
hace 10 meses
063K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Marco completo de generación de vídeo humano digital | Retrato a vídeo | Pose a vídeo | Sincronización de labios

Introducción general MuseV es un proyecto público en GitHub cuyo objetivo es la generación de vídeo avatar de longitud ilimitada y alta fidelidad. Se basa en la tecnología de difusión y proporciona Image2Video, Text2Image2Video, Video2Video...
hace 1 año
062.8K
Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Introducción completa Smolagents es una biblioteca ligera de agentes inteligentes desarrollada por HuggingFace que se centra en simplificar el proceso de desarrollo de sistemas de agentes de IA. El proyecto es conocido por su simplicidad en la filosofía de diseño, con sólo alrededor de 1000 líneas de código del núcleo, sin embargo, proporciona potentes capacidades de integración de características. Es más ...
hace 1 año
062.4K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: una aplicación de traducción de voz en tiempo real para Android, ¡gratis y sin conexión!

Introducción general RTranslator es una aplicación de traducción en tiempo real, prácticamente gratuita y de código abierto diseñada para dispositivos Android. Los usuarios pueden mantener su teléfono en el bolsillo mediante la conexión de un auricular Bluetooth y mantener una conversación con otros como si estuvieran hablando su propio idioma.RTransla...
hace 1 año
062.3K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: un marco de código abierto para ejecutar inteligencias IA para navegar por la web, permitiendo a la IA manipular automáticamente las páginas web.

Introducción general Browser Use Web UI es un innovador proyecto de código abierto centrado en proporcionar a los agentes de IA capacidades de interacción con el navegador como herramienta de interfaz gráfica. El proyecto está construido sobre el núcleo del framework browser-use, construido con Gradio ...
hace 7 meses
062.2K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: herramienta asíncrona de código abierto para extraer datos estructurados sin LLM

Introducción general Crawl4AI es una herramienta de rastreo web asíncrona de código abierto diseñada para grandes modelos lingüísticos (LLM) y aplicaciones de inteligencia artificial (IA). Simplifica el rastreo web y el proceso de extracción de datos, soporta el rastreo web eficiente, y proporciona formatos de salida LLM-amigable para...
hace 1 año
062.1K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: herramienta de código abierto para extraer el vídeo para especificar el retrato de destino, generar el vídeo de retrato de destino

Introducción general MatAnyone es un proyecto de código abierto centrado en la codificación de vídeo, desarrollado y publicado en GitHub por un equipo de investigación de S-Lab, Universidad Tecnológica de Nanyang, Singapur. Proporciona a los usuarios capacidades de procesamiento de vídeo estables y eficientes mediante técnicas de propagación de memoria coherente, especialmente...
hace 11 meses
061.8K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Introducción Linly-Dubbing es una herramienta inteligente de traducción y doblaje multilingüe diseñada para proporcionar a los usuarios servicios de traducción de subtítulos y doblaje de vídeo multilingüe de alta calidad mediante la integración de tecnología avanzada de IA. La herramienta es especialmente adecuada para la educación internacional, la localización de contenidos globales y otros escenarios, ayudando...
hace 12 meses
061.8K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: un marco de recuperación de conocimientos multisalto basado en la memoria a largo plazo

Introducción general HippoRAG es un marco de código abierto desarrollado por el grupo OSU-NLP de la Ohio State University, inspirado en los mecanismos de la memoria humana a largo plazo. Combina técnicas de Retrieval Augmented Generation (RAG), Knowledge Graph y Personalised PageRank para ayudar a los grandes modelos lingüísticos...
hace 10 meses
061.7K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: un complemento de código abierto que impulsa las pruebas de automatización del navegador con IA

Introducción general Midscene.js es una herramienta de automatización del navegador impulsada por IA que controla páginas web, realiza aserciones y extrae datos a través de comandos de lenguaje natural. Es compatible con extensiones de Chrome, SDK de JavaScript y scripts YAML, lo que simplifica la medición de la IU....
hace 12 meses
061.7K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de preguntas y respuestas con base de conocimientos de inteligencia artificial para un servicio de atención al cliente inteligente y una base de conocimientos interna.

Introducción general MaxKB (Max Knowledge Base) es un sistema de preguntas y respuestas de base de conocimientos de código abierto basado en grandes modelos lingüísticos y RAG (Retrieval Augmented Generation). El sistema es ampliamente utilizado en el servicio al cliente inteligente, base de conocimiento interno de la empresa, la investigación académica y la educación y otros escenarios.MaxKB...
hace 12 meses
061.6K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: AI Generated PPT, Generación de presentaciones

Introducción completa AiPPT es una herramienta de generación de PPT basada en tecnología de inteligencia artificial, diseñada para ayudar a los usuarios a crear rápidamente presentaciones profesionales. Genera automáticamente diapositivas ricas en contenido y bellamente diseñadas introduciendo temas, cargando archivos o proporcionando URL, etc. Es compatible con gráficos nativos, animaciones y...
hace 11 meses
061.5K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: un asistente nativo de programación de inteligencia artificial que se integra en VSCode

Introducción general Tabby es un asistente de programación de IA de código abierto desarrollado por el equipo TabbyML que los usuarios pueden desplegar ellos mismos localmente o en un servidor. Ofrece funciones similares a GitHub Copilot, como el autocompletado de código y las preguntas y respuestas...
hace 9 meses
061.2K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: marco de código abierto para la inferencia y planificación de la conducción autónoma de Xiaomi

Introducción Orion es un proyecto de código abierto desarrollado por Xiaomi Labs, centrado en la tecnología de conducción autónoma de extremo a extremo (E2E). Resuelve el problema del insuficiente razonamiento causal en escenarios complejos por parte de los métodos tradicionales de conducción autónoma mediante modelos de lenguaje visual (VLM) y planificadores generativos.Orion integra largas...
hace 9 meses
061K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: herramienta dinámica de construcción y consulta de grafos de conocimiento (programa de memoria larga consciente del tiempo)

Introducción general Graphiti es una herramienta desarrollada por getzep para construir y consultar grafos de conocimiento dinámicos y temporales. Es capaz de representar relaciones complejas y evolutivas entre entidades y consultarlas mediante diversos métodos, como algoritmos temporales, de texto completo, semánticos y de grafos.Grap...
hace 11 meses
060.9K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: un robot de diálogo inteligente construido a partir de un modelo de gran tamaño, compatible con WeChat y otras plataformas de acceso multidiálogo.

Introducción general El proyecto ChatGPT-on-WeChat es un gran robot de diálogo inteligente basado en modelos, que admite el acceso multiplataforma a WeChat personal, número público de WeChat, aplicación WeChat empresarial, Flybook, Nail, etc. Los usuarios pueden elegir GPT3.5, GPT-4, Claude, Man...
hace 1 año
060.9K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt: descargador universal de vídeos, YouTube, Vimeo, Twitter, Reddit, SoundCloud ¡y mucho más!

Introducción general A menudo tengo que descargar vídeos de YouTube y Twitter, así que encontré este descargador de vídeo gratuito y sin publicidad.Cobalt es un descargador multimedia de código abierto diseñado para proporcionar una experiencia de descarga fácil de usar. Admite la descarga de contenidos de vídeo y audio desde múltiples plataformas, incluyendo...
hace 1 año
060.8K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: un sistema de mejora de la memoria basado en la extensión de código Roo

Introducción completa RooFlow es una herramienta de programación asistida por IA de código abierto con la funcionalidad principal de preservar el código, las decisiones y el progreso de las tareas durante el desarrollo mediante el registro de proyectos. Se basa en la extensión Roo Code e integra cinco modos: arquitectura, codificación, pruebas, depuración y preguntas y respuestas. Estos modos inter...
hace 9 meses
060.7K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: herramienta de globalización multilingüe para vídeo con traducción y doblaje en un clic

Introducción completa KrillinAI es una herramienta de procesamiento de vídeo de código abierto que se centra en el uso de la inteligencia artificial para ayudar a los usuarios a traducir vídeos y doblarlos automáticamente. Puede empezar desde la descarga del vídeo, hasta generar el producto final adaptado a diferentes plataformas, todo el proceso es cuestión de unos pocos clics. Los desarrolladores están disponibles en GitHub...
hace 7 meses
060.6K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1: Generación de vídeo de alta calidad en GPU de consumo

Introducción completa Wan2.1 es un conjunto de herramientas de generación de vídeo desarrollado por el equipo de Wan-Video y de código abierto en GitHub, centrado en ampliar los límites de la creación de vídeo mediante técnicas de inteligencia artificial. Se basa en una arquitectura de transformador de difusión avanzada que integra un sistema de...
hace 11 meses
060.5K
Qlib:微软开发的AI量化投资研究工具

Qlib: una herramienta de investigación cuantitativa de inversiones desarrollada por Microsoft

Introducción general Qlib es una plataforma de código abierto desarrollada por Microsoft que se centra en el uso de la tecnología de IA para ayudar a los usuarios a investigar inversiones cuantitativas. Parte del procesamiento de datos más básico y ayuda a los usuarios a explorar ideas de inversión y convertirlas en estrategias utilizables. La plataforma es sencilla y fácil de usar, y es adecuada para quienes deseen utilizar el aprendizaje automático para mejorar su investigación de inversiones....
hace 10 meses
060.4K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: una plantilla de código abierto para crear rápidamente un entorno local de IA

Introducción completa El n8n Self-Hosted AI Starter Kit es una plantilla Docker Compose de código abierto diseñada para inicializar rápidamente una IA local completa y un entorno de desarrollo de código bajo. Creado por el equipo de n8n, el paquete combina la plataforma autoalojada n8n con una gama de...
hace 11 meses
060.2K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboración multiagente para el asistente de explotación de dispositivos móviles

Introducción general MobileAgent es un potente asistente de operación de dispositivos móviles diseñado para mejorar la eficiencia y la automatización de la operación de dispositivos móviles a través de la colaboración multi-agente y módulos de percepción visual mejorada. Está desarrollado por el equipo de X-PLUG y es compatible con Android y ...
hace 12 meses
060K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 11 meses
059.9K
E2B:安全云沙箱中的AI代码运行平台

E2B: plataforma de ejecución de código de inteligencia artificial en un entorno seguro en la nube

Introducción general E2B es una plataforma de código abierto diseñada para ejecutar código generado por IA en un entorno seguro en la nube. Es compatible con una amplia gama de lenguajes y marcos de programación y proporciona un entorno virtual aislado para garantizar la seguridad y la fiabilidad de la ejecución del código.
hace 1 año
059.9K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: la herramienta de inteligencia artificial que genera automáticamente notas Markdown a partir de vídeos

Introducción completa BiliNote es una herramienta de código abierto AI video toma de notas que soporta la extracción de contenido de BiliNote y enlaces de vídeo de YouTube para generar automáticamente notas claramente estructuradas en formato Markdown. Hace uso de la transcripción nativa de audio y de una gran variedad de modelos ...
hace 9 meses
059.8K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix: empaquetado de la base de código en un archivo de texto para la recuperación de modelos de gran tamaño.

Introducción general Repomix (antes conocido como Repopack) es una herramienta de código abierto diseñada para empaquetar todo un código base en un único archivo compatible con IA. Esta herramienta permite a los desarrolladores poner fácilmente su código base a disposición de grandes modelos lingüísticos (como Claude, Chat...
hace 12 meses
059.7K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: un marco RAG de código abierto para la construcción basada en grafos de conocimiento, aprendizaje de prompts básicos

Introducción general Cognee es una solución de capa de datos fiable diseñada para aplicaciones de IA y agentes de IA. Diseñado para cargar y construir contextos LLM (Large Language Models) para crear soluciones de IA precisas e interpretables a través de grafos de conocimiento y almacenes de vectores. El marco de trabajo favorece el ahorro de costes,...
hace 12 meses
059.7K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: generación y evaluación automáticas de presentaciones PPT, documentos a PPT

Introducción general PPTAgent es un sistema innovador diseñado para generar automáticamente presentaciones a partir de documentos. El sistema se inspira en el enfoque humano de la creación de presentaciones, utilizando un proceso de dos pasos para garantizar la calidad del contenido y el impacto visual. Además, PPTAgent presenta PPTEval, un completo...
hace 12 meses
059.7K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: framework backend basado en SpringBoot para chat y dibujo con inteligencia artificial

Introducción completa RuoYi AI es un proyecto back-end basado en el marco ruoyi-plus , centrándose en la integración de chat AI y funciones de pintura . Es completamente de código abierto y gratuito , utilizando Java17 y SpringBoot 3.X pila de tecnología , backend de gestión ...
hace 11 meses
059.6K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código abierto para la eliminación por lotes de fondos de imágenes y vídeos, optimizado para RMBG 2.0

Introducción general RMBG-2-Studio es una aplicación mejorada de eliminación y sustitución de fondos desarrollada sobre la base del modelo BRIA-RMBG-2.0. La aplicación está diseñada para proporcionar a los usuarios capacidades de procesamiento de fondo de imagen eficientes y precisas para una variedad de tipos de imágenes, incluyendo comercio electrónico, juegos y...
hace 1 año
059.5K
Onyx:连接企业知识库的智能AI聊天平台

Onyx: una plataforma de chat inteligente que conecta las bases de conocimiento de las empresas

Introducción general Onyx (antes conocido como Danswer) es una plataforma de chat de IA de código abierto desarrollada por el equipo onyx-dot-app para ayudar a las organizaciones a integrar y gestionar documentos, aplicaciones y datos de empleados. Proporciona una rica funcionalidad de chat con soporte para conectar cualquier Large Language Model (LLM...
hace 10 meses
059.3K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund: sistema de negociación automatizado de código abierto que utiliza inteligencias múltiples para tomar decisiones complejas de negociación en fondos de cobertura.

Introducción general AI Hedge Fund es un fondo de cobertura de inteligencia artificial que utiliza un sistema multiagente para tomar decisiones comerciales. El sistema trabaja en colaboración con varios agentes especializados, como agentes de datos de mercado, agentes cuantitativos, agentes de gestión de riesgos y agentes de gestión de carteras, para...
hace 12 meses
059.1K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...
hace 11 meses
059.1K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: modelo experimental de conversión de texto en voz, TTS implementado mediante un enfoque de modelado lingüístico puro.

Introducción general OuteTTS es un modelo experimental de conversión de texto en habla (TTS) que utiliza un enfoque de modelado lingüístico puro para generar habla de alta calidad. A diferencia de los sistemas TTS tradicionales, OuteTTS no requiere adaptadores externos ni arquitecturas complejas. El modelo se basa en la arquitectura LLaMa...
hace 11 meses
058.9K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio: versión con interfaz fácil de usar del sistema multiagente AutoGen

Descripción general AutoGen Studio 2.0 es una interfaz de usuario impulsada por AutoGen diseñada para simplificar el proceso de creación y gestión de soluciones multiagente. La plataforma permite a los usuarios definir y modificar de forma declarativa los agentes y sus flujos de trabajo a través de una interfaz intuitiva....
hace 12 meses
058.7K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: herramienta de código abierto para el intercambio de rostros en tiempo real con IA, una foto para el intercambio de rostros en tiempo real

Introducción general Deep Live Cam es una herramienta de inteligencia artificial de código abierto diseñada para permitir la sustitución de caras en tiempo real y la generación de vídeos falsos a partir de una sola foto. Utilizando algoritmos avanzados de aprendizaje profundo, la herramienta es capaz de reemplazar caras en tiempo real durante transmisiones en directo o videollamadas, protegiendo la privacidad del usuario y añadiendo diversión...
hace 1 año
058.5K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: PDF local para generar podcasts de voz de herramientas de código abierto

Introducción completa Local-NotebookLM es un proyecto de código abierto que tiene como objetivo proporcionar localmente ejecutar herramientas inteligentes de procesamiento de documentos y generación de contenidos. Está inspirado en Google NotebookLM , centrándose en ayudar a los usuarios a PDF y otros documentos en una variedad de ...
hace 10 meses
058.4K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: un cliente de diálogo inteligente de escritorio basado en la API de Dify, que proporciona capacidades de diálogo AI de nivel empresarial.

Introducción general Dify-WebUI es una moderna aplicación de diálogo inteligente de escritorio basada en la API de Dify, diseñada para proporcionar a las empresas potentes capacidades de diálogo AI. La aplicación es compatible con una variedad de colores de temas preestablecidos para satisfacer las necesidades individuales de las empresas, y tiene una función de gestión de base de conocimientos para apoyar...
hace 1 año
058.3K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Convierta rápidamente los repositorios de código de Github en texto apto para la comprensión del LLM

Introducción general GitIngest es una herramienta de código abierto diseñada para transformar los repositorios de código de GitHub en texto adecuado para las sugerencias de Large Language Model (LLM). Con una sencilla operación, los usuarios pueden extraer y formatear el contenido de cualquier repositorio de GitHub para adaptarlo al LLM...
hace 1 año
058.2K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D con audio de personas digitales interactivas en tiempo real, que funcionan a 30 fps en la CPU.

Introducción general LiteAvatar es una herramienta de código abierto desarrollada por el equipo HumanAIGC (parte de Ali) que se centra en generar animaciones faciales a partir de avatares 2D controlados por audio en tiempo real. Funciona a 30 fotogramas por segundo (fps) dependiendo únicamente de la CPU, y está especialmente indicada para...
hace 11 meses
058.1K
Abogen:将多种文本格式转换为有声读物的工具

Abogen: una herramienta para convertir múltiples formatos de texto en audiolibros

Introducción general Abogen es una herramienta de código abierto diseñada para convertir rápidamente archivos ePub, PDF o de texto plano en audio de alta calidad. Utiliza el modelo Kokoro-82M para generar un habla natural y fluida, y admite la generación simultánea de subtítulos, lo que resulta idóneo para producir audiolibros....
hace 8 meses
058K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: revolucionarias herramientas de generación y clonación de voz

Introducción general GPT-SoVITS es una herramienta de conversión y síntesis de voz de código abierto que combina el modelo GPT y la tecnología de cambio de voz SoVITS. La herramienta admite la conversión de texto a voz sobre la marcha con cero y pocas muestras, y la migración de estilo de voz con sólo 5 segundos de muestras de audio. Entre sus funciones se incluyen la ...
hace 1 año
057.8K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: un asistente de IA para la generación de descripciones de texto Flujos de trabajo ComfyUI

Introducción general ComfyUI-Copilot es un nodo personalizado impulsado por IA diseñado para el marco ComfyUI, con el objetivo de mejorar la eficiencia de la depuración y el despliegue de algoritmos de IA a través de la interacción del lenguaje natural. Está desarrollado por el equipo AIDC-AI (Alibaba) y derivado de GitHu...
hace 11 meses
057.7K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock: herramienta de análisis de valores basada en IA, seguimiento en tiempo real de las cotizaciones de valores elegidos por el usuario y análisis en profundidad basados en IA.

Introducción completa go-stock es una herramienta de análisis de acciones con IA construida sobre Wails y NaiveUI. La herramienta es capaz de monitorizar en tiempo real las cotizaciones de las acciones, proporcionando visualización de costes y beneficios/pérdidas y función de empuje de alarma arriba/abajo. Todos los datos se guardan localmente para...
hace 11 meses
057.6K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: complemento del asistente web para el diálogo nativo con modelos de IA y la recuperación de documentos

Introducción general Page Assist es una extensión de navegador de código abierto diseñada para proporcionar a los usuarios una forma sencilla de interactuar con modelos locales de IA. Con esta extensión, los usuarios pueden abrir una barra lateral en cualquier página web para interactuar con modelos de IA que se ejecutan localmente.Page Assi...
hace 9 meses
057.6K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror: despliegue en un clic de sitios espejo Grok rentables

Introducción completa Grok-Mirror es una estación de espejo doméstica Grok3 de despliegue rápido sin servidor basada en la construcción de una estación de espejo Grok operable. Permite a los usuarios implementar quioscos Grok locales con un solo clic a través de Docker.Grok es una inteligencia artificial de xAI...
hace 10 meses
057.5K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: herramienta profesional de creación de ilustraciones manga de cuatro paneles, generación de imágenes, edición de páginas manga

Introducción general SP-MangaEditer es una plataforma independiente de edición de manga diseñada para creadores de manga. La plataforma soporta generación de imágenes, edición por capas, ajuste de imágenes, aplicación de filtros y muchas otras funciones para ayudar a los usuarios a crear fácilmente ilustraciones manga de alta calidad. Los usuarios pueden manipular...
hace 1 año
057.5K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive: grabación en directo no supervisada y autocorte, herramienta de carga para la estación B

Introducción bilive es una herramienta diseñada para la grabación en directo de estaciones B, que proporciona una grabación en directo extremadamente rápida, corte automático, renderización de ventanas emergentes y generación de subtítulos. La herramienta es compatible con máquinas de configuración ultrabaja, soporta grabación desatendida 7x24 horas, identifica y renderiza automáticamente pop-ups y subtítulos, trocea y...
hace 11 meses
057.4K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: servicios MCP para controlar software CAD mediante comandos de lenguaje natural

Introducción General CAD-MCP es un proyecto de código abierto que permite a los usuarios controlar el software CAD a través de comandos de lenguaje natural para las operaciones de dibujo. Combina el procesamiento del lenguaje natural y la tecnología de automatización CAD , de modo que los usuarios no necesitan operar manualmente la interfaz CAD , basta con introducir comandos de texto simples que...
hace 8 meses
057.3K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: creación de multiinteligentes de ejecución autónoma, un marco de desarrollo de organismos inteligentes de IA de código abierto totalmente funcional

Introducción general Eliza es un marco avanzado de desarrollo de múltiples cuerpos inteligentes (Multi-Agente) , se compromete a simplificar la construcción y el despliegue del proceso de cuerpo inteligente autónomo (Agente Autónomo) . Soporta el despliegue de múltiples cuerpos inteligentes con diferentes configuraciones de roles , puede lograr ...
hace 1 año
057.1K
小红书AI运营助手:自动生成和发布小红书文章

Asistente de operaciones Xiaohongshu AI: genera y publica automáticamente artículos Xiaohongshu.

Introducción completa Xiaohongshu AI Operation Assistant (xhsaipublisher) es una herramienta de automatización diseñada para publicar artículos en la plataforma Xiaohongshu. El proyecto combina una interfaz gráfica de usuario con scripts de automatización para generar contenido utilizando la tecnología big model e iniciar sesión y publicar automáticamente a través del navegador....
hace 1 año
057K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: Creación de una interfaz de arrastrar y soltar nodos para aplicaciones LLM personalizadas

Introducción general FlowiseAI es una herramienta de código abierto y bajo código diseñada para ayudar a los desarrolladores a crear aplicaciones LLM (Large Language Model) personalizadas y agentes de IA. Con una sencilla interfaz de arrastrar y soltar, los usuarios pueden crear e iterar rápidamente aplicaciones LLM, haciendo más eficiente el proceso desde las pruebas hasta la producción....
hace 12 meses
056.9K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Eliminación de marca de agua:open source image watermark removal tool, picture watermark recovery original image

Introducción general Watermark Removal es un proyecto de código abierto que utiliza técnicas de aprendizaje automático y aprendizaje profundo para la restauración de imágenes, concretamente para eliminar marcas de agua de imágenes. El proyecto fue desarrollado por Chimzuruoke Okafor y se inspira en Con...
hace 11 meses
056.9K
Chat2DB:智能生成SQL与数据报表的数据库管理工具

Chat2DB: Herramienta de gestión de bases de datos para SQL inteligente y generación de informes de datos

Introducción general Chat2DB es una herramienta de gestión de bases de datos y cliente SQL de código abierto desarrollada por el equipo CodePhiliaX , integrada con funcionalidad AI , soporte para escribir rápidamente consultas SQL , gestión de bases de datos , generación de informes de datos e interacción multi-base de datos . Soporta más de 16...
hace 10 meses
056.8K