Proyecto AI de código abierto

Total 1020 artículos
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: un modelo de código abierto para el reconocimiento multilingüe de voz de alta precisión

Introducción general FireRedASR es un modelo de reconocimiento del habla desarrollado y de código abierto por el equipo de Little Red Book FireRed, centrado en proporcionar soluciones de reconocimiento automático del habla (ASR) de alta precisión y compatibles con varios idiomas. El proyecto está alojado en GitHub para desarrolladores e investigadores, y ofrece...
hace 1 año
0103.5K
Chat2DB:智能生成SQL与数据报表的数据库管理工具

Chat2DB: Herramienta de gestión de bases de datos para SQL inteligente y generación de informes de datos

Introducción general Chat2DB es una herramienta de gestión de bases de datos y cliente SQL de código abierto desarrollada por el equipo CodePhiliaX , integrada con funcionalidad AI , soporte para escribir rápidamente consultas SQL , gestión de bases de datos , generación de informes de datos e interacción multi-base de datos . Soporta más de 16...
hace 1 año
0102.6K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: Plataforma de desarrollo de aplicaciones de IA generativa, orquestación visual, soporte de despliegue privado

Introducción completa Dify es una plataforma de desarrollo de aplicaciones de IA generativa de código abierto diseñada para ayudar a los desarrolladores a construir y operar rápidamente aplicaciones nativas de IA basadas en Grandes Modelos de Lenguaje (LLMs). La plataforma proporciona todo, desde la construcción de agentes hasta la orquestación de flujos de trabajo de IA, la recuperación de RAG...
hace 1 año
0102.5K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror: despliegue en un clic de sitios espejo Grok rentables

Introducción completa Grok-Mirror es una estación de espejo doméstica Grok3 de despliegue rápido sin servidor basada en la construcción de una estación de espejo Grok operable. Permite a los usuarios implementar quioscos Grok locales con un solo clic a través de Docker.Grok es una inteligencia artificial de xAI...
hace 1 año
0101.8K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: marco de código abierto para la inferencia y planificación de la conducción autónoma de Xiaomi

Introducción Orion es un proyecto de código abierto desarrollado por Xiaomi Labs, centrado en la tecnología de conducción autónoma de extremo a extremo (E2E). Resuelve el problema del insuficiente razonamiento causal en escenarios complejos por parte de los métodos tradicionales de conducción autónoma mediante modelos de lenguaje visual (VLM) y planificadores generativos.Orion integra largas...
hace 1 año
0101.8K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: creador de flujos de trabajo de código abierto para agentes de IA

Introducción exhaustiva Sim Studio es una plataforma de código abierto para la creación de flujos de trabajo de agentes de IA que se centra en ayudar a los usuarios a diseñar, probar y desplegar rápidamente flujos de trabajo de modelos lingüísticos (LLM) a gran escala a través de una interfaz visual ligera e intuitiva. Los usuarios pueden crear flujos de trabajo complejos sin necesidad de programar...
hace 11 meses
0101.4K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: un asistente de IA para la gestión del conocimiento empresarial y la búsqueda de documentos, que integra múltiples herramientas de trabajo

Introducción general Danswer es un asistente de IA para la recuperación de documentos empresariales de código abierto diseñado para conectarse con documentos, aplicaciones y personas del equipo para proporcionar respuestas unificadas de búsqueda y consultas en lenguaje natural a través de una interfaz de chat inteligente y capacidades de búsqueda unificadas. Garantiza que los datos de los usuarios y los chats...
hace 1 año
0101.3K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...
hace 1 año
0100.6K
Void:基于VSCode的开源Cursor替代品

Void: alternativa de código abierto a Cursor basada en VSCode

Introducción general Void es una alternativa de código abierto a Cursor basada en una rama del repositorio vscode. Proporciona un potente entorno de desarrollo diseñado para proporcionar a los desarrolladores una experiencia de codificación más eficiente.El objetivo de Void es mejorar continuamente su funcionalidad y estabilidad a través de las contribuciones de la comunidad y la rápida iteración....
hace 2 años
099.6K
RF-DETR:实时视觉对象检测开源模型

RF-DETR: un modelo de código abierto para la detección visual de objetos en tiempo real

Introducción general RF-DETR es un modelo de detección de objetos de código abierto desarrollado por el equipo Roboflow. Se basa en la arquitectura Transformer y su característica principal es la eficiencia en tiempo real. Por primera vez, el modelo alcanza más de 60 AP de tiempo real en el conjunto de datos COCO de Microsoft....
hace 1 año
098.9K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: Creación de tablas inteligentes en múltiples bases de datos, alternativa de código abierto a Airtable

Introducción general NocoDB es una alternativa de código abierto a Airtable diseñada para proporcionar una herramienta de gestión de bases de datos en línea potente y fácil de usar. Con NocoDB, los usuarios pueden crear, leer, actualizar y eliminar fácilmente datos de bases de datos sin escribir código. La plataforma soporta ...
hace 2 años
098.5K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: una aplicación de traducción de voz en tiempo real para Android, ¡gratis y sin conexión!

Introducción general RTranslator es una aplicación de traducción en tiempo real, prácticamente gratuita y de código abierto diseñada para dispositivos Android. Los usuarios pueden mantener su teléfono en el bolsillo mediante la conexión de un auricular Bluetooth y mantener una conversación con otros como si estuvieran hablando su propio idioma.RTransla...
hace 1 año
098.4K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: plataforma de observación y depuración de código abierto para aplicaciones LLM

Introducción general Langfuse es una plataforma de ingeniería LLM (Large Language Model) de código abierto. Ayuda a los desarrolladores a rastrear, depurar y optimizar aplicaciones LLM proporcionando herramientas para observar llamadas, gestionar palabras clave, ejecutar experimentos y evaluar resultados. La plataforma ha sido desarrollada por el equipo Langfuse...
hace 1 año
097.9K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: herramienta de código abierto de Tencent para la generación de modelos 3D de alta resolución

Introducción general Hunyuan3D-2 es un proyecto de código abierto desarrollado por Tencent para generar modelos 3D de alta resolución a partir de texto o imágenes. Consta de dos componentes principales: modelo de generación de formas (Hunyuan3D-DiT) y modelo de generación de texturas (Hunyuan3D...
hace 1 año
097.8K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: la herramienta de inteligencia artificial que genera automáticamente notas Markdown a partir de vídeos

Introducción completa BiliNote es una herramienta de código abierto AI video toma de notas que soporta la extracción de contenido de BiliNote y enlaces de vídeo de YouTube para generar automáticamente notas claramente estructuradas en formato Markdown. Hace uso de la transcripción nativa de audio y de una gran variedad de modelos ...
hace 1 año
097.8K
Agent S:像人类一样操作电脑的开源智能体框架

Agente S: un marco de código abierto para que los cuerpos inteligentes manejen los ordenadores como humanos

Introducción general Agent S es un marco de código abierto desarrollado por Simular AI que permite a las inteligencias manejar ordenadores como si fueran humanos a través de una interfaz gráfica de usuario (GUI). Utiliza un gran modelo de lenguaje multimodal y técnicas de aprendizaje empírico para realizar tareas como navegar por la web, editar documentos, utilizar software...
hace 1 año
097.8K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: un motor RAG de código abierto basado en la comprensión profunda de los documentos, que proporciona flujos de trabajo de generación eficientes y mejorados por la recuperación.

Introducción exhaustiva RAGFlow es un motor de generación aumentada de recuperación (RAG) de código abierto basado en la tecnología de comprensión profunda de documentos. Proporciona un flujo de trabajo RAG eficiente para empresas de todos los tamaños, incorporando un modelo de lenguaje a gran escala (LLM) que puede proporcionar datos en formatos complejos basados en...
hace 1 año
097.7K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue: un asistente de código de IA de código abierto que se integra con VS Code y personaliza modelos e incrustaciones.

Introducción general Continue es un asistente de código de IA de código abierto diseñado para mejorar la eficiencia de los desarrolladores de software. Sus principales características incluyen autocompletado de código, optimización de código y sugerencias inteligentes de código para VS Code y JetBrains IDEs.Continue hace...
hace 1 año
096.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicación de escritorio de Intelligentsia para controlar ordenadores mediante lenguaje natural

Introducción general UI-TARS Desktop es una aplicación de agente de interfaz gráfica basada en UI-TARS (Visual Language Model) desarrollada por ByteDance. La aplicación permite a los usuarios controlar los ordenadores a través del lenguaje natural para una interacción humano-ordenador más intuitiva y eficiente.UI-TAR...
hace 1 año
095.6K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: un complemento de código abierto que impulsa las pruebas de automatización del navegador con IA

Introducción general Midscene.js es una herramienta de automatización del navegador impulsada por IA que controla páginas web, realiza aserciones y extrae datos a través de comandos de lenguaje natural. Es compatible con extensiones de Chrome, SDK de JavaScript y scripts YAML, lo que simplifica la medición de la IU....
hace 1 año
095.6K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: un sistema avanzado de recuperación de IA (RAG) para el análisis sintáctico de contenidos multimodales y la combinación del grafo de conocimiento con la búsqueda híbrida

Introducción completa R2R (RAG to Riches) es un sistema avanzado de recuperación de IA que admite la funcionalidad de generación aumentada de recuperación (RAG) con características listas para la producción. Construido sobre una API RESTful en contenedores, el sistema proporciona análisis de contenido multimodal, funcionalidad de búsqueda híbrida...
hace 1 año
095.4K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: Construcción de un marco para inteligencias multimodales con memoria, conocimiento y herramientas

Introducción general Agno es una biblioteca Python de código abierto desarrollada por el equipo agno-agi y alojada en GitHub, dedicada a facilitar a los desarrolladores la creación de inteligencias IA con memoria, conocimientos y herramientas. Es compatible con texto multimodal, imagen, audio y vídeo....
hace 1 año
095.4K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Buscador de tendencias: seguimiento de las tendencias en las redes sociales, los temas de moda y los nuevos artículos en tiempo real para la toma de decisiones de marketing.

Introducción general Trend Finder es una potente herramienta diseñada para ayudar a los usuarios a seguir en tiempo real las tendencias y los temas de moda en las redes sociales. Mediante la recopilación y el análisis de publicaciones de personas influyentes clave, Trend Finder es capaz de detectar nuevas tendencias o lanzamientos de productos a tiempo para enviar...
hace 1 año
095.3K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: modelos lingüísticos multimodales de código abierto para la interacción visual y verbal en tiempo real

Introducción general VITA es un proyecto líder de modelado de grandes lenguajes multimodales interactivos de código abierto, pionero en la capacidad de lograr una verdadera interacción multimodal completa. El proyecto lanzó VITA-1.0 en agosto de 2024, siendo pionero en el primer gran modelo de lenguaje interactivo completamente modal de código abierto.2024...
hace 1 año
094.4K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: herramienta de globalización multilingüe para vídeo con traducción y doblaje en un clic

Introducción completa KrillinAI es una herramienta de procesamiento de vídeo de código abierto que se centra en el uso de la inteligencia artificial para ayudar a los usuarios a traducir vídeos y doblarlos automáticamente. Puede empezar desde la descarga del vídeo, hasta generar el producto final adaptado a diferentes plataformas, todo el proceso es cuestión de unos pocos clics. Los desarrolladores están disponibles en GitHub...
hace 10 meses
094.4K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock: herramienta de análisis de valores basada en IA, seguimiento en tiempo real de las cotizaciones de valores elegidos por el usuario y análisis en profundidad basados en IA.

Introducción completa go-stock es una herramienta de análisis de acciones con IA construida sobre Wails y NaiveUI. La herramienta es capaz de monitorizar en tiempo real las cotizaciones de las acciones, proporcionando visualización de costes y beneficios/pérdidas y función de empuje de alarma arriba/abajo. Todos los datos se guardan localmente para...
hace 1 año
094.3K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: una herramienta de código abierto para optimizar las palabras clave de los modelos de IA convencionales.

Introducción general Prompt Optimizer es una herramienta de código abierto centrada en la optimización de palabras clave, desarrollada por linshenkx en GitHub. Ayuda a los usuarios a optimizar las palabras clave de los modelos de IA mediante algoritmos inteligentes, mejorando así la calidad del contenido generado...
hace 1 año
094.1K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展

Plate: editor de texto enriquecido basado en inteligencia artificial y compatible con extensiones de plug-in enriquecidas.

Descripción general Plate es un editor de texto enriquecido impulsado por IA construido sobre React y TypeScript, diseñado para proporcionar una experiencia de edición altamente personalizable y extensible. Utiliza Slate.js en su núcleo, combinado con una moderna interfaz de usuario ...
hace 1 año
094K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix: empaquetado de la base de código en un archivo de texto para la recuperación de modelos de gran tamaño.

Introducción general Repomix (antes conocido como Repopack) es una herramienta de código abierto diseñada para empaquetar todo un código base en un único archivo compatible con IA. Esta herramienta permite a los desarrolladores poner fácilmente su código base a disposición de grandes modelos lingüísticos (como Claude, Chat...
hace 1 año
094K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: un asistente nativo de programación de inteligencia artificial que se integra en VSCode

Introducción general Tabby es un asistente de programación de IA de código abierto desarrollado por el equipo TabbyML que los usuarios pueden desplegar ellos mismos localmente o en un servidor. Ofrece funciones similares a GitHub Copilot, como el autocompletado de código y las preguntas y respuestas...
hace 1 año
093.7K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: proyecto de código abierto para generar gráficos vectoriales SVG a partir de texto e imágenes

Introducción general OmniSVG es un proyecto de código abierto centrado en la generación de gráficos vectoriales (SVG) de alta calidad mediante un modelo multimodal. Utiliza modelos visual-lingüísticos preentrenados para apoyar la generación de SVG a partir de descripciones textuales o entradas de imágenes, cubriendo una amplia gama de escenarios, desde simples iconos hasta complejos personajes de anime. Elementos ...
hace 1 año
093.4K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: proyecto de código abierto de diálogo por IA que imita la interacción de la interfaz ChatGPT

Introducción general LibreChat es una plataforma de chat de IA gratuita y de código abierto con amplias opciones de personalización y soporte para múltiples proveedores, servicios e integraciones de IA. Reúne todas las conversaciones de IA en un solo lugar con una interfaz familiar y características innovadoras, soportando múltiples modelos de IA, plugins y múltiples idiomas. Por...
hace 2 años
093.1K
Qlib:微软开发的AI量化投资研究工具

Qlib: una herramienta de investigación cuantitativa de inversiones desarrollada por Microsoft

Introducción general Qlib es una plataforma de código abierto desarrollada por Microsoft que se centra en el uso de la tecnología de IA para ayudar a los usuarios a investigar inversiones cuantitativas. Parte del procesamiento de datos más básico y ayuda a los usuarios a explorar ideas de inversión y convertirlas en estrategias utilizables. La plataforma es sencilla y fácil de usar, y es adecuada para quienes deseen utilizar el aprendizaje automático para mejorar su investigación de inversiones....
hace 1 año
093.1K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: sistema de diálogo inteligente para personas digitales que combina grandes modelos lingüísticos y modelos visuales para nuevas experiencias interactivas.

Introducción general Linly-Talker es un innovador sistema digital de diálogo humano que combina grandes modelos lingüísticos (LLM) con modelos visuales para crear un enfoque novedoso de la interacción persona-ordenador. El sistema integra diversas tecnologías como Whisper, Linly, Micros...
hace 1 año
093.1K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: herramienta de conversión de voz a texto en tiempo real para el reconocimiento del habla en streaming de baja latencia basada en Whisper.

Introducción general RealtimeSTT es una eficaz biblioteca de conversión de voz a texto en tiempo real de baja latencia con detección avanzada de la actividad del habla y activación de la palabra de despertador. Ha sido desarrollada por Kolja Beigel para dar soporte a aplicaciones que requieren una conversión de voz a texto...
hace 1 año
092.5K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: una plantilla de código abierto para crear rápidamente un entorno local de IA

Introducción completa El n8n Self-Hosted AI Starter Kit es una plantilla Docker Compose de código abierto diseñada para inicializar rápidamente una IA local completa y un entorno de desarrollo de código bajo. Creado por el equipo de n8n, el paquete combina la plataforma autoalojada n8n con una gama de...
hace 1 año
092.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir eBooks en múltiples formatos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de e...
hace 1 año
092.1K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: Permite que la IA controle directamente tu ordenador, una implementación de código abierto del ordenador de control de Claude.

Introducción general Agent.exe es una aplicación Electron de código abierto que utiliza la API Sonnet Claude 3.5 de Anthropic para permitir a los usuarios controlar su ordenador local directamente a través de la IA. El proyecto fue desarrollado por K...
hace 1 año
092K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: herramienta asíncrona de código abierto para extraer datos estructurados sin LLM

Introducción general Crawl4AI es una herramienta de rastreo web asíncrona de código abierto diseñada para grandes modelos lingüísticos (LLM) y aplicaciones de inteligencia artificial (IA). Simplifica el rastreo web y el proceso de extracción de datos, soporta el rastreo web eficiente, y proporciona formatos de salida LLM-amigable para...
hace 1 año
091.9K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt: descargador universal de vídeos, YouTube, Vimeo, Twitter, Reddit, SoundCloud ¡y mucho más!

Introducción general A menudo tengo que descargar vídeos de YouTube y Twitter, así que encontré este descargador de vídeo gratuito y sin publicidad.Cobalt es un descargador multimedia de código abierto diseñado para proporcionar una experiencia de descarga fácil de usar. Admite la descarga de contenidos de vídeo y audio desde múltiples plataformas, incluyendo...
hace 1 año
091.9K
Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Introducción completa Smolagents es una biblioteca ligera de agentes inteligentes desarrollada por HuggingFace que se centra en simplificar el proceso de desarrollo de sistemas de agentes de IA. El proyecto es conocido por su simplicidad en la filosofía de diseño, con sólo alrededor de 1000 líneas de código del núcleo, sin embargo, proporciona potentes capacidades de integración de características. Es más ...
hace 1 año
091.7K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Introducción Linly-Dubbing es una herramienta inteligente de traducción y doblaje multilingüe diseñada para proporcionar a los usuarios servicios de traducción de subtítulos y doblaje de vídeo multilingüe de alta calidad mediante la integración de tecnología avanzada de IA. La herramienta es especialmente adecuada para la educación internacional, la localización de contenidos globales y otros escenarios, ayudando...
hace 1 año
091.4K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: herramienta dinámica de construcción y consulta de grafos de conocimiento (programa de memoria larga consciente del tiempo)

Introducción general Graphiti es una herramienta desarrollada por getzep para construir y consultar grafos de conocimiento dinámicos y temporales. Es capaz de representar relaciones complejas y evolutivas entre entidades y consultarlas mediante diversos métodos, como algoritmos temporales, de texto completo, semánticos y de grafos.Grap...
hace 1 año
091.4K
OpenSPG:开源知识图谱引擎

OpenSPG: motor de grafos de conocimiento de código abierto

Introducción OpenSPG es un motor de grafos de conocimiento de código abierto desarrollado por Ant Group en colaboración con OpenKG, basado en el marco SPG (Semantic Augmented Programmable Graph). El motor está diseñado para proporcionar características tales como la representación semántica explícita, la definición de reglas lógicas y el marco operativo para apoyar la construcción y gestión de grafos de conocimiento de dominio...
hace 2 años
091.3K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: un marco RAG de código abierto para la construcción basada en grafos de conocimiento, aprendizaje de prompts básicos

Introducción general Cognee es una solución de capa de datos fiable diseñada para aplicaciones de IA y agentes de IA. Diseñado para cargar y construir contextos LLM (Large Language Models) para crear soluciones de IA precisas e interpretables a través de grafos de conocimiento y almacenes de vectores. El marco de trabajo favorece el ahorro de costes,...
hace 1 año
091.2K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: Asistente conversacional de IA para análisis de datos con acceso directo a respuestas, consultas SQL e informes analíticos

Introducción general WrenAI es un asistente SQL AI de código abierto diseñado específicamente para ayudar a los equipos de datos, equipos de productos y equipos de negocios a obtener información de datos a través de conversaciones en lenguaje natural. Es capaz de convertir el lenguaje natural en consultas SQL, generar gráficos, hojas de cálculo e informes,...
hace 1 año
091.1K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: PDF local para generar podcasts de voz de herramientas de código abierto

Introducción completa Local-NotebookLM es un proyecto de código abierto que tiene como objetivo proporcionar localmente ejecutar herramientas inteligentes de procesamiento de documentos y generación de contenidos. Está inspirado en Google NotebookLM , centrándose en ayudar a los usuarios a PDF y otros documentos en una variedad de ...
hace 1 año
090.8K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.

Introducción completa PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Admite el reconocimiento de más de 80 idiomas y proporciona herramientas de anotación y síntesis de datos para...
hace 1 año
090.8K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Marco completo de generación de vídeo humano digital | Retrato a vídeo | Pose a vídeo | Sincronización de labios

Introducción general MuseV es un proyecto público en GitHub cuyo objetivo es la generación de vídeo avatar de longitud ilimitada y alta fidelidad. Se basa en la tecnología de difusión y proporciona Image2Video, Text2Image2Video, Video2Video...
hace 1 año
090.6K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: proyecto de código abierto que permite a la IA manejar ordenadores a distancia y controlarlos mediante lenguaje natural

Introducción general NeoAI es una innovadora herramienta de código abierto AI asistente que permite a los usuarios controlar y gestionar fácilmente sus ordenadores a través del diálogo en lenguaje natural. Sin escribir ningún código, los usuarios pueden hacer la búsqueda de archivos, automatización de tareas, gestión de dispositivos y mucho más con sólo el diálogo diario.NeoAI...
hace 1 año
090.4K
E2B:安全云沙箱中的AI代码运行平台

E2B: plataforma de ejecución de código de inteligencia artificial en un entorno seguro en la nube

Introducción general E2B es una plataforma de código abierto diseñada para ejecutar código generado por IA en un entorno seguro en la nube. Es compatible con una amplia gama de lenguajes y marcos de programación y proporciona un entorno virtual aislado para garantizar la seguridad y la fiabilidad de la ejecución del código.
hace 1 año
090.2K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Una interfaz fácil de usar para ComfyUI para agilizar el flujo de trabajo

Introducción general ComfyUI-disty-Flow es un nodo personalizado que proporciona una interfaz de usuario amigable para ComfyUI. Está pensado para simplificar la ejecución de flujos de trabajo proporcionando una interfaz de usuario alternativa a la creación de flujos de trabajo.ComfyUI-disty...
hace 1 año
090.2K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1: Generación de vídeo de alta calidad en GPU de consumo

Introducción completa Wan2.1 es un conjunto de herramientas de generación de vídeo desarrollado por el equipo de Wan-Video y de código abierto en GitHub, centrado en ampliar los límites de la creación de vídeo mediante técnicas de inteligencia artificial. Se basa en una arquitectura de transformador de difusión avanzada que integra un sistema de...
hace 1 año
090K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de preguntas y respuestas con base de conocimientos de inteligencia artificial para un servicio de atención al cliente inteligente y una base de conocimientos interna.

Introducción general MaxKB (Max Knowledge Base) es un sistema de preguntas y respuestas de base de conocimientos de código abierto basado en grandes modelos lingüísticos y RAG (Retrieval Augmented Generation). El sistema es ampliamente utilizado en el servicio al cliente inteligente, base de conocimiento interno de la empresa, la investigación académica y la educación y otros escenarios.MaxKB...
hace 1 año
089.8K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund: sistema de negociación automatizado de código abierto que utiliza inteligencias múltiples para tomar decisiones complejas de negociación en fondos de cobertura.

Introducción general AI Hedge Fund es un fondo de cobertura de inteligencia artificial que utiliza un sistema multiagente para tomar decisiones comerciales. El sistema trabaja en colaboración con varios agentes especializados, como agentes de datos de mercado, agentes cuantitativos, agentes de gestión de riesgos y agentes de gestión de carteras, para...
hace 1 año
089.7K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: un marco de recuperación de conocimientos multisalto basado en la memoria a largo plazo

Introducción general HippoRAG es un marco de código abierto desarrollado por el grupo OSU-NLP de la Ohio State University, inspirado en los mecanismos de la memoria humana a largo plazo. Combina técnicas de Retrieval Augmented Generation (RAG), Knowledge Graph y Personalised PageRank para ayudar a los grandes modelos lingüísticos...
hace 1 año
089.3K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 1 año
089.1K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: evaluación de la memoria RAG Precisión de la GC y correlación de respuestas

Introducción exhaustiva Ragas es una herramienta diseñada específicamente para evaluar y optimizar sistemas de Generación Aumentada de Recuperación (RAG). Proporciona un amplio conjunto de métricas de evaluación mediante el análisis de las relaciones entre consultas, contextos de recuperación y respuestas generadas. Estas métricas incluyen fidelidad, relevancia de la respuesta, relevancia del contexto, on...
hace 1 año
088.9K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: un robot de diálogo inteligente construido a partir de un modelo de gran tamaño, compatible con WeChat y otras plataformas de acceso multidiálogo.

Introducción general El proyecto ChatGPT-on-WeChat es un gran robot de diálogo inteligente basado en modelos, que admite el acceso multiplataforma a WeChat personal, número público de WeChat, aplicación WeChat empresarial, Flybook, Nail, etc. Los usuarios pueden elegir GPT3.5, GPT-4, Claude, Man...
hace 1 año
088.9K
小红书AI运营助手:自动生成和发布小红书文章

Asistente de operaciones Xiaohongshu AI: genera y publica automáticamente artículos Xiaohongshu.

Introducción completa Xiaohongshu AI Operation Assistant (xhsaipublisher) es una herramienta de automatización diseñada para publicar artículos en la plataforma Xiaohongshu. El proyecto combina una interfaz gráfica de usuario con scripts de automatización para generar contenido utilizando la tecnología big model e iniciar sesión y publicar automáticamente a través del navegador....
hace 1 año
088.8K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: revolucionarias herramientas de generación y clonación de voz

Introducción general GPT-SoVITS es una herramienta de conversión y síntesis de voz de código abierto que combina el modelo GPT y la tecnología de cambio de voz SoVITS. La herramienta admite la conversión de texto a voz sobre la marcha con cero y pocas muestras, y la migración de estilo de voz con sólo 5 segundos de muestras de audio. Entre sus funciones se incluyen la ...
hace 2 años
088.6K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: la API del modelo Gemini es compatible con el formato OpenAI, desbloquea las restricciones regionales y admite el sondeo de claves multiAPI.

Introducción completa Gemini Balance es un servicio proxy de API OpenAI desarrollado sobre la base del marco FastAPI, con el objetivo de proporcionar una gestión eficaz de claves multiAPI y funciones de optimización. El proyecto es compatible con las llamadas al modelo Gemini, y entre sus principales...
hace 1 año
088.5K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: inteligencias de programación escalables de código abierto que automatizan tareas de programación de procesos completos.

Introducción general Goose es una herramienta de agente de IA de código abierto desarrollada por Block, Inc. diseñada para ayudar a los desarrolladores a automatizar las tareas de desarrollo cotidianas. Es compatible con una amplia gama de modelos de lenguaje de gran tamaño (LLM) e interactúa con los usuarios a través de la línea de comandos o interfaces de aplicaciones de escritorio.Goose puede realizar una amplia gama de tareas de agente...
hace 1 año
088.5K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: herramienta de código abierto para el intercambio de rostros en tiempo real con IA, una foto para el intercambio de rostros en tiempo real

Introducción general Deep Live Cam es una herramienta de inteligencia artificial de código abierto diseñada para permitir la sustitución de caras en tiempo real y la generación de vídeos falsos a partir de una sola foto. Utilizando algoritmos avanzados de aprendizaje profundo, la herramienta es capaz de reemplazar caras en tiempo real durante transmisiones en directo o videollamadas, protegiendo la privacidad del usuario y añadiendo diversión...
hace 1 año
088.4K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: diálogo hablado natural de baja latencia con IA

Introducción general RealtimeVoiceChat es un proyecto de código abierto centrado en conversaciones naturales y en tiempo real con inteligencia artificial a través de la voz. Los usuarios utilizan un micrófono para introducir su voz, y el sistema captura el audio a través de un navegador, lo convierte rápidamente en texto, y un gran modelo de lenguaje (LLM) genera de nuevo...
hace 12 meses
088.3K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código abierto para la eliminación por lotes de fondos de imágenes y vídeos, optimizado para RMBG 2.0

Introducción general RMBG-2-Studio es una aplicación mejorada de eliminación y sustitución de fondos desarrollada sobre la base del modelo BRIA-RMBG-2.0. La aplicación está diseñada para proporcionar a los usuarios capacidades de procesamiento de fondo de imagen eficientes y precisas para una variedad de tipos de imágenes, incluyendo comercio electrónico, juegos y...
hace 1 año
087.8K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Eliminación de marca de agua:open source image watermark removal tool, picture watermark recovery original image

Introducción general Watermark Removal es un proyecto de código abierto que utiliza técnicas de aprendizaje automático y aprendizaje profundo para la restauración de imágenes, concretamente para eliminar marcas de agua de imágenes. El proyecto fue desarrollado por Chimzuruoke Okafor y se inspira en Con...
hace 1 año
087.7K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

Esquemas: genera salidas de texto estructurado mediante expresiones regulares, JSON o modelos Pydantic.

Introducción general Outlines es una biblioteca de código abierto desarrollada por dottxt-ai para mejorar la aplicación de Large Language Models (LLMs) a través de la generación de texto estructurado. La biblioteca admite diversas integraciones de modelos, como OpenAI, transformadores...
hace 1 año
087.6K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: herramienta de código abierto para extraer el vídeo para especificar el retrato de destino, generar el vídeo de retrato de destino

Introducción general MatAnyone es un proyecto de código abierto centrado en la codificación de vídeo, desarrollado y publicado en GitHub por un equipo de investigación de S-Lab, Universidad Tecnológica de Nanyang, Singapur. Proporciona a los usuarios capacidades de procesamiento de vídeo estables y eficientes mediante técnicas de propagación de memoria coherente, especialmente...
hace 1 año
087.6K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalación con un solo clic de modelos de inteligencia artificial e interfaces de chat en ordenadores personales (con DeepSeek)

Introducción general AingDesk es un software de código abierto y gratuito diseñado para ayudar a los usuarios a implementar y ejecutar fácilmente varios modelos de IA en sus ordenadores locales. Ya se trate de un modelo DeepSeek o Llama, AingDesk permite una sencilla...
hace 1 año
087.6K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...
hace 1 año
087.5K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: un marco de código abierto para ejecutar inteligencias IA para navegar por la web, permitiendo a la IA manipular automáticamente las páginas web.

Introducción general Browser Use Web UI es un innovador proyecto de código abierto centrado en proporcionar a los agentes de IA capacidades de interacción con el navegador como herramienta de interfaz gráfica. El proyecto está construido sobre el núcleo del framework browser-use, construido con Gradio ...
hace 10 meses
087.5K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: herramienta profesional de creación de ilustraciones manga de cuatro paneles, generación de imágenes, edición de páginas manga

Introducción general SP-MangaEditer es una plataforma independiente de edición de manga diseñada para creadores de manga. La plataforma soporta generación de imágenes, edición por capas, ajuste de imágenes, aplicación de filtros y muchas otras funciones para ayudar a los usuarios a crear fácilmente ilustraciones manga de alta calidad. Los usuarios pueden manipular...
hace 1 año
087.4K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D con audio de personas digitales interactivas en tiempo real, que funcionan a 30 fps en la CPU.

Introducción general LiteAvatar es una herramienta de código abierto desarrollada por el equipo HumanAIGC (parte de Ali) que se centra en generar animaciones faciales a partir de avatares 2D controlados por audio en tiempo real. Funciona a 30 fotogramas por segundo (fps) dependiendo únicamente de la CPU, y está especialmente indicada para...
hace 1 año
087.3K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: Asistente de Código Inteligente Contextualizado, Generación y Modificación de Código, Soporte Multi-IDE

Introducción general J.A.R.V.I.S. (Just A Rather Very Intelligent System) es un asistente de código inteligente diseñado para ayudar a los desarrolladores en la generación, modificación y discusión técnica de código utilizando múltiples modelos de lenguaje de última generación....
hace 1 año
087.2K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: Creación de una interfaz de arrastrar y soltar nodos para aplicaciones LLM personalizadas

Introducción general FlowiseAI es una herramienta de código abierto y bajo código diseñada para ayudar a los desarrolladores a crear aplicaciones LLM (Large Language Model) personalizadas y agentes de IA. Con una sencilla interfaz de arrastrar y soltar, los usuarios pueden crear e iterar rápidamente aplicaciones LLM, haciendo más eficiente el proceso desde las pruebas hasta la producción....
hace 1 año
086.9K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: complemento del asistente web para el diálogo nativo con modelos de IA y la recuperación de documentos

Introducción general Page Assist es una extensión de navegador de código abierto diseñada para proporcionar a los usuarios una forma sencilla de interactuar con modelos locales de IA. Con esta extensión, los usuarios pueden abrir una barra lateral en cualquier página web para interactuar con modelos de IA que se ejecutan localmente.Page Assi...
hace 1 año
086.7K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: un sistema de mejora de la memoria basado en la extensión de código Roo

Introducción completa RooFlow es una herramienta de programación asistida por IA de código abierto con la funcionalidad principal de preservar el código, las decisiones y el progreso de las tareas durante el desarrollo mediante el registro de proyectos. Se basa en la extensión Roo Code e integra cinco modos: arquitectura, codificación, pruebas, depuración y preguntas y respuestas. Estos modos inter...
hace 1 año
086.5K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: restauración facial de imágenes y vídeos, restauración de fotos antiguas, ofrece una versión de despliegue con un solo clic

CodeFormer Introducción general CodeFormer es un código base para la reparación robusta de rostros ciegos, desarrollado por un equipo de investigadores del S-Lab de la Universidad Tecnológica de Nanyang y presentado en NeurIPS 2022. El proyecto utiliza un transformador de búsqueda de c...
hace 2 años
086.3K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: un asistente de IA para la generación de descripciones de texto Flujos de trabajo ComfyUI

Introducción general ComfyUI-Copilot es un nodo personalizado impulsado por IA diseñado para el marco ComfyUI, con el objetivo de mejorar la eficiencia de la depuración y el despliegue de algoritmos de IA a través de la interacción del lenguaje natural. Está desarrollado por el equipo AIDC-AI (Alibaba) y derivado de GitHu...
hace 1 año
086.1K