Proyecto AI de código abierto

Total 1020 artículos
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: inclusión automática de sitios web y compatibilidad con el sitio de navegación multilingüe de herramientas de IA de código abierto

Introducción general AigoTools es un código abierto AI navegación de sitios web diseñado para ayudar a los usuarios a crear y gestionar rápidamente los sitios de navegación. Se ha incorporado en la gestión del sitio y las características de auto-inclusión basada en AI , soporte para multi-idioma , cambio de tema oscuro / claro , y la optimización SEO.AigoTools propone...
hace 10 meses
02.9K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: la API del modelo Gemini es compatible con el formato OpenAI, desbloquea las restricciones regionales y admite el sondeo de claves multiAPI.

Introducción completa Gemini Balance es un servicio proxy de API OpenAI desarrollado sobre la base del marco FastAPI, con el objetivo de proporcionar una gestión eficaz de claves multiAPI y funciones de optimización. El proyecto es compatible con las llamadas al modelo Gemini, y entre sus principales...
hace 4 meses
02.9K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: añade sonido sincronizado a un vídeo mudo

Introducción general FoleyCrafter es un proyecto de código abierto desarrollado por OpenMMLab para generar efectos de sonido vívidos y sincronizados para vídeos mudos. El proyecto utiliza técnicas avanzadas de inteligencia artificial para generar efectos de sonido semánticamente relevantes y sincronizados en el tiempo mediante el análisis del contenido del vídeo....
hace 8 meses
02.9K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: herramienta inteligente diseñada para analizar datos tabulares complejos

Introducción completa TableGPT Agent es una herramienta inteligente basada en el proyecto de código abierto GitHub, diseñada para procesar y analizar datos tabulares. Se basa en el modelo Big Language TableGPT2, que utiliza la interacción con el lenguaje natural para permitir a los usuarios consultar, manipular...
hace 6 meses
02.9K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: proyecto de código abierto para generar gráficos vectoriales SVG a partir de texto e imágenes

Introducción general OmniSVG es un proyecto de código abierto centrado en la generación de gráficos vectoriales (SVG) de alta calidad mediante un modelo multimodal. Utiliza modelos visual-lingüísticos preentrenados para apoyar la generación de SVG a partir de descripciones textuales o entradas de imágenes, cubriendo una amplia gama de escenarios, desde simples iconos hasta complejos personajes de anime. Elementos ...
hace 4 meses
02.9K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.

Introducción general TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle su ordenador a través de la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar...
hace 7 meses
02.9K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

tarjeta de luz: HTML5 herramienta generadora de tarjetas, crear hermosas tarjetas de contenido de herramientas simples

Descripción general lightcard es una herramienta de generación de tarjetas simple y elegante diseñada para ayudar a los usuarios a crear fácilmente hermosas tarjetas de contenido. La herramienta soporta contenido de texto personalizado, múltiples estilos de temas y códigos QR para hacer la creación más fácil y divertida. Los usuarios pueden editar el título, el cuerpo y el autor...
hace 8 meses
02.9K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy: Herramienta de conversión de contenidos de múltiples fuentes a audio multilingüe, una alternativa de código abierto a las funciones de podcasting de NotebookLM.

Introducción general Podcastfy es un paquete Python de código abierto que utiliza la tecnología de Inteligencia Artificial Generativa (GenAI) para convertir contenidos web, archivos PDF, texto, imágenes, vídeos de youtube y muchas otras fuentes en...
hace 10 meses
02.9K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: Asistente de programación inteligente que se ejecuta en un terminal de línea de comandos, alternativa localizada al intérprete de código ChatGPT.

Introducción GPTMe es un revolucionario asistente de IA para terminales diseñado para mejorar la eficiencia del trabajo de los desarrolladores. Combina a la perfección potentes capacidades de IA con el entorno del terminal, soportando diversas funciones como ejecución de código, edición de archivos, navegación web y reconocimiento visual. Como solucionador de código ChatGPT...
hace 8 meses
02.9K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK de código abierto para pizarras de lienzo ilimitadas, AI para generar wireframes minimalistas y diagramas UML.

Descripción general tldraw es una herramienta de dibujo colaborativo gratuita e instantánea que proporciona un lienzo ilimitado donde los usuarios pueden dibujar gráficos rápidamente, escribir texto y colaborar al instante. Con una interfaz intuitiva y un rendimiento excelente, es adecuada para la colaboración en equipo y el trabajo remoto. Apoyado por la comunidad de código abierto, tldr...
hace 9 meses
02.8K
QAnything:高度集成RAG处理流程的本地知识库问答系统

QAnything: Sistema de preguntas y respuestas de base de conocimientos local con flujo de procesamiento RAG altamente integrado

QAnything Introducción Completa QAnything (Question and Answer based on Anything) es un sistema de preguntas y respuestas de base de conocimiento local lanzado por NetEase, que admite todo tipo de formatos de archivo y bases de datos, y se puede instalar sin conexión para utilizar...
hace 11 meses
02.8K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: Automatización de navegadores, implementación de código abierto de OpenAI Operator

Introducción general AI Web Operator es una herramienta de código abierto AI navegador operador diseñado para simplificar la experiencia del usuario en el navegador mediante la integración de múltiples tecnologías de IA y SDKs. La herramienta se basa en Browserbase y Vercel....
hace 6 meses
02.8K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Asistente de corrección de la pronunciación en inglés

Introducción general Gemini Teacher es un asistente para practicar la pronunciación en inglés basado en la IA Gemini de Google. Reconoce la pronunciación inglesa del usuario en tiempo real y proporciona sugerencias de corrección y comentarios instantáneos. La herramienta está diseñada para ayudar a los usuarios a...
hace 6 meses
02.8K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: un marco ligero y flexible para organismos inteligentes, con una sencilla configuración de roles y herramientas para gestionar múltiples cargas de tareas.

Introducción general Bambo es un nuevo tipo de framework proxy, que es más ligero y flexible que los frameworks convencionales y puede manejar una gran variedad de tareas de carga.Bambo consigue una funcionalidad proxy eficiente definiendo todas las herramientas del catálogo de herramientas y utilizando funciones personalizadas asíncronas. Los usuarios pueden...
hace 8 meses
02.8K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: implementación rápida de la deduplicación semántica de textos para mejorar la eficacia de la limpieza de datos

Introducción completa SemHash es una herramienta ligera y flexible para desduplicar conjuntos de datos por similitud semántica. Combina la rápida generación de incrustaciones de Model2Vec con la eficaz búsqueda de similitud RNA (vecino más cercano aproximado) de Vicinity.SemHa...
hace 7 meses
02.8K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: extrae cualquier dato no estructurado de documentos/multimedia y lo analiza para convertirlo en datos estructurados.

Introducción general OmniParse es una potente plataforma de análisis y optimización de datos diseñada para transformar cualquier dato no estructurado en datos estructurados y procesables, optimizada para el marco GenAI (Generative Artificial Intelligence). Tanto si trabaja con documentos, tablas, imágenes, vídeos, archivos de audio o...
hace 9 meses
02.8K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: Ofrecer una solución de puerta de enlace de IA eficiente para simplificar la gestión de microservicios y mejorar la seguridad

Introducción completa Higress es una pasarela de API nativa de la nube desarrollada por Alibaba, construida sobre Istio y Envoy, diseñada para proporcionar soluciones eficientes de programación de tráfico, gobernanza de servicios y seguridad. Admite extensiones de plugin Wasm para múltiples lenguajes de programación para negocios de IA....
hace 9 meses
02.8K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview: un macromodelo de diálogo antropomórfico de extremo a extremo para la interacción en tiempo real

SpeechGPT 2.0-preview es el primer sistema antropomórfico de interacción en tiempo real introducido por OpenMOSS, que se entrena basándose en millones de horas de datos de habla. El sistema está equipado con una expresión hablada antropomórfica y una respuesta de baja latencia de 100 ms, lo que...
hace 6 meses
02.8K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: un editor de código colaborativo multijugador de alto rendimiento desarrollado por Rust

Introducción general Zed es un editor de código colaborativo multiusuario de alto rendimiento desarrollado por los creadores de Atom y Tree-sitter.Escrito en el lenguaje Rust, Zed está diseñado para proporcionar una experiencia de codificación rápida y fluida. Entre sus principales características se incluye la compatibilidad con...
hace 8 meses
02.8K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: una herramienta de código abierto para mejorar la calidad de la generación de imágenes y vídeos

Introducción exhaustiva CFG-Zero-star es un proyecto de código abierto desarrollado por Weichen Fan y el equipo S-Lab de la Universidad Tecnológica de Nanyang. Se centra en la mejora de la técnica Classifier Free Guidance (CFG) en modelos de correspondencia de flujos mediante la optimización de la estrategia de guiado y de la ...
hace 5 meses
02.8K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: generación de mundos 3D explorables en 360° a partir de una sola imagen (código de código abierto progresivo)

Introducción general GenEx es un modelo avanzado de IA capaz de generar un mundo tridimensional de 360° totalmente explorable a partir de una sola imagen. Los usuarios pueden explorar interactivamente este mundo generado.GenEx empuja los límites de la IA figurativa en el espacio imaginativo y tiene el potencial de...
hace 8 meses
02.8K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: Conjunto de herramientas de desarrollo de modelos de IA nativos de Windows, integración de modelos de extremo a extremo en aplicaciones Windows

Introducción general AI Dev Gallery es una aplicación de herramientas de desarrollo de IA de Microsoft (actualmente en vista previa pública) diseñada para desarrolladores de Windows. Proporciona una plataforma completa para ayudar a los desarrolladores a integrar fácilmente las funciones de IA en sus aplicaciones Windo...
hace 7 meses
02.8K
Pyramid Flow:快手推出的开源版

Pyramid Flow: una versión de código abierto de "Kringle" lanzada por Racer, basada en SD3 y que funciona en GPU de menos de 8 GB (versión de despliegue con un solo clic).

Introducción exhaustiva Pyramid Flow es un eficaz método autorregresivo de generación de vídeo basado en la técnica Flow Matching. El método consigue una mayor eficiencia computacional en la generación y descompresión de contenidos de vídeo interpolando entre diferentes resoluciones y niveles de ruido....
hace 9 meses
02.8K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: una herramienta de código abierto para facilitar el despliegue de modelos multimodales de IA

Introducción general Aana SDK es un marco de código abierto desarrollado por Mobius Labs, llamado así por la palabra malayalam ആന (elefante). Ayuda a los desarrolladores a desplegar y gestionar rápidamente modelos multimodales de IA, admitiendo el procesamiento de texto, imágenes, audio y vídeo, y otros datos....
hace 5 meses
02.8K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: un marco corporal inteligente para construir dispositivos inteligentes multimodales

Introducción general OmAgent es un marco de cuerpo inteligente multimodal desarrollado por Om AI Lab, con el objetivo de proporcionar potentes funciones impulsadas por IA para dispositivos inteligentes. Mediante la integración de modelos base multimodales de última generación y algoritmos de cuerpo inteligente, el proyecto permite a los desarrolladores crear dispositivos inteligentes eficientes en una variedad de...
hace 7 meses
02.8K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: una plataforma de diálogo de análisis de datos para consultas de datos y generación de gráficos en lenguaje natural

Introducción general PandasAI es una plataforma de código abierto basada en Python diseñada para simplificar el proceso de análisis de datos mediante técnicas de procesamiento del lenguaje natural. Permite a los usuarios trabajar en un diálogo con bases de datos (por ejemplo, SQL, CSV, pandas, polars, mongodb, n...
hace 9 meses
02.8K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: generar investigación sobre IA a partir del contenido de las búsquedas web

Introducción general Open Deep Research es una herramienta de código abierto de generación de informes de investigación impulsada por IA como alternativa de código abierto a las capacidades de investigación profunda de Google Gemini. El proyecto está desarrollado en TypeScript y basado en Next.js 1...
hace 4 meses
02.8K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Adaptador de historias: Genere ilustraciones gráficas continuas y coherentes basadas en una historia larga.

Introducción general Story-Adapter es un innovador marco de visualización de historias que convierte relatos textuales en secuencias de imágenes coherentes. Desarrollado por investigadores, este proyecto emplea un enfoque iterativo que no requiere formación para generar ilustraciones de historias de alta calidad. El marco se caracteriza por su capacidad para...
hace 7 meses
02.8K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: cliente AI de análisis y visualización de datos para la generación rápida de gráficos e informes

Introducción general DataLine es una potente herramienta de análisis y visualización de datos de IA diseñada para ayudar a los usuarios a interactuar con diversas fuentes de datos mediante operaciones sencillas. Ya sea un archivo CSV o una base de datos convencional como Postgres, MySQL, Snowflake, SQL...
hace 6 meses
02.8K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: Genera copias de vídeo y vídeos cortos en HD en un clic introduciendo un tema de vídeo

Introducción completa MoneyPrinterTurbo es un proyecto de código abierto que utiliza la tecnología avanzada AI big model para lograr la función de generar vídeos cortos de alta definición con un solo clic. Los usuarios sólo tienen que proporcionar un tema de vídeo o palabras clave, el sistema generará automáticamente la copia de vídeo, clips de vídeo, subtítulos de vídeo y...
hace 5 meses
02.8K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: Herramienta avanzada de código abierto para incrustar y extraer marcas de agua ocultas en vídeo y proteger los derechos de autor.

Introducción general VideoSeal es una herramienta de marca de agua de vídeo de código abierto desarrollada por Facebook Research, diseñada para proporcionar una incrustación y extracción eficientes de marcas de agua de vídeo. La herramienta es compatible con los últimos modelos de código abierto y contiene modelos preentrenados, código de entrenamiento, código de inferencia y herramientas de evaluación....
hace 8 meses
02.8K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: Permite a los usuarios consultar bases de datos SQLite y archivos CSV/JSON para obtener datos de consulta.

Introducción general SQLite-Utils-Ask es una potente herramienta diseñada para ayudar a los usuarios a realizar consultas de datos de preguntas y respuestas en bases de datos SQLite y archivos CSV/JSON con la ayuda de LLM (Large Language Model). La herramienta es capaz de generar automáticamente preguntas de usuario basadas en...
hace 9 meses
02.8K
Data Formulator:AI驱动的数据可视化工具

Data Formulator: una herramienta de visualización de datos basada en IA

Introducción general Data Formulator es una herramienta de código abierto de visualización de datos basada en IA desarrollada por Microsoft Research. La herramienta combina una interfaz gráfica de usuario (GUI) y la entrada de lenguaje natural (NL) para permitir a los usuarios crear e iterar rápidamente a través de interacciones y comandos sencillos....
hace 6 meses
02.8K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: un asistente inteligente para las redes sociales que genera y gestiona automáticamente los contenidos de las mismas.

Introducción general Social Media Agent (Agente de Medios Sociales) es un proyecto de código abierto que gestiona la información de interacción mediante el nuevo Agent Inbox, diseñado para ayudar a los usuarios a automatizar la generación y gestión de contenidos de medios sociales. El proyecto está desarrollado por el equipo LangChain...
hace 7 meses
02.8K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: herramienta de edición de vídeo sonoro 3D con profundidad de campo para retratos hablados

Introducción general JoyGen es un innovador marco de generación de vídeo en dos fases para rostros parlantes, centrado en resolver el problema de la generación de expresiones faciales basada en audio. Desarrollado por un equipo de Jingdong Technology, utiliza técnicas avanzadas de reconstrucción 3D y métodos de extracción de características de audio para capturar con precisión las características de identidad del hablante y la expresión...
hace 7 meses
02.8K
Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Introducción completa Vision Parse es una revolucionaria herramienta de procesamiento de documentos, que combina inteligentemente la tecnología más avanzada de modelos de lenguaje visual (Vision Language Models), la capacidad de convertir inteligentemente documentos PDF a formato Markdown de alta calidad...
hace 8 meses
02.8K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Descarga rápidamente WeChat Video No. de vídeo, soporta múltiples formatos y plataformas

Introducción completa WeChat Video No. Downloader es un proyecto de código abierto diseñado para ayudar a los usuarios a descargar rápidamente el contenido de vídeo de los números de vídeo WeChat. La herramienta es compatible con una gran variedad de formatos de vídeo y plataformas, y los usuarios pueden utilizarla fácilmente en sistemas Windows y macOS. El proyecto está desarrollado por ltaoo y alojado en...
hace 7 meses
02.8K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: base de conocimientos conversacional basada en GraphRAG/herramienta de búsqueda profunda en la web con diálogos que pueden integrarse en otros sitios web.

Introducción general AutoFlow es una herramienta de código abierto desarrollada por PingCAP para construir bases de conocimiento basadas en grafos con almacenamiento vectorial sin servidor TiDB. Integra los frameworks LlamaIndex y DSPy para soportar búsquedas complejas de diálogos y grafos de conocimiento....
hace 7 meses
02.8K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: Creación de un marco de desarrollo de aplicaciones de datos nativas de IA que integra la gestión multimodelo y el procesamiento inteligente de datos

Introducción general DB-GPT es un marco de desarrollo de aplicaciones de datos nativas de IA de código abierto construido utilizando AWEL (Agentic Workflow Expression Language) y tecnologías de cuerpo inteligente. El proyecto pretende crear una infraestructura en el ámbito de los grandes modelos...
hace 5 meses
02.8K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3: modelo de generación de imágenes por difusión de texto en cascada de código abierto de Wisdom Spectrum

Introducción CogView3 es un sistema avanzado de generación de imágenes de texto desarrollado por la Universidad de Tsinghua y Think Tank Team (Chi Spectrum Qingyan). Se basa en un modelo de difusión en cascada y genera imágenes de alta resolución a través de múltiples etapas.Las características clave de CogView3 incluyen la generación en múltiples etapas, una arquitectura innovadora y un rendimiento eficiente....
hace 10 meses
02.8K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Herramienta de supervisión de la degradación del servicio ChatGPT: Detección de degradaciones del servicio ChatGPT

Introducción completa La herramienta de monitorización de la degradación del servicio ChatGPT es un proyecto de código abierto diseñado para ayudar a los usuarios a detectar si su servicio ChatGPT se ha degradado debido a IPs de alto riesgo. La herramienta analiza los valores de dificultad de Proof of Work (PoW) para determinar si los usuarios...
hace 8 meses
02.8K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: simulación multiinteligente de las interacciones en redes sociales de millones de usuarios para estudiar fenómenos sociales complejos

Introducción general OASIS (Open Agent Social Interaction Simulations) es un simulador de redes sociales de código abierto capaz de simular el comportamiento de hasta un millón de usuarios. La plataforma combina un modelo lingüístico a gran escala con un...
hace 5 meses
02.8K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: generación de modelos de conversión de texto en voz específicos para cada hablante a partir de un texto de entrada

Introducción general Parler-TTS es una biblioteca de modelos de texto a voz (TTS) de código abierto desarrollada por Hugging Face, diseñada para generar habla de alta calidad y sonido natural. El modelo es capaz de generar habla a partir de un texto de entrada con un estilo de locutor específico (por ejemplo, género, tono, estilo de habla...
hace 6 meses
02.8K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de generación de poses para hacer bailar las fotos de Missy

Introducción general X-Dyna es un proyecto de código abierto desarrollado por ByteDance para generar animaciones dinámicas de retratos utilizando técnicas de difusión de muestra cero. El proyecto utiliza expresiones faciales y movimientos corporales en vídeo de unidad para animar imágenes de retratos individuales, generando efectos de movimiento realistas y conscientes del contexto.X-D...
hace 7 meses
02.8K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank: gestión del presupuesto diario basada en inteligencia artificial para facilitar el seguimiento de los presupuestos diarios

Descripción general Porkybank es una aplicación de gestión de finanzas personales de código abierto diseñada para ayudar a los usuarios a controlar fácilmente su presupuesto diario. Con una sencilla fórmula (Ingresos - Gastos) / Días = Efectivo, los usuarios pueden visualizar su situación financiera. El proyecto está alojado en GitHu...
hace 7 meses
02.8K
GaiaNet node:安装和运行自己的本地模型在线代理服务

Nodo GaiaNet: instale y ejecute su propio modelo local de servicio proxy en línea

Introducción general GaiaNet-AI/gaianet-node es un proyecto de código abierto que permite a los usuarios instalar rápidamente la pila de software de nodos por defecto en Mac, Linux o Windows WSL con un solo comando. Los usuarios pueden inicializar nodos, personalizar configuraciones, descargar...
hace 11 meses
02.8K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Laboratorio de agentes: asistente automatizado de codificación y redacción de estudios para investigadores

Introducción completa Agent Laboratory es un flujo de trabajo de investigación autónomo de extremo a extremo diseñado para ayudar a los investigadores a hacer realidad sus ideas de investigación. El sistema se compone de agentes dedicados controlados por modelos lingüísticos a gran escala que dan soporte a todo el flujo de trabajo de investigación, desde la realización de...
hace 4 meses
02.8K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: convierta PDF en podcasts de herramientas de código abierto

Introducción general Open NotebookLM es un proyecto de código abierto diseñado para convertir cualquier documento PDF en un podcast. La herramienta utiliza modelos de código abierto Large Language Model (LLM) y Text-to-Speech (TTS) para procesar contenidos PDF y generar diálogos naturales adecuados para podcasts de audio....
hace 6 meses
02.8K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: un marco de diálogo vocal en tiempo real compatible con múltiples idiomas y acentos para modelos de base de diálogo vocal

Introducción general Moshi Chat es un asistente de voz de IA en tiempo real de Kyutai, un laboratorio francés de IA sin ánimo de lucro. No solo escucha en tiempo real, sino que también participa en conversaciones naturales y admite interacciones multimodales, incluida la capacidad de ver, oír y hablar.Moshi Ch...
hace 11 meses
02.8K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: una herramienta basada en grafos heterogéneos para la recuperación y generación de información precisa

Una introducción completa NodeRAG es un sistema de código abierto de Generación Aumentada de Recuperación (RAG) alojado en GitHub y desarrollado por Terry-Xu-666. Optimiza la recuperación y generación de información a través de estructuras de grafos heterogéneos, mejorando significativamente la precisión de la recuperación y la relevancia contextual.Nod...
hace 4 meses
02.8K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: un asistente de inteligencia artificial para la investigación profunda multilingüe

Introducción exhaustiva Deep Research Web UI es una herramienta asistente de investigación de código abierto basada en tecnología de IA, diseñada para ayudar a los usuarios a realizar investigaciones iterativas profundas sobre cualquier tema. Combina la potencia de los motores de búsqueda, el rastreo web y el modelado lingüístico a gran escala a través de una interfaz web intuitiva....
hace 4 meses
02.8K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot backend proxy service: hacerse cargo del servidor de plugins de GitHub Copilot con otros modelos

Introducción general El Copilot Backend Agent Service es un proyecto de código abierto diseñado para gestionar el servidor de plugins de GitHub Copilot aprovechando otros modelos FIM como DeepSeek, a la vez que soporta que varias personas compartan cuentas oficiales. El servicio soporta una variedad de IDEs, incluyendo V...
hace 8 meses
02.8K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

mAIstro de informes: Genere informes detallados sobre cualquier tema personalizado, como análisis de negocio, informes de fin de año, etc.

Descripción general Report mAIstro es una potente herramienta diseñada para ayudar a los usuarios a crear fácilmente informes personalizados mediante la tecnología de procesamiento del lenguaje natural. La herramienta utiliza la tecnología LangChain para transformar los temas y estructuras proporcionados por el usuario en informes detallados dentro de...
hace 4 meses
02.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: motor de búsqueda de IA de código abierto para desplegar su propio motor de búsqueda Perplexity.

Introducción general MindSearch es un marco de motor de búsqueda de IA de código abierto lanzado por el Laboratorio de Inteligencia Artificial de Shanghai (SAL), cuyo objetivo es simular el proceso de pensamiento humano para la recopilación e integración de información compleja. La herramienta combina las tecnologías avanzadas de modelado de lenguaje a gran escala (LLM) y motores de búsqueda a través de la multiinteligencia....
hace 8 meses
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: una herramienta de código abierto para la extracción y exploración eficientes de datos estructurados

Introducción exhaustiva Knowledge Table (Tabla de conocimientos) es un proyecto de código abierto diseñado para simplificar el proceso de extracción y exploración de datos estructurados a partir de documentos no estructurados. Los usuarios pueden crear representaciones estructuradas del conocimiento, como tablas y gráficos, mediante una interfaz de consulta en lenguaje natural. La herramienta permite personalizar la extracción ...
hace 10 meses
02.8K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: un cliente de diálogo con IA que utiliza la inteligencia MCP para realizar tareas complejas.

Introducción general HyperChat es un cliente de chat de código abierto desarrollado por BigSweetPotatoStudio y alojado en GitHub, diseñado para proporcionar una visión global del modelo lingüístico de BigSweetPotatoStudio mediante la integración de API de varios grandes modelos lingüísticos (LLM) como OpenAI, Cla...
hace 5 meses
02.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: creación de grafos de conocimiento y motores de búsqueda personales de ejecución local

Introducción general Unigraph es un grafo de conocimiento de propósito general y motor de búsqueda personal diseñado para proporcionar a los usuarios un espacio de trabajo integrado que les ayude a gestionar y buscar una amplia variedad de datos en su vida personal. Con Unigraph, los usuarios pueden integrar datos de distintas fuentes en un...
hace 7 meses
02.8K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic: marco unificado de generación de música, canciones y audio de código abierto de Ali.

Introducción general InspireMusic es un conjunto de herramientas de código abierto basado en PyTorch centrado en la generación de música, canciones y audio. Proporciona un marco unificado para generar audio de alta calidad con controles para pistas de texto, estructura musical y estilo musical.Inspire...
hace 5 meses
02.8K
Vector Vein(向量脉络):无代码AI工作流构建平台

Vector Vein: plataforma de creación de flujos de trabajo de IA sin código

Introducción completa Vector Vein es una plataforma de creación de flujos de trabajo de IA sin código diseñada para ayudar a los usuarios a crear fácilmente flujos de trabajo inteligentes y automatizados. Sin necesidad de conocimientos de programación, los usuarios pueden simplemente conectar varios módulos funcionales a través de operaciones de arrastrar y soltar para construir...
hace 8 meses
02.8K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: Creación de mini-inteligencias LLM con "estructura de grafo dirigido" en 100 líneas de código

Introducción general miniLLMFlow es un marco de desarrollo minimalista de Large Language Model (LLM) que contiene sólo 100 líneas de código central, demostrando la filosofía de diseño de "mantenerlo simple". El marco está diseñado específicamente para permitir a los asistentes de IA (por ejemplo, ChatGPT, Claude, etc.)...
hace 7 meses
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automatización de correo electrónico con IA localizada para la generación rápida de respuestas a borradores de correo electrónico (Gmail)

Introducción general LAMBDA (Local Auto MailBox Draft Assistant) es un sistema de automatización de correo electrónico con IA localizada diseñado para aprender del estilo de correo electrónico de un usuario y generar un borrador para cada correo no leído en la bandeja de entrada de Gmail....
hace 8 meses
02.8K
基于RAG构建提供健康建议的小助手(实验项目)

Construcción basada en el GAR de un miniasistente que proporcione asesoramiento sanitario (proyecto piloto)

Introducción general LLM-RAG-Longevity-Coach es un chatbot basado en las tecnologías Large Language Modelling (LLM) y Retrieval Augmented Generation (RAG) diseñado para proporcionar consejos personalizados sobre salud y longevidad a los usuarios. El proyecto fue desarrollado por Tyler Burle...
hace 6 meses
02.8K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicación web de chat con inteligencia artificial de código abierto con carga de documentos y compatibilidad multimodelo

Introducción general Zola es una aplicación de chat de IA gratuita y de código abierto desarrollada por el desarrollador Julien Thibeaut (nombre de usuario de GitHub ibelick) y alojada en GitHub. Su mejor característica es que soporta múltiples modos de IA...
hace 4 meses
02.7K
Flock:低代码工作流编排快速构建聊天机器人

Flock: orquestación de flujos de trabajo de bajo código para la creación rápida de chatbots

Introducción general Flock es una plataforma de código abierto para flujos de trabajo, alojada en GitHub y desarrollada por el equipo Onelevenvy. Se basa en las tecnologías LangChain y LangGraph y se centra en ayudar a los usuarios a construir rápidamente máquinas de chat....
hace 6 meses
02.7K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: despliegue sin servidor de un sitio de diálogo multimodal Gemini

Introducción General Gemini Playground es un proyecto de código abierto diseñado para ayudar a los usuarios a implementar rápidamente un sitio de diálogo multimodal . El proyecto es desarrollado por el camarón de rastreo técnico , apoyar el uso de Gemini API Key en 10 segundos para completar el despliegue . Si el usuario es ...
hace 6 meses
02.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: un completo conjunto de herramientas para construir inteligencias IA basadas en LangGraph

Introducción El AI Agent Service Toolkit es un conjunto de herramientas completo basado en LangGraph, FastAPI y Streamlit, diseñado para ayudar a los desarrolladores a crear y ejecutar rápidamente servicios de agentes de IA. El conjunto de herramientas proporciona...
hace 7 meses
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extracción y categorización de documentos en datos estructurados para optimizar el proceso de tratamiento de documentos.

Introducción exhaustiva ExtractThinker es una herramienta flexible de inteligencia de documentos que extrae y clasifica datos estructurados de documentos utilizando modelos de grandes lenguajes (LLM), proporcionando un flujo de trabajo de procesamiento de documentos sin fisuras similar a ORM. Es compatible con diversos cargadores de documentos, como Tess...
hace 7 meses
02.7K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: modelo de generación directa de voces de rap a partir de letras y pistas de acompañamiento (conjunto de datos abierto actualmente).

Introducción general RapBank es un conjunto de datos y herramientas diseñado para la generación de letras de rap. El proyecto fue creado por NZqian para proporcionar a investigadores y desarrolladores datos de alta calidad sobre letras de rap mediante la recopilación y el procesamiento de...
hace 8 meses
02.7K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: una interfaz de gestión para la interacción persona-ordenador con inteligencias IA

Introducción general Agent Inbox es un proyecto de código abierto desarrollado por el equipo LangChain para proporcionar una nueva experiencia de usuario para interactuar con inteligencias AI. El proyecto permite a los usuarios gestionar y optimizar las interacciones con múltiples inteligencias IA a través de una interfaz centralizada.Ag...
hace 7 meses
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: un entorno de programación visual de código abierto para probar y evaluar la eficacia de grandes sugerencias de modelos lingüísticos

Introducción general ChainForge es un entorno de programación visual de código abierto diseñado para probar y evaluar la eficacia de grandes modelos de lenguaje (LLM). Proporciona un entorno de ingeniería de señales de flujo de datos a través del cual los usuarios pueden explorar y analizar rápidamente la calidad de las diferentes señales en la respuesta LLM....
hace 8 meses
02.7K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: basado en el modelo OCR multimodal de extremo a extremo QWen2 0.5B

Introducción exhaustiva GOT-OCR2.0 es un modelo de reconocimiento óptico de caracteres (OCR) de código abierto co-propuesto por StepStar, cuyo objetivo es impulsar la tecnología OCR hacia OCR-2.0 mediante un modelo unificado de extremo a extremo. El modelo soporta una amplia gama de tareas de OCR, incluyendo el reconocimiento de texto normal, gr...
hace 11 meses
02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: servicio de almacenamiento y recuperación de documentos basado en incrustación visual

Introducción general ColiVara es un servicio de almacenamiento y recuperación de documentos basado en la tecnología de incrustación visual. Elimina la necesidad de reconocimiento óptico de caracteres (OCR) o extracción de texto y evita los problemas de formularios rotos o imágenes perdidas.ColiVara admite más de 100 formatos de archivo, incluidos PDF...
hace 6 meses
02.7K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atómicos: un marco para construir inteligencias de IA modulares y ligeras

Introducción general Atomic Agents es un framework extremadamente ligero y modular diseñado en torno al concepto de atomicidad para construir pipelines y aplicaciones de IA con agentes. El marco proporciona un conjunto de herramientas y agentes que pueden combinarse para crear potentes aplicaciones. Se basa en Instruc...
hace 8 meses
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: Wisdom Spectrum lanzó un potente modelo de generación de textos ultralargos, que permite generar más de 10.000 palabras en una sola conversación.

Introducción LongWriter es una potente herramienta de generación de textos largos desarrollada por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM). La herramienta se basa en el avanzado Long Context Language Model (LLM) y es capaz de generar textos largos de más de 10.000 palabras.LongWriter...
hace 8 meses
02.7K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: revolucionaria tecnología de generación de imágenes de altísima resolución con gran riqueza de detalles

Introducción general UltraPixel es una tecnología avanzada de generación de imágenes de ultra alta resolución diseñada para crear imágenes de altísima calidad y ricas en detalles. Fue desarrollada por el usuario de GitHub catcathh y presentada en NeurIPS 2024.U...
hace 10 meses
02.7K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: una herramienta de IA para analizar las relaciones entre los personajes de un libro y generar gráficos

Introducción general Austen es una herramienta de IA de código abierto que utiliza el framework Angular y la inicialización Analogjs, combinados con la tecnología Mermaidjs para generar gráficos que ayudan a los usuarios a analizar las relaciones entre personajes en los libros. Los usuarios pueden...
hace 4 meses
02.7K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: extrae los datos del cuerpo de una URL HTML, salida texto plano/markdown

Introducción general magic-html es una biblioteca de Python diseñada para simplificar el proceso de extracción del contenido de la región del cuerpo a partir de HTML. Tanto si se trata de estructuras HTML complejas como de páginas web sencillas, esta biblioteca pretende proporcionar una interfaz cómoda y eficiente a los usuarios. Soporta la extracción multimodal...
hace 11 meses
02.7K