Proyecto AI de código abierto

Total 1020 artículos
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: Generación de código de automatización del navegador para convertir acciones del ratón en scripts Selenium Python mediante IA

Introducción general AutoMouser es una extensión de Chrome que rastrea de forma inteligente las interacciones del usuario y genera automáticamente código de prueba Selenium utilizando los modelos GPT de OpenAI. Para ello, registra las acciones del navegador del usuario y las convierte...
hace 1 año
064.6K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: Creación de mini-inteligencias LLM con "estructura de grafo dirigido" en 100 líneas de código

Introducción general miniLLMFlow es un marco de desarrollo minimalista de Large Language Model (LLM) que contiene sólo 100 líneas de código central, demostrando la filosofía de diseño de "mantenerlo simple". El marco está diseñado específicamente para permitir a los asistentes de IA (por ejemplo, ChatGPT, Claude, etc.)...
hace 1 año
064.6K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: una herramienta de código abierto para completar todo el proceso de investigación científica con agentes inteligentes

Introducción general AgentLaboratory es una herramienta de código abierto alojada en GitHub y desarrollada por Samuel Schmidgall. Utiliza agentes inteligentes impulsados por Large Language Models (LLMs) para ayudar a los investigadores con todo el proceso de...
hace 1 año
064.5K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: herramienta de lectura de código fuente, que utiliza LLM para analizar el código, proporcionar explicaciones detalladas del código, soporte para una variedad de lenguajes de programación.

Introducción general askrepo es una herramienta de lectura de código fuente basada en LLM (Large Language Model). Puede leer el contenido de un archivo de texto gestionado por Git en un directorio especificado y enviarlo a la API Gemini de Google para proporcionar respuestas a preguntas basadas en preguntas especificadas....
hace 2 años
064.5K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: una herramienta de gestión que combina la aprobación automatizada inteligente de procesos con auditorías humanas.

Introducción general LLManager es una herramienta de gestión de aprobación inteligente de código abierto, desarrollada en base al marco LangGraph de LangChain, centrada en la automatización del procesamiento de las solicitudes de aprobación al tiempo que optimiza la toma de decisiones con revisión humana. Lo hace a través de la búsqueda semántica, el aprendizaje...
hace 1 año
064.4K
集成多种先进语音合成服务的开源运营项目

Proyecto operativo de código abierto que integra múltiples servicios avanzados de síntesis de voz

Introducción general Open-VoiceCanvas es una plataforma de síntesis de voz de código abierto desarrollada por el equipo ItusiAI. Soporta más de 50 idiomas, y puede convertir texto en habla natural, así como clonar voces personalizadas subiendo audio. El proyecto integra Ope...
hace 1 año
064.4K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI: versión de código abierto de una herramienta de clonación humana digital y generación de vídeos cortos con IA

Introducción completa Metaverse AI (versión de código abierto) es un proyecto alojado en GitHub, desarrollado por el equipo libn-net. Puede clonar imágenes y voces humanas digitales mediante tecnología de IA para generar vídeos cortos, y también admite doblaje y subtitulación. Esta herramienta proporciona...
hace 1 año
064.4K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate: una herramienta nativa que combina IA y RPA para automatizar tareas informáticas

Introducción completa autoMate es una herramienta de automatización local desarrollada por yuruotong1 de código abierto en GitHub, con AI + RPA (Inteligencia Artificial + Automatización Robótica de Procesos) como su característica principal. Combina la comprensión inteligente de modelos lingüísticos a gran escala con RPA....
hace 1 año
064.4K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术

StreamingT2V: generación dinámica y escalable de texto a vídeo largo

Introducción integral StreamingT2V es un proyecto público desarrollado por el equipo de investigación en IA de Picsart centrado en generar vídeos largos coherentes, dinámicos y escalables basados en descripciones textuales. Esta tecnología utiliza un enfoque autorregresivo avanzado que garantiza la coherencia temporal del vídeo con el texto descriptivo estrechamente...
hace 2 años
064.3K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: lectura de archivos de texto de repositorios git y fragmentación rápida de modelos de gran tamaño

Introducción general Yek es una herramienta rápida basada en Rust para leer archivos de texto de repositorios o directorios, trocearlos y serializarlos para su uso en grandes modelos lingüísticos (LLM). La herramienta utiliza la regla .gitignore por defecto para omitir archivos innecesarios, y utiliza...
hace 1 año
064.3K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automatización de correo electrónico con IA localizada para la generación rápida de respuestas a borradores de correo electrónico (Gmail)

Introducción general LAMBDA (Local Auto MailBox Draft Assistant) es un sistema de automatización de correo electrónico con IA localizada diseñado para aprender del estilo de correo electrónico de un usuario y generar un borrador para cada correo no leído en la bandeja de entrada de Gmail....
hace 1 año
064.3K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: descargador de vídeo por línea de comandos compatible con casi todas las plataformas de vídeo

Introducción general Lux es una biblioteca de descarga de vídeo rápida y sencilla y una herramienta de línea de comandos escrita en Go. Soporta la descarga de vídeos de múltiples sitios web, incluyendo YouTube, Bilibili, Youku, etc. Lux ofrece una variedad de opciones de descarga y características, tales como la descarga multi-hilo....
hace 1 año
064.3K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: una herramienta de chat para recuperar conocimientos a partir de datos de Wikipedia

Introducción general WikiChat es un chatbot experimental desarrollado en la Universidad de Stanford que pretende mejorar la factualidad de los grandes modelos lingüísticos recuperando datos de Wikipedia. Los grandes modelos lingüísticos (como ChatGPT y GPT-4) tienden a procesar información actualizada o temas menos populares cuando...
hace 1 año
064.3K
Ovis:视觉与文本对齐模型,精准反推图像提示词

Ovis: un modelo de alineación visual y textual para la retropropagación precisa de palabras clave de imágenes

Introducción general Ovis (Open VISion) es un modelo de lenguaje multimodal (MLLM) de código abierto desarrollado por el equipo AIDC-AI del Grupo de Comercio Digital Internacional de Alibaba y alojado en GitHub.El modelo utiliza una innovadora técnica de alineación de estructura...
hace 1 año
064.2K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: Base de conocimientos + LLM Mentor inteligente de revisión de código para GitHub

Introducción completa CR-Mentor es una herramienta inteligente de revisión de código que combina una base de conocimientos profesional con la potencia de Large Language Modelling (LLM). No sólo admite la revisión de código para todos los lenguajes de programación, sino que también personaliza criterios de revisión exclusivos y áreas de enfoque para los equipos basándose en las mejores prácticas acumuladas en la base de conocimientos. A través de...
hace 2 años
064.2K
SuperCoder:命令行终端运行的智能代码助手

SuperCoder: Asistente de código inteligente para la ejecución de terminales de línea de comandos

Introducción general SuperCoder es una herramienta inteligente que se ejecuta en el terminal y está diseñada para programadores. Utiliza tecnología de IA para ayudar a los usuarios a buscar código, ver la estructura del proyecto, editar archivos y corregir errores.El proyecto es de código abierto por huytd en GitHub y soporta...
hace 1 año
064.1K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: servicio de almacenamiento y recuperación de documentos basado en incrustación visual

Introducción general ColiVara es un servicio de almacenamiento y recuperación de documentos basado en la tecnología de incrustación visual. Elimina la necesidad de reconocimiento óptico de caracteres (OCR) o extracción de texto y evita los problemas de formularios rotos o imágenes perdidas.ColiVara admite más de 100 formatos de archivo, incluidos PDF...
hace 1 año
064.1K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: a framework for automated large language model evaluation, comparing the quality of output of different large model cue words (en inglés)

Introducción completa DeepEval es un marco de evaluación LLM de código abierto fácil de usar para evaluar y probar grandes sistemas de modelado del lenguaje. Es similar a Pytest, pero se centra en las pruebas unitarias de los resultados LLM. DeepEval combina los últimos resultados de la investigación...
hace 1 año
064.1K
Browse AI:无代码提取和监控结构化数据

Explorar la IA: extraer y supervisar datos estructurados sin código

Presentación de Browse Browse AI es un software de automatización web sin codificación basado en la nube diseñado para ayudar a los usuarios a extraer y supervisar datos de cualquier sitio web sin necesidad de programación. Puede entrenar a un bot para que realice tareas de extracción, supervisión y automatización de datos con solo...
hace 2 años
064.1K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: el estilo de interfaz unificado de OpenAI llama a varios modelos grandes, cambio rápido de modelo y pruebas comparativas.

Introducción completa aisuite es una interfaz sencilla y unificada diseñada para permitir a los desarrolladores invocar fácilmente los servicios de múltiples proveedores de IA generativa. Con una interfaz similar a OpenAI, aisuite facilita la interacción con los LLM (Large Language Models) más populares....
hace 2 años
064.1K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: Mejorando la Experiencia de Desarrollo de Cursor IDE, Haciendo de Cursor/Windsurf un Asistente de Programación Inteligente similar a Devin.

Introducción General Devin.cursorrules es un innovador proyecto de código abierto diseñado para convertir el asequible Cursor o Windsurf IDE (~$20) en un potente asistente de programación AI como Devin. El proyecto proporciona un conjunto de ...
hace 1 año
064K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: un marco eficiente para crear aplicaciones colaborativas multiinteligentes

Introducción general AIEvo es el marco multiagente de código abierto de Ant Group diseñado para crear aplicaciones multiagente de forma eficiente. El framework sigue estrictamente el grafo de tareas SOP para mejorar la tasa de éxito en la ejecución de tareas complejas, y garantiza una alta flexibilidad y escalabilidad mediante mecanismos de retroalimentación y monitorización.AIEvo ha sido producido dentro de Ant Group...
hace 1 año
064K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: Genera automáticamente documentos Markdown a partir de la estructura y el contenido del código.

Introducción general CodeWeaver es una herramienta de línea de comandos diseñada para entretejer bibliotecas de código en documentos Markdown únicos y fáciles de navegar. Genera una representación estructurada de la jerarquía de archivos de un proyecto escaneando recursivamente los directorios e incrustando el contenido de cada archivo en bloques de código. Esta herramienta...
hace 1 año
063.9K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: marco de agentes de vídeo inteligentes para realizar flujos de trabajo de búsqueda, edición y generación de vídeo con descripciones en lenguaje natural.

Introducción general Director es un marco de trabajo de código abierto diseñado para simplificar y optimizar las interacciones y los flujos de trabajo de vídeo mediante la creación de agentes de vídeo inteligentes. El marco se basa en la infraestructura de "vídeo como datos" de VideoDB y es capaz de gestionar tareas de vídeo complejas como la búsqueda, edición, compilación y generación de...
hace 2 años
063.9K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atómicos: un marco para construir inteligencias de IA modulares y ligeras

Introducción general Atomic Agents es un framework extremadamente ligero y modular diseñado en torno al concepto de atomicidad para construir pipelines y aplicaciones de IA con agentes. El marco proporciona un conjunto de herramientas y agentes que pueden combinarse para crear potentes aplicaciones. Se basa en Instruc...
hace 1 año
063.8K
R1-Omni:通过视频和音频分析情感的开源模型

R1-Omni: un modelo de código abierto para analizar emociones a través de vídeo y audio

Introducción general R1-Omni es un proyecto de código abierto lanzado en GitHub por el equipo HumanMLLM. Es la primera aplicación de técnicas de Aprendizaje por Refuerzo con Recompensas Verificables (RLVR) a un gran modelo de lenguaje multimodal, centrado en el reconocimiento de sentimientos. El proyecto analiza datos de vídeo y audio...
hace 1 año
063.8K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: servicio de razonamiento LLM basado en datos externos de grafos de conocimiento en tiempo real.

Introducción exhaustiva Diffbot LLM Reasoning Server es un innovador sistema de modelado lingüístico a gran escala con optimizaciones y mejoras especiales basadas en la arquitectura del modelo LLama. La característica más importante del proyecto es la integración de Knowledge Graph en tiempo real con la generación mejorada de recuperación...
hace 1 año
063.8K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: base de conocimientos conversacional basada en GraphRAG/herramienta de búsqueda profunda en la web con diálogos que pueden integrarse en otros sitios web.

Introducción general AutoFlow es una herramienta de código abierto desarrollada por PingCAP para construir bases de conocimiento basadas en grafos con almacenamiento vectorial sin servidor TiDB. Integra los frameworks LlamaIndex y DSPy para soportar búsquedas complejas de diálogos y grafos de conocimiento....
hace 1 año
063.8K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP: un modelo híbrido de generación de vídeo compatible con GPU de gama baja

Introducción general HunyuanVideoGP es un modelo de generación de vídeo a gran escala desarrollado por DeepBeepMeep y diseñado para usuarios de GPU de gama baja. El modelo es una versión mejorada del modelo Hunyuan Video original, que reduce significativamente los requisitos de memoria y memoria gráfica....
hace 1 año
063.7K
Vibe Draw:将手绘草图转化为3D模型的创意工具

Vibe Draw: una herramienta creativa para convertir bocetos a mano en modelos 3D

Introducción general Vibe Draw es un proyecto de código abierto, desarrollado por Martin Sit, que permite a los usuarios convertir bocetos dibujados a mano en bonitos modelos 3D. El objetivo de esta herramienta es sencillo: facilitar a cualquiera el modelado en 3D, sin necesidad de grandes dotes artísticas ni re...
hace 1 año
063.6K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: herramienta de conversión de texto a voz multilingüe (compatible con más de 7000 idiomas), rápida y controlable.

Introducción general IMS Toucan es un avanzado kit de herramientas de conversión de texto a voz (TTS) desarrollado por el Instituto de Procesamiento del Lenguaje Natural (IMS) de la Universidad de Stuttgart (Alemania). El kit de herramientas es compatible con más de 7000 idiomas y es rápido, controlable y requiere pocos recursos informáticos.IMS...
hace 1 año
063.6K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: convertir ebooks epub en audiolibros m4b

Introducción general Autiobooks es una herramienta de código abierto diseñada para ayudar a los usuarios a convertir rápidamente libros electrónicos en formato .epub a audiolibros en formato .m4b. Utiliza tecnología de síntesis de voz de alta calidad proporcionada por Kokoro para generar un audio natural y fluido. Esta herramienta fue desarrollada por...
hace 1 año
063.6K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.

Introducción general TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle su ordenador a través de la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar...
hace 1 año
063.6K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件

WhoDB: software ligero de gestión de visualización de bases de datos con interacción en lenguaje natural

Introducción general WhoDB es una herramienta de gestión de bases de datos ligera (~20MB), potente y fácil de usar, diseñada para simplificar las tareas de administración de bases de datos. Combina la simplicidad de Adminer con la experiencia del usuario y mejoras en el rendimiento.WhoDB utiliza Go...
hace 2 años
063.5K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: Asistente de programación inteligente que se ejecuta en un terminal de línea de comandos, alternativa localizada al intérprete de código ChatGPT.

Introducción GPTMe es un revolucionario asistente de IA para terminales diseñado para mejorar la eficiencia del trabajo de los desarrolladores. Combina a la perfección potentes capacidades de IA con el entorno del terminal, soportando diversas funciones como ejecución de código, edición de archivos, navegación web y reconocimiento visual. Como solucionador de código ChatGPT...
hace 1 año
063.5K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: plataforma inteligente de carrozado para la automatización de flujos de trabajo y la ejecución autónoma de tareas

Descripción general AutoGPT es una potente plataforma diseñada para ayudar a los usuarios a crear, desplegar y gestionar agentes de IA en ejecución continua y automatizar flujos de trabajo complejos. Desarrollada por Significant Gravitas, la plataforma ofrece una amplia gama de herramientas y funciones que permiten a los usuarios centrarse...
hace 1 año
063.5K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: un sistema de preguntas y respuestas sobre documentos con un flujo de procesamiento RAG totalmente localizado

Introducción general PrivateGPT es un proyecto de IA disponible para entornos de producción que permite a los usuarios cuestionar documentos utilizando modelos lingüísticos a gran escala (LLM) sin conexión a Internet. El proyecto garantiza la privacidad de los datos para 100%, con todos los datos dispuestos en el entorno de ejecución del usuario....
hace 1 año
063.4K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: Captura automática de noticias para generar podcasts de audio

Introducción general AI Podcast Generator es una herramienta inteligente de generación de podcasts que utiliza tecnología avanzada de IA para crear automáticamente contenidos de audio atractivos a partir de fuentes web. El sistema genera narraciones de flujo natural capturando contenidos de noticias y convirtiéndolos en podcasts de audio. El proyecto se basa en la...
hace 2 años
063.4K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: herramienta de edición de vídeo sonoro 3D con profundidad de campo para retratos hablados

Introducción general JoyGen es un innovador marco de generación de vídeo en dos fases para rostros parlantes, centrado en resolver el problema de la generación de expresiones faciales basada en audio. Desarrollado por un equipo de Jingdong Technology, utiliza técnicas avanzadas de reconstrucción 3D y métodos de extracción de características de audio para capturar con precisión las características de identidad del hablante y la expresión...
hace 1 año
063.4K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: una herramienta de código abierto para la extracción y exploración eficientes de datos estructurados

Introducción exhaustiva Knowledge Table (Tabla de conocimientos) es un proyecto de código abierto diseñado para simplificar el proceso de extracción y exploración de datos estructurados a partir de documentos no estructurados. Los usuarios pueden crear representaciones estructuradas del conocimiento, como tablas y gráficos, mediante una interfaz de consulta en lenguaje natural. La herramienta permite personalizar la extracción ...
hace 2 años
063.4K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: un creador de portadas en línea diseñado para generar portadas personalizadas para blogs, vídeos cortos, redes sociales y mucho más.

Introducción general Mini-Cover es una herramienta de generación de portadas en línea de código abierto diseñada para generar portadas personalizadas para plataformas como blogs, vídeos cortos y redes sociales. Desarrollada por JLinMr, la herramienta pretende ofrecer una solución sencilla y eficaz para ayudar a los usuarios a generar rápidamente portadas que se ajusten a sus necesidades....
hace 1 año
063.3K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: herramienta de IA para extraer prendas de vestir de una persona como imagen de visualización de prendas en mosaico.

Introducción general TryOffAnyone es una innovadora herramienta de procesamiento de imágenes AI diseñada para resolver los desafíos de la exhibición de ropa en el sector del comercio electrónico. Es capaz de convertir de forma inteligente fotos de personas reales vistiendo ropa en imágenes de efecto de pantalla plana, esta tecnología se basa en la última...
hace 1 año
063.1K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: una herramienta de código abierto para detectar posibles riesgos de seguridad en los sistemas de IA

Introducción completa AI-Infra-Guard es una herramienta de evaluación de la seguridad de la infraestructura de IA de código abierto desarrollada por el equipo de seguridad híbrida de Tencent, Zhuqiao Labs, que está diseñada para ayudar a los usuarios a descubrir y detectar rápidamente posibles riesgos de seguridad en los sistemas de IA. La herramienta es compatible con más de 30 marcos y componentes de IA para...
hace 1 año
063.1K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model: Vídeo de referencia del mapa de retratos estáticos Vídeo de generación de movimiento de retratos

Introducción general Thin-Plate-Spline-Motion-Model es un innovador proyecto de generación de animación de imágenes presentado en CVPR 2022. El proyecto se basa en la teoría de las transformadas spline de placa delgada y es capaz de lograr movimiento de alta calidad a partir de imágenes fijas basadas en la conducción de vídeo....
hace 1 año
063.1K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: un plugin de WordPress AI Assistant para el diálogo, la generación de entradas y la traducción

Introducción completa WordPress AI Assistant Plugin (wp-ai-chat) es un plugin de WordPress de código abierto diseñado para proporcionar a los usuarios una variedad de características de AI, incluyendo el diálogo AI, la generación de artículos, resumen de artículos, traducción de artículos y lectura de contenidos. El plugin soporta el acoplamiento de múltiples ...
hace 1 año
063.1K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Laboratorio de agentes: asistente automatizado de codificación y redacción de estudios para investigadores

Introducción completa Agent Laboratory es un flujo de trabajo de investigación autónomo de extremo a extremo diseñado para ayudar a los investigadores a hacer realidad sus ideas de investigación. El sistema se compone de agentes dedicados controlados por modelos lingüísticos a gran escala que dan soporte a todo el flujo de trabajo de investigación, desde la realización de...
hace 1 año
063.1K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API de extracción de texto (text-extract-api): extracción visual de información textual, herramienta de extracción anónima de PDF

Introducción general La API de extracción de texto (text-extract-api) es una potente herramienta diseñada para extraer y analizar el contenido de diversos formatos de documento (por ejemplo, PDF, Word, PPTX, etc.). La API utiliza tecnología punta de reconocimiento óptico de caracteres (OCR) y Ol...
hace 1 año
063.1K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: Herramienta de línea de comandos para utilizar los servicios de MCP en cualquier modelo grande, no depende de Claude.

Introducción general La CLI del proveedor de contexto de modelo (mcp-cli) es una herramienta de línea de comandos a nivel de protocolo para interactuar con un servidor de proveedor de contexto de modelo. La herramienta permite a los usuarios enviar comandos, consultar datos e interactuar con diversos recursos proporcionados por el servidor...
hace 1 año
063K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: Ofrecer una solución de puerta de enlace de IA eficiente para simplificar la gestión de microservicios y mejorar la seguridad

Introducción completa Higress es una pasarela de API nativa de la nube desarrollada por Alibaba, construida sobre Istio y Envoy, diseñada para proporcionar soluciones eficientes de programación de tráfico, gobernanza de servicios y seguridad. Admite extensiones de plugin Wasm para múltiples lenguajes de programación para negocios de IA....
hace 2 años
063K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: un servicio MCP para rastrear y organizar rápidamente la documentación técnica

Introducción general DevDocs es una herramienta de código abierto completamente gratuita desarrollada por el equipo CyberAGI y alojada en GitHub. Diseñada para programadores y desarrolladores de software, parte de la URL de un documento técnico, rastrea automáticamente las páginas relevantes y las organiza en un conciso ma...
hace 1 año
062.9K
Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Introducción completa Vision Parse es una revolucionaria herramienta de procesamiento de documentos, que combina inteligentemente la tecnología más avanzada de modelos de lenguaje visual (Vision Language Models), la capacidad de convertir inteligentemente documentos PDF a formato Markdown de alta calidad...
hace 1 año
062.9K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy: Herramienta de conversión de contenidos de múltiples fuentes a audio multilingüe, una alternativa de código abierto a las funciones de podcasting de NotebookLM.

Introducción general Podcastfy es un paquete Python de código abierto que utiliza la tecnología de Inteligencia Artificial Generativa (GenAI) para convertir contenidos web, archivos PDF, texto, imágenes, vídeos de youtube y muchas otras fuentes en...
hace 2 años
062.9K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: una herramienta eficaz de rastreo web para el preentrenamiento de LLM

Introducción exhaustiva Crawl4LLM es un proyecto de código abierto desarrollado conjuntamente por la Universidad de Tsinghua y la Universidad Carnegie Mellon, centrado en optimizar la eficiencia del rastreo web para el preentrenamiento de grandes modelos (LLM). Reduce significativamente el rastreo ineficaz mediante la selección inteligente de datos web de alta calidad, afirmando ser capaz de rastrear originalmente 1...
hace 1 año
062.8K
OpenDeepSearch:支持智能推理的开源搜索工具

OpenDeepSearch: una herramienta de búsqueda de código abierto que permite el razonamiento inteligente

Introducción general OpenDeepSearch es una herramienta de búsqueda de código abierto desarrollada por el equipo sentient-agi. Combina Large Language Modelling (LLM) y Agentes de Razonamiento Inteligente para permitir a los usuarios buscar información en páginas web y obtener respuestas precisas de forma sencilla. Esta ...
hace 1 año
062.8K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: motor de recuperación de datos no estructurados y consultas complejas

Introducción general dsRAG es un motor de recuperación de alto rendimiento diseñado para gestionar consultas complejas sobre datos no estructurados. Funciona especialmente bien con consultas complejas en texto denso, como informes financieros, documentos jurídicos y trabajos académicos. dsRAG emplea tres enfoques clave para mejorar el rendimiento: lenguaje...
hace 1 año
062.7K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: capturas de pantalla de la interfaz de usuario convertidas en elementos estructurados para facilitar la comprensión y manipulación de modelos de gran tamaño.

Introducción general OmniParser es una herramienta desarrollada por Microsoft para analizar capturas de pantalla de la interfaz de usuario y convertirlas en elementos estructurados y fáciles de entender. Esta herramienta mejora significativamente la capacidad de GPT-4V para generar acciones precisas en el área de interfaz correspondiente.OmniParser no sólo admite...
hace 1 año
062.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: una herramienta multimodal de aprendizaje por refuerzo para explorar el razonamiento visual

Introducción general MM-EUREKA es un proyecto de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai, la Universidad Jiao Tong de Shanghai y otras partes. Amplía las capacidades de razonamiento textual a escenarios multimodales mediante técnicas de aprendizaje por refuerzo basadas en reglas para ayudar a los modelos a procesar información de imágenes y texto. El núcleo de esta herramienta...
hace 1 año
062.6K
BrownChat:开源实时语音聊天的AI助手

BrownChat: asistente de IA para chat de voz en tiempo real de código abierto

Introducción general BrownChat es una aplicación de chat de audio en tiempo real basada en la tecnología LLM (Large Language Modelling). Desarrollado por el usuario de GitHub sugarforever, el proyecto pretende mejorar la experiencia de comunicación del usuario mediante tecnología avanzada de procesamiento del lenguaje natural.B...
hace 1 año
062.6K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Swarm: un proyecto pedagógico experimental para el aprendizaje de sistemas corporales ligeros multiinteligentes (ejemplo de OpenAI)

Introducción general Swarm es un marco educativo experimental desarrollado por OpenAI para explorar interfaces ligeras, controladas y fáciles de probar para sistemas multiagente. El marco se utiliza principalmente para demostrar traspasos y patrones rutinarios entre agentes, ayudando a los desarrolladores a comprender e implementar la coordinación y ejecución de sistemas multiagente....
hace 1 año
062.6K
Story-Flicks:输入主题自动生成儿童短故事视频

Story-Flicks: introduce temas para generar automáticamente vídeos de cuentos infantiles

Introducción completa Story-Flicks es una herramienta de IA de código abierto centrada en ayudar a los usuarios a generar rápidamente vídeos de historias en alta definición. Los usuarios sólo tienen que introducir un tema de la historia, y el sistema generará el contenido de la historia a través de un modelo de lenguaje grande, y combinar las imágenes generadas por IA, audio y subtítulos para...
hace 1 año
062.5K
Supermemory:导入书签和网页内容构建个人知识库

Supermemoria: importar marcadores y contenidos web para crear una base de conocimientos personal

Introducción general Supermemory es un proyecto de código abierto diseñado para ayudar a los usuarios a construir su "segundo cerebro". Con una potente extensión de Chrome y tecnología de IA, permite a los usuarios guardar, organizar y recuperar fácilmente datos de páginas web, marcadores de Twitter...
hace 1 año
062.5K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: un marco ligero y flexible para organismos inteligentes, con una sencilla configuración de roles y herramientas para gestionar múltiples cargas de tareas.

Introducción general Bambo es un nuevo tipo de framework proxy, que es más ligero y flexible que los frameworks convencionales y puede manejar una gran variedad de tareas de carga.Bambo consigue una funcionalidad proxy eficiente definiendo todas las herramientas del catálogo de herramientas y utilizando funciones personalizadas asíncronas. Los usuarios pueden...
hace 2 años
062.4K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: un marco corporal inteligente para construir dispositivos inteligentes multimodales

Introducción general OmAgent es un marco de cuerpo inteligente multimodal desarrollado por Om AI Lab, con el objetivo de proporcionar potentes funciones impulsadas por IA para dispositivos inteligentes. Mediante la integración de modelos base multimodales de última generación y algoritmos de cuerpo inteligente, el proyecto permite a los desarrolladores crear dispositivos inteligentes eficientes en una variedad de...
hace 1 año
062.4K
LLM API Engine:通过自然语言快速生成和部署API

LLM API Engine: generación y despliegue rápidos de API mediante lenguaje natural

Introducción general LLM API Engine es un proyecto de código abierto diseñado para ayudar a los desarrolladores a crear y desplegar rápidamente API impulsadas por IA.El proyecto aprovecha el Large Language Model (LLM) y las tecnologías de rastreo web inteligente para permitir a los usuarios crear API personalizadas a través de descripciones en lenguaje natural.Su principal...
hace 1 año
062.4K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

Plugin NoneBot DeepSeek: Diálogo inteligente para el servicio de atención al cliente basado en NoneBot y DeepSeek.

Introducción General El plugin DeepSeek de NoneBot es un plugin de NoneBot que integra el modelo DeepSeek y está diseñado para proporcionar diálogo inteligente y funcionalidad de preguntas y respuestas. Al acceder al modelo DeepSeek, los usuarios pueden utilizar el plugin NoneBot...
hace 1 año
062.4K
BotSharp:基于.NET的多智能体AI应开发与管理平台

BotSharp: plataforma de desarrollo y gestión de inteligencia artificial basada en .NET

Introducción completa BotSharp es un proyecto de código abierto basado en .NET Core dedicado a proporcionar una herramienta completa de creación de plataformas de chatbot de IA. Utiliza programación C#, soporta el funcionamiento multiplataforma y tiene como objetivo simplificar la aplicación de algoritmos de aprendizaje automático, permitiendo a los desarrolladores de nivel empresarial...
hace 1 año
062.3K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS: Un sistema de archivos paralelo para mejorar la eficiencia del acceso a los datos (DeepSeek Open Source Week Day 5)

Introducción general 3FS (Fire-Flyer File System) es un sistema de archivos paralelo de código abierto desarrollado por el equipo DeepSeek, diseñado para SSDs modernos y redes RDMA, con el objetivo de mejorar drásticamente la eficiencia de acceso a los datos. Está implementado en un clúster de 180 nodos...
hace 1 año
062.3K
TripoSF:快速生成高分辨率3D模型的实用工具

TripoSF: una herramienta práctica para la generación rápida de modelos 3D de alta resolución

Introducción general TripoSF es un proyecto de código abierto construido por el equipo VAST-AI-Research, diseñado específicamente para generar rápidamente modelos 3D de alta resolución a partir de una sola imagen. Utiliza una tecnología llamada SparseFlex, alta eficiencia de procesamiento, puede ser en el general...
hace 1 año
062.3K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos: herramienta de código abierto para la creación de documentos de identidad inteligentes con IA

Introducción completa HivisionIDPhotos es una herramienta de producción de fotos de documentos AI ligera de código abierto, puede identificar de forma inteligente la escena de la foto del usuario y la clave, para generar una foto de documento estándar en línea con una variedad de especificaciones. La herramienta soporta colores de fondo y tamaños personalizados, y en el futuro también lanzará...
hace 2 años
062.2K
PR Agent:自动化拉取请求分析工具

PR Agent: herramienta automatizada de análisis de pull requests

Introducción general PR-Agent es una herramienta de código abierto desarrollada por Qodo para automatizar el procesamiento de pull requests (solicitudes de extracción) mediante tecnología de IA. La herramienta es capaz de proporcionar retroalimentación automatizada, sugerencias y análisis para ayudar a los desarrolladores a realizar revisiones de código de manera más eficiente....
hace 1 año
062.2K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

Markdown To Poster: convierta Markdown en pósters para redes sociales/pequeños rojos con edición en línea y soporte de despliegue con un solo clic.

Descripción general Markdown to Image es un componente React para renderizar texto Markdown en imágenes de medios sociales visualmente atractivas. El proyecto también incluye un editor web incorporado que se puede utilizar como un editor en línea de Markdown a póster....
hace 2 años
062.2K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic: marco unificado de generación de música, canciones y audio de código abierto de Ali.

Introducción general InspireMusic es un conjunto de herramientas de código abierto basado en PyTorch centrado en la generación de música, canciones y audio. Proporciona un marco unificado para generar audio de alta calidad con controles para pistas de texto, estructura musical y estilo musical.Inspire...
hace 1 año
062.2K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: genere datos de entrenamiento de IA mediante la API gratuita de big models, generación de datos de entrenamiento de big models a coste 0.

Introducción completa SFT-data-builder es un proyecto de código abierto diseñado para generar datos de entrenamiento SFT de alta calidad utilizando la API gratuita Big Model combinada con datos de dominio privado de los usuarios. La herramienta admite múltiples formatos de modelos de IA y ofrece generación con un solo clic, generación por lotes, edición flexible y...
hace 2 años
062.1K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: revolucionaria tecnología de generación de imágenes de altísima resolución con gran riqueza de detalles

Introducción general UltraPixel es una tecnología avanzada de generación de imágenes de ultra alta resolución diseñada para crear imágenes de altísima calidad y ricas en detalles. Fue desarrollada por el usuario de GitHub catcathh y presentada en NeurIPS 2024.U...
hace 2 años
062.1K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN: un modelo de código abierto para generar música/bandas sonoras multipista y crear fácilmente clips musicales para varios instrumentos.

Introducción general MuseGAN es un proyecto de generación musical basado en redes generativas adversariales (GAN) diseñado para generar música multipista (multiinstrumento). El proyecto es capaz de generar música desde cero o acompañada de pistas suministradas por el usuario.MuseGAN utiliza Lakh Pianor...
hace 2 años
062K
Reactive Resume:支持多语言、多模板的开源免费简历生成器

Reactive Resume: creador de currículos gratuito y de código abierto con soporte multilingüe y multiplantilla

Descripción general Reactive Resume es un creador de currículums gratuito y de código abierto diseñado para simplificar el proceso de crear, actualizar y compartir currículums. La plataforma se centra en la privacidad del usuario, sin seguimiento ni publicidad. Los usuarios pueden autoalojar la aplicación en menos de 30 segundos, tomando el control total de su...
hace 1 año
061.9K
Docs:开源的协作笔记和文档管理工具

Docs: herramientas de código abierto para la gestión colaborativa de notas y documentos

Introducción general Docs es una plataforma colaborativa de código abierto para la toma de notas y la gestión de documentos desarrollada por el equipo de suitenumerique. Está construida usando tecnologías Django y React con el objetivo de proporcionar una herramienta fácil de usar para ayudar a los usuarios a tomar notas, gestionar...
hace 1 año
061.9K