Proyecto AI de código abierto

Total 1020 artículos
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora: Extracción de subtítulos de audiolibros y traducción multilingüe, transcripción de audiolibros a varios idiomas

Introducción LiberSonora, que significa "sonido libre", es un potente conjunto de herramientas de código abierto para audiolibros. Es compatible con la extracción inteligente de subtítulos, la generación de títulos AI, traducción multi-idioma, etc., y es capaz de procesamiento por lotes fuera de línea bajo GPU acceleration.LiberSo...
hace 8 meses
021.7K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库

Languine: traducción de aplicaciones mediante IA, compatible con las principales bibliotecas i18n.

Introducción general Languine es una potente herramienta de traducción desarrollada por Midday para ayudar a los desarrolladores a agilizar el proceso de localización de sus aplicaciones. Con Languine, los desarrolladores pueden aprovechar la tecnología de IA para generar rápidamente traducciones precisas y...
hace 10 meses
021.7K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview: un macromodelo de diálogo antropomórfico de extremo a extremo para la interacción en tiempo real

SpeechGPT 2.0-preview es el primer sistema antropomórfico de interacción en tiempo real introducido por OpenMOSS, que se entrena basándose en millones de horas de datos de habla. El sistema está equipado con una expresión hablada antropomórfica y una respuesta de baja latencia de 100 ms, lo que...
hace 9 meses
021.7K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。

Inbox Zero: Consigue fácilmente cero correos electrónicos en tu bandeja de entrada, con la ayuda de la IA para ayudarte a categorizar, filtrar y procesar tus correos electrónicos.

Descripción general Inbox Zero es una aplicación de gestión de correo electrónico de código abierto diseñada para ayudar a los usuarios a alcanzar rápidamente la bandeja de entrada cero con un asistente de inteligencia artificial. La aplicación ofrece una gran variedad de funciones, como responder automáticamente, archivar, etiquetar y reenviar correos electrónicos, gestionar y darse de baja de boletines, bloquear correos...
hace 10 meses
021.7K
self.so:一键生成精美的个人简历网页

self.so: ¡Genera una bonita página de CV con un solo clic!

Introducción general self.so es una herramienta de código abierto diseñada para convertir rápidamente un CV o un perfil de LinkedIn en un sitio web personal. Los usuarios simplemente cargan un CV en PDF o introducen un enlace de LinkedIn, y el sistema lo convierte en un sitio web personal utilizando tecnología de IA (basada en Tog...
hace 6 meses
021.7K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: una estrategia genérica de fragmentación semántica basada en Llama-70B

Introducción general zChunk es una novedosa estrategia de chunking desarrollada por ZeroEntropy que pretende ofrecer una solución para el chunking semántico genérico. La estrategia se basa en el modelo Llama-70B, que optimiza el proceso de chunking de los documentos solicitando la generación de trozos, lo que garantiza que la recuperación de información se mantenga en un alto...
hace 8 meses
021.7K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: Permite a los usuarios consultar bases de datos SQLite y archivos CSV/JSON para obtener datos de consulta.

Introducción general SQLite-Utils-Ask es una potente herramienta diseñada para ayudar a los usuarios a realizar consultas de datos de preguntas y respuestas en bases de datos SQLite y archivos CSV/JSON con la ayuda de LLM (Large Language Model). La herramienta es capaz de generar automáticamente preguntas de usuario basadas en...
hace 11 meses
021.7K
Paper to Podcast:把学术论文转换为多人对话播客

De paper a podcast: cómo convertir trabajos académicos en podcasts de conversación entre varias personas

Introducción general Paper to Podcast es una herramienta de código abierto especializada en transformar trabajos de investigación académica en podcasts animados y entretenidos. Utiliza tecnología de inteligencia artificial para convertir un documento en formato PDF en un diálogo entre tres personajes (el anfitrión, el alumno y el experto) para...
hace 7 meses
021.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: Genera automáticamente documentos Markdown a partir de la estructura y el contenido del código.

Introducción general CodeWeaver es una herramienta de línea de comandos diseñada para entretejer bibliotecas de código en documentos Markdown únicos y fáciles de navegar. Genera una representación estructurada de la jerarquía de archivos de un proyecto escaneando recursivamente los directorios e incrustando el contenido de cada archivo en bloques de código. Esta herramienta...
hace 8 meses
021.7K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave: aplicaciones que integran rápidamente bases de conocimiento para búsquedas inteligentes

Introducción general Airweave es una herramienta de código abierto diseñada para facilitar la búsqueda en cualquier aplicación mediante la sincronización de los datos de las aplicaciones, API, bases de datos y sitios web del usuario con bases de datos gráficas y vectoriales.
hace 8 meses
021.7K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: IA motriz basada en el aprendizaje por refuerzo para estudiar problemas complejos

Introducción general DeepResearcher es un proyecto de código abierto desarrollado por el equipo GAIR-NLP de la Universidad Jiao Tong de Shanghai. Se trata de una herramienta de investigación inteligente basada en grandes modelos lingüísticos (LLM), entrenados de principio a fin en entornos web reales mediante aprendizaje por refuerzo (RL). El proyecto ...
hace 6 meses
021.6K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: generación de mundos 3D explorables en 360° a partir de una sola imagen (código de código abierto progresivo)

Introducción general GenEx es un modelo avanzado de IA capaz de generar un mundo tridimensional de 360° totalmente explorable a partir de una sola imagen. Los usuarios pueden explorar interactivamente este mundo generado.GenEx empuja los límites de la IA figurativa en el espacio imaginativo y tiene el potencial de...
hace 10 meses
021.6K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: convierte dibujos estáticos en animaciones de bocetos guiadas por texto, simplificando el proceso de animación.

Introducción general FlipSketch es un proyecto de código abierto diseñado para convertir dibujos estáticos en animaciones guiadas por texto. Alojado en GitHub, el proyecto proporciona una herramienta innovadora que permite a los usuarios generar efectos de animación a partir de descripciones de texto.FlipSketch combina...
hace 11 meses
021.6K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI: control preciso de la posición de los elementos de la imagen, interfaz gráfica intuitiva basada en ComfyUI

Introducción general GLIGEN GUI es una interfaz gráfica intuitiva basada en ComfyUI, diseñada para simplificar el uso del modelo GLIGEN, un novedoso modelo texto-imagen que permite especificar con precisión la posición de los objetos en una imagen. Con GLIGE...
hace 1 año
021.5K
Lecca:无代码构建AI智能体与AI工作流构建平台

Lecca: Creación de plataformas de inteligencia artificial y flujo de trabajo de inteligencia artificial sin código

Introducción exhaustiva Lecca es una potente plataforma de IA que permite a los usuarios configurar y desplegar grandes modelos lingüísticos (LLM) con múltiples herramientas y flujos de trabajo. Los usuarios pueden construir, personalizar y automatizar fácilmente sus agentes de IA.Lecca ofrece una amplia selección de proveedores de IA y modelos...
hace 7 meses
021.5K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher: recuperación eficiente de documentos privados de empresas y preguntas y respuestas inteligentes

Descripción general Deep Searcher es una herramienta que combina potentes modelos de big language (como DeepSeek y OpenAI) y bases de datos vectoriales (como Milvus) diseñados para buscar, evaluar y razonar basándose en datos privados, proporcionando respuestas altamente precisas...
hace 8 meses
021.5K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架

Chitu (Red Rabbit): el equipo de Tsinghua lanza un marco de razonamiento de alto rendimiento basado en grandes modelos lingüísticos

Chitu es un marco de razonamiento de código abierto desarrollado por el equipo PACMAN de la Universidad de Tsinghua, llamado "Red Rabbit", que está especialmente diseñado para ejecutar grandes modelos lingüísticos. Se centra en la eficiencia, la flexibilidad y la practicidad , lo que permite a las empresas desplegar rápidamente grandes modelos en diferentes dispositivos . Chitu soporta una variedad de hardware ...
hace 7 meses
021.4K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: generación de vídeos con control preciso de la postura humana, creación de bailarinas

Introducción general DisPose es un innovador proyecto de inteligencia artificial de código abierto centrado en la generación controlada de animación de imágenes de personajes. Desarrollado por un equipo de investigadores y de código abierto en GitHub, el proyecto utiliza técnicas avanzadas de aprendizaje profundo para lograr un control preciso de la animación de personajes mediante la descomposición de la información de pose esquelética.D...
hace 10 meses
021.4K
R1-Omni:通过视频和音频分析情感的开源模型

R1-Omni: un modelo de código abierto para analizar emociones a través de vídeo y audio

Introducción general R1-Omni es un proyecto de código abierto lanzado en GitHub por el equipo HumanMLLM. Es la primera aplicación de técnicas de Aprendizaje por Refuerzo con Recompensas Verificables (RLVR) a un gran modelo de lenguaje multimodal, centrado en el reconocimiento de sentimientos. El proyecto analiza datos de vídeo y audio...
hace 7 meses
021.4K
VOP:提取复杂图表与数学公式的OCR工具

VOP: herramienta de OCR para extraer diagramas complejos y fórmulas matemáticas

Introducción completa Versatile OCR Program es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto diseñada para trabajar con documentos académicos y educativos complejos. Puede extraer texto, tablas, fórmulas matemáticas, diagramas y esquemas de PDF, imágenes y otros documentos y generar...
hace 6 meses
021.4K
Swarms:多智能体编排框架,企业级生产工具

Swarms: marco de orquestación multiinteligencia, herramienta de producción empresarial

Introducción general Swarms es un marco de orquestación multiagente listo para la producción de nivel empresarial diseñado para impulsar la productividad empresarial mediante la gestión eficiente de agentes y el procesamiento de tareas. Con soporte para múltiples modelos, múltiples sistemas de memoria y creación de agentes personalizados, el marco proporciona un diseño modular y capacidades de registro integrales para garantizar que el sistema...
hace 10 meses
021.4K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers: una biblioteca ligera para la observabilidad de la IA que rastrea los datos de las solicitudes de API compatibles con OpenAI.

Introducción general Observers es un SDK de Python de código abierto diseñado para proporcionar una observabilidad completa para las API de IA generativa. La biblioteca permite a los usuarios rastrear y registrar fácilmente interacciones con modelos de IA y almacenar estas observaciones en múltiples backends. Ya sea...
hace 10 meses
021.4K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: un cliente Python que demuestra el proceso de ejecución de un organismo inteligente, proporcionando una interfaz gráfica de usuario intuitiva.

Introducción completa AgentClientDemo es un proyecto completo de Python que integra funcionalidad inteligente (Agente) y cliente (Cliente). El proyecto está basado en el framework PyQt y proporciona una interfaz gráfica de usuario (G...
hace 10 meses
021.3K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: Diseñe fácilmente correos electrónicos con capacidad de respuesta, genere rápidamente correos electrónicos de marketing con ChatGPT

Introducción General MJML (Mail Junction Markup Language) es un marco de código abierto desarrollado por el equipo de Mailjet para simplificar la creación de plantillas de correo electrónico de respuesta. A través del lenguaje de marcado semántico y una rica biblioteca de componentes , los desarrolladores pueden utilizar menos código para crear eficientemente hermoso y poderoso correo electrónico ...
hace 1 año
021.3K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher: búsqueda profunda y razonamiento por pasos para responder a preguntas complejas

Descripción general II-Researcher es una herramienta de investigación de IA de código abierto desarrollada por el equipo Intelligent-Internet y alojada en GitHub.Está diseñada para la búsqueda profunda y el razonamiento complejo, con la capacidad de buscar a través de páginas web inteligentes y sub...
hace 7 meses
021.3K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: un asistente de ingeniería de IA para crear rápidamente bases de código propias

Introducción completa Potpie AI es una plataforma de código abierto centrada en proporcionar a los desarrolladores asistentes de ingeniería de IA personalizados. Permite a los agentes de IA comprender en profundidad la estructura y la lógica del código y automatizar tareas como la depuración, las pruebas y la generación de código mediante la construcción de un grafo de conocimiento de la base de código. Los usuarios pueden...
hace 6 meses
021.3K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI: versión de código abierto de una herramienta de clonación humana digital y generación de vídeos cortos con IA

Introducción completa Metaverse AI (versión de código abierto) es un proyecto alojado en GitHub, desarrollado por el equipo libn-net. Puede clonar imágenes y voces humanas digitales mediante tecnología de IA para generar vídeos cortos, y también admite doblaje y subtitulación. Esta herramienta proporciona...
hace 7 meses
021.3K
Agenta:集成到AI应用的提示词与模型效果评估工具

Agenta: una herramienta para evaluar los efectos de las palabras clave y los modelos integrados en aplicaciones de IA

Introducción completa Agenta es una herramienta de gestión de modelos de IA de código abierto diseñada para ayudar a los usuarios a experimentar fácilmente con palabras clave, probar los efectos de los modelos y supervisar las ejecuciones. Es adecuada para personas que desean desarrollar aplicaciones de IA rápidamente, ya que proporciona una plataforma sencilla de manejar. Puede utilizarla para probar el efecto de diferentes palabras de...
hace 7 meses
021.3K
茴香豆:基于LLM(大型语言模型) 的群聊助手

Fennel Bean: Asistente de chat en grupo basado en LLM (Large Language Model)

Introducción general HuixiangDou es un asistente de chat en grupo basado en modelos lingüísticos a gran escala (LLM) diseñado para hacer frente a escenarios de chat en grupo mediante un proceso de preprocesamiento, rechazo y respuesta en tres fases. Es capaz de responder a las preguntas de los usuarios sin provocar una inundación de información. El proyecto proporciona un ...
hace 8 meses
021.3K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: Habilita cualquier LLM para automatizar operaciones en Android y PC.

Introducción general ClickClickClick es un framework desarrollado por BandarLabs que pretende automatizar operaciones en Android y PC utilizando cualquier Large Language Model (LLM) local o remoto. El proyecto se encuentra actualmente en una fase altamente experimental y soporta una variedad de modelos como...
hace 10 meses
021.2K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS: Un sistema de archivos paralelo para mejorar la eficiencia del acceso a los datos (DeepSeek Open Source Week Day 5)

Introducción general 3FS (Fire-Flyer File System) es un sistema de archivos paralelo de código abierto desarrollado por el equipo DeepSeek, diseñado para SSDs modernos y redes RDMA, con el objetivo de mejorar drásticamente la eficiencia de acceso a los datos. Está implementado en un clúster de 180 nodos...
hace 8 meses
021.2K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: a bi-directional pipelined parallel algorithm to improve the efficiency of large-scale AI model training (DeepSeek Open Source Week Day 4)

Introducción general DualPipe es una tecnología de código abierto desarrollada por el equipo de DeepSeek-AI centrada en mejorar la eficiencia del entrenamiento de modelos de IA a gran escala. Se trata de un innovador algoritmo paralelo bidireccional canalizado que se utiliza principalmente en DeepSeek-V3 y R1....
hace 8 meses
021.1K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher: herramienta automatizada de investigación en profundidad para redactar informes de investigación completos.

Introducción general OpenDeepResearcher es una herramienta de investigación profunda automatizada de código abierto diseñada para mejorar la eficiencia de la investigación mediante técnicas de inteligencia artificial. El proyecto está desarrollado por mshumer y alojado en GitHub.OpenDeepResear...
hace 7 meses
021.1K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: generación de vídeo basada en silicio para controlar el movimiento de objetos sólidos en imágenes

Introducción General DragAnything es un proyecto de código abierto que tiene como objetivo lograr el control de movimiento de objetos arbitrarios a través de la representación de entidades. El proyecto está desarrollado por el equipo Showlab y ha sido aceptado por ECCV 2024.DragAnything proporciona una forma de utilizar...
hace 8 meses
021.1K
VACE:视频创作和编辑的开源模型(未开放)

VACE: modelo de código abierto para la creación y edición de vídeo (no abierto)

Introducción VACE es un proyecto de código abierto desarrollado por Alitongyi Visual Intelligence Lab (ali-vilab), centrado en la creación y edición de vídeo. Se trata de una herramienta todo en uno que integra diversas funciones, como la generación de vídeos basados en referencias, la edición de contenidos de vídeo existentes, las modificaciones de localización y otras...
hace 7 meses
021.1K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: la caja de herramientas de los entusiastas de la IA para gestionar, conectar y utilizar todos sus modelos de IA en un solo escritorio.

General Omnitool.ai es un "laboratorio de IA" de código abierto diseñado para proporcionar un entorno de escritorio extensible basado en navegador para estudiantes, aficionados y cualquier persona interesada en las innovaciones actuales de IA. Permite a los usuarios colaborar a través de una interfaz unificada con una amplia gama de expertos en IA de OpenAI, repl...
hace 8 meses
021.1K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: una herramienta de código abierto para facilitar el despliegue de modelos multimodales de IA

Introducción general Aana SDK es un marco de código abierto desarrollado por Mobius Labs, llamado así por la palabra malayalam ആന (elefante). Ayuda a los desarrolladores a desplegar y gestionar rápidamente modelos multimodales de IA, admitiendo el procesamiento de texto, imágenes, audio y vídeo, y otros datos....
hace 7 meses
021.1K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: un plugin de WordPress AI Assistant para el diálogo, la generación de entradas y la traducción

Introducción completa WordPress AI Assistant Plugin (wp-ai-chat) es un plugin de WordPress de código abierto diseñado para proporcionar a los usuarios una variedad de características de AI, incluyendo el diálogo AI, la generación de artículos, resumen de artículos, traducción de artículos y lectura de contenidos. El plugin soporta el acoplamiento de múltiples ...
hace 8 meses
021.1K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative: una selección de alternativas de software de código abierto a los productos SaaS más utilizados, para encontrar las mejores alternativas de código abierto.

Introducción general OpenAlternative es una plataforma centrada en proporcionar alternativas de software de código abierto, con el objetivo de ayudar a los usuarios a encontrar herramientas de código abierto adecuadas para sustituir a los productos SaaS comerciales que utilizan a diario. El sitio ayuda a los usuarios a ahorrar dinero y mejorar a través de una cuidada colección de herramientas de código abierto...
hace 10 meses
021.1K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: una herramienta de código abierto para convertir el lenguaje natural en consultas SQL

Introducción completa OpenSearch-SQL es un proyecto de código abierto , es una poderosa herramienta Texto-a-SQL que puede transformar las descripciones en lenguaje natural del usuario en sentencias de consulta SQL , para ayudar a las personas que no están familiarizadas con la base de datos para acceder fácilmente a los datos . Este proyecto fue desarrollado por O...
hace 7 meses
021K
Llama 3.2 Reasoning WebGPU:在浏览器中运行LLama-3.2

WebGPU de razonamiento de Llama 3.2: ejecución de Llama-3.2 en un navegador

Introducción general Transformers.js es una biblioteca JavaScript proporcionada por Hugging Face diseñada para ejecutar modelos de aprendizaje automático de última generación directamente en el navegador, sin soporte de servidor. La librería funciona conjuntamente con la plataforma Hugging Fa...
hace 9 meses
021K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

mAIstro de informes: Genere informes detallados sobre cualquier tema personalizado, como análisis de negocio, informes de fin de año, etc.

Descripción general Report mAIstro es una potente herramienta diseñada para ayudar a los usuarios a crear fácilmente informes personalizados mediante la tecnología de procesamiento del lenguaje natural. La herramienta utiliza la tecnología LangChain para transformar los temas y estructuras proporcionados por el usuario en informes detallados dentro de...
hace 7 meses
021K
PilottAI:构建企业级多智能体应用的开源项目

PilottAI: un proyecto de código abierto para crear aplicaciones empresariales de inteligencia múltiple

Introducción general PilottAI es un framework Python de código abierto alojado en GitHub y creado por el desarrollador anuj0456. Se centra en ayudar a los usuarios a construir sistemas corporales multi-inteligentes de clase empresarial, soporta la integración de Large Language Model (LLM), proporciona cualquier...
hace 7 meses
021K
混元Turbo S:腾讯推出的快思考大模型(开放申请)

Hybrid Turbo S: el gran modelo de Tencent para pensar rápido (abierto a candidaturas)

Introducción general Tencent Turbo S es una nueva generación del modelo de pensamiento rápido desarrollado por Tencent, que se lanzó en el sitio web oficial de Tencent Cloud el 27 de febrero de 2025. Se diferencia de los modelos tradicionales de pensamiento lento (por ejemplo, Deepseek R1, Hybrid T1) en que puede realizar "segundas respuestas", escupir...
hace 7 meses
021K
Xata Agent:监控和优化PostgreSQL数据库的AI助手

Xata Agent: un asistente de IA para monitorizar y optimizar bases de datos PostgreSQL

Descripción general Xata Agent es una herramienta de IA de código abierto diseñada específicamente para bases de datos PostgreSQL. Supervisa automáticamente el estado operativo de la base de datos, encuentra la causa raíz de los problemas de rendimiento o fallos y ofrece recomendaciones para solucionarlos. El equipo de desarrollo xAI lo posiciona como un...
hace 7 meses
021K
LineAvatars:生成 Notion 风格线条头像的免费工具

LineAvatars: herramienta gratuita para generar avatares de líneas al estilo Notion

Descripción General LineAvatars es una herramienta online gratuita y fácil de usar diseñada para generar avatares de líneas al estilo Notion. Los usuarios pueden subir una foto o tomar una foto a través de la webcam y el sistema generará automáticamente un avatar de línea utilizando AI. Esta herramienta...
hace 8 meses
020.9K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP: un modelo híbrido de generación de vídeo compatible con GPU de gama baja

Introducción general HunyuanVideoGP es un modelo de generación de vídeo a gran escala desarrollado por DeepBeepMeep y diseñado para usuarios de GPU de gama baja. El modelo es una versión mejorada del modelo Hunyuan Video original, que reduce significativamente los requisitos de memoria y memoria gráfica....
hace 8 meses
020.9K
Instructor:简化大语言模型结构化输出工作流的Python库

Instructor: una biblioteca de Python que simplifica los flujos de trabajo de salida estructurados para grandes modelos lingüísticos.

Introducción general Instructor es una popular biblioteca de Python diseñada para procesar resultados estructurados de grandes modelos lingüísticos (LLM). Basada en Pydantic, proporciona una API sencilla, transparente y fácil de usar para gestionar datos...
hace 8 meses
020.9K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: extrae los datos del cuerpo de una URL HTML, salida texto plano/markdown

Introducción general magic-html es una biblioteca de Python diseñada para simplificar el proceso de extracción del contenido de la región del cuerpo a partir de HTML. Tanto si se trata de estructuras HTML complejas como de páginas web sencillas, esta biblioteca pretende proporcionar una interfaz cómoda y eficiente a los usuarios. Soporta la extracción multimodal...
hace 1 año
020.9K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes en tiempo real de OpenAI: una aplicación multiinteligente de interacción cuerpo-voz (ejemplo de OpenAI)

Introducción General OpenAI Realtime Agents es un proyecto de código abierto que tiene como objetivo mostrar cómo la API en tiempo real de OpenAI se puede utilizar para construir aplicaciones de voz corporal multi-inteligente. Proporciona un modelo de cuerpo inteligente de alto nivel (tomado de OpenAI Swarm) que permite...
hace 9 meses
020.8K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Genera vídeos explicativos de matemáticas animados de más de 5 minutos con Manim

Introducción general TheoremExplainAgent es un proyecto innovador desarrollado por TIGER AI Lab para transformar complejos teoremas matemáticos y científicos en animaciones de vídeo fáciles de entender utilizando técnicas de inteligencia artificial. La herramienta se basa en el Large Language Model (LLM...
hace 8 meses
020.8K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: un asistente de investigación profunda basado en IA que proporciona herramientas de investigación eficientes y capacidades de generación de informes.

Introducción general Deep Research es un asistente de investigación basado en IA diseñado para realizar investigación profunda iterativa combinando motores de búsqueda, rastreo web y grandes modelos de lenguaje. El proyecto fue lanzado por dzhng en GitHub con el objetivo de proporcionar un generador de investigación profunda fácil de usar....
hace 7 meses
020.8K
Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Introducción completa Vision Parse es una revolucionaria herramienta de procesamiento de documentos, que combina inteligentemente la tecnología más avanzada de modelos de lenguaje visual (Vision Language Models), la capacidad de convertir inteligentemente documentos PDF a formato Markdown de alta calidad...
hace 10 meses
020.8K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: una clave para generar audiolibros con calidad de sonido natural, compatible con PDF, epub, docx y otros formatos.

Introducción completa QuickPiperAudiobook es un proyecto de código abierto diseñado para convertir una variedad de formatos de texto (por ejemplo, epub, mobi, txt, PDF, HTML, etc) en audiolibros de sonido natural a través de un simple comando. La herramienta utiliza Pi...
hace 1 año
020.8K
Local Deep Research:本地运行的生成深度研究报告工具

Local Deep Research: una herramienta de gestión local para generar informes de investigación en profundidad.

Introducción general Local Deep Research es un asistente de investigación de IA de código abierto diseñado para ayudar a los usuarios a realizar investigaciones profundas y generar informes detallados para problemas complejos. Es compatible con la ejecución local, lo que permite a los usuarios completar las tareas de investigación sin depender de los servicios en la nube. La herramienta ...
hace 5 meses
020.8K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab: una herramienta de diálogo experimental para explorar el pensamiento iterativo sobre la colaboración persona-ordenador.

CoT-Lab es una interfaz experimental para explorar nuevos paradigmas en la colaboración entre humanos y ordenadores. Basado en la Teoría de la Carga Cognitiva y los Principios del Aprendizaje Activo, CoT-Lab facilita una profunda alineación cognitiva entre humanos e Inteligencia Artificial (IA) mediante la creación de relaciones de "compañero pensante". El proyecto pretende...
hace 8 meses
020.7K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: una herramienta CLI para consultar rápidamente comandos de terminal en lenguaje natural

Introducción general Zev es una herramienta de interfaz de línea de comandos (CLI) fácil de usar que ayuda a los usuarios a consultar y generar rápidamente comandos de terminal en lenguaje natural. En lugar de tener que recordar complejas sintaxis de comandos, Zev genera comandos de terminal describiendo tus necesidades en lenguaje cotidiano. Basado en Ope...
hace 6 meses
020.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: un completo conjunto de herramientas para construir inteligencias IA basadas en LangGraph

Introducción El AI Agent Service Toolkit es un conjunto de herramientas completo basado en LangGraph, FastAPI y Streamlit, diseñado para ayudar a los desarrolladores a crear y ejecutar rápidamente servicios de agentes de IA. El conjunto de herramientas proporciona...
hace 9 meses
020.7K
Agentic Radar:对 Agentic 工作流安全检测的可视化工具

Agentic Radar: herramienta de visualización para la inspección de la seguridad del flujo de trabajo de Agentic

Introducción general Agentic Radar es una herramienta de código abierto de SplxAI diseñada para escanear y asegurar grandes flujos de trabajo de IA basados en modelos (LLM). Genera diagramas de flujo de trabajo claros e informes de seguridad mediante el análisis de código, ayudando a los desarrolladores, expertos en seguridad...
hace 7 meses
020.7K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni: un macromodelo multimodal para analizar emociones y acciones humanas en vídeo

Introducción general HumanOmni es un gran modelo multimodal de código abierto desarrollado por el equipo HumanMLLM y alojado en GitHub. Se centra en el análisis de vídeos humanos y puede procesar tanto la imagen como el sonido para ayudar a comprender las emociones, las acciones y el contenido de los diálogos. El proyecto utiliza 2...
hace 7 meses
020.7K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: una herramienta de código abierto para la conexión y gestión flexibles de inteligencias artificiales

Introducción general AgentIQ es una herramienta de código abierto de NVIDIA diseñada para ayudar a los desarrolladores a conectar y gestionar eficientemente las inteligencias de IA. Permite a las inteligencias de diferentes marcos colaborar sin problemas, conectar datos y herramientas empresariales y crear flujos de trabajo como funciones de llamada. Lo más importante de la herramienta...
hace 7 meses
020.7K
LettuceDetect:检测RAG系统幻觉的高效工具

LettuceDetect: una herramienta eficaz para detectar alucinaciones en el sistema RAG

Introducción completa LettuceDetect es una herramienta ligera de código abierto desarrollada por KRLabsOrg específicamente para detectar contenido alucinatorio generado en sistemas de Generación Aumentada de Recuperación (RAG). Identifica respuestas que no están respaldadas por el contexto comparando el contexto, la pregunta y la respuesta...
hace 7 meses
020.5K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: ¡utiliza los grandes modelos de Qwen en la barra de menús de Mac para conversar en cualquier momento!

Introducción general Qwen4Mac es un proyecto de código abierto diseñado para integrar el Qwen Large Language Model (LLM) en la barra de menú del Mac, facilitando a los usuarios su llamada y uso en cualquier momento. El proyecto está desarrollado y mantenido por andreaturchet y proporciona una manera fácil para que los usuarios...
hace 8 meses
020.4K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill: extracción por lotes de información estructurada de documentos y análisis automatizado

Introducción general Rowfill es una plataforma de procesamiento de documentos de código abierto diseñada para trabajadores del conocimiento. Utiliza técnicas avanzadas de inteligencia artificial para extraer, analizar y procesar datos de documentos complejos, imágenes y PDFs.Rowfill soporta Native Large Language Model (LLM) y Ope...
hace 8 meses
020.4K