Proyecto AI de código abierto

Total 1020 artículos
Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Introducción completa Vision Parse es una revolucionaria herramienta de procesamiento de documentos, que combina inteligentemente la tecnología más avanzada de modelos de lenguaje visual (Vision Language Models), la capacidad de convertir inteligentemente documentos PDF a formato Markdown de alta calidad...
hace 1 año
056.7K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: motor de recuperación de datos no estructurados y consultas complejas

Introducción general dsRAG es un motor de recuperación de alto rendimiento diseñado para gestionar consultas complejas sobre datos no estructurados. Funciona especialmente bien con consultas complejas en texto denso, como informes financieros, documentos jurídicos y trabajos académicos. dsRAG emplea tres enfoques clave para mejorar el rendimiento: lenguaje...
hace 1 año
056.6K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: creación de grafos de conocimiento y motores de búsqueda personales de ejecución local

Introducción general Unigraph es un grafo de conocimiento de propósito general y motor de búsqueda personal diseñado para proporcionar a los usuarios un espacio de trabajo integrado que les ayude a gestionar y buscar una amplia variedad de datos en su vida personal. Con Unigraph, los usuarios pueden integrar datos de distintas fuentes en un...
hace 1 año
056.6K
Supermemory:导入书签和网页内容构建个人知识库

Supermemoria: importar marcadores y contenidos web para crear una base de conocimientos personal

Introducción general Supermemory es un proyecto de código abierto diseñado para ayudar a los usuarios a construir su "segundo cerebro". Con una potente extensión de Chrome y tecnología de IA, permite a los usuarios guardar, organizar y recuperar fácilmente datos de páginas web, marcadores de Twitter...
hace 1 año
056.6K
Claude生成深度研究报告的MCP服务

Servicio MCP de Claude para generar informes de investigación en profundidad

Introducción general MCP Server Deep Research es una herramienta de código abierto que genera automáticamente informes de investigación estructurados para problemas complejos mediante inteligencia artificial y búsqueda en la web. Los usuarios introducen una pregunta de investigación y la herramienta la desglosa, busca información autorizada, evalúa la credibilidad de las fuentes...
hace 11 meses
056.6K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: plataforma de código abierto para el aprendizaje por refuerzo del razonamiento a gran escala

Introducción general Open-Reasoner-Zero es un proyecto de código abierto centrado en la investigación del aprendizaje por refuerzo (RL), desarrollado por el equipo Open-Reasoner-Zero en GitHub. Su objetivo es proporcionar un entrenamiento eficiente, escalable y fácil de usar...
hace 1 año
056.5K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: Herramienta de línea de comandos para utilizar los servicios de MCP en cualquier modelo grande, no depende de Claude.

Introducción general La CLI del proveedor de contexto de modelo (mcp-cli) es una herramienta de línea de comandos a nivel de protocolo para interactuar con un servidor de proveedor de contexto de modelo. La herramienta permite a los usuarios enviar comandos, consultar datos e interactuar con diversos recursos proporcionados por el servidor...
hace 1 año
056.5K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI Portrait Master versión china: Herramienta de palabras clave para optimizar la generación de retratos

Introducción General ComfyUI Portrait Master versión China es una herramienta de generación de palabras clave para retratos diseñada para creadores de imágenes AI. La herramienta ayuda a los usuarios a generar retratos de alta calidad mediante la optimización de las palabras clave. Los usuarios pueden elegir diferentes lentes según la demanda...
hace 2 años
056.4K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: una solución de memoria a largo plazo basada en el perfil del usuario para aplicaciones de IA

Introducción general Memobase es un sistema de memoria basado en el perfil del usuario diseñado para soportar una memoria de usuario duradera para aplicaciones de IA generativa. Tanto si estás construyendo un compañero virtual, una herramienta educativa o un asistente personalizado, Memobase ayuda a tu IA a recordar, comprender y crecer con el uso de...
hace 1 año
056.4K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Academic: Mejor artículo académico de Arxiv Traducción, corrección de errores e interpretación de códigos

Introducción general GPT Academic es una plataforma interactiva para grandes modelos lingüísticos optimizada para la investigación académica, que proporciona herramientas para interfaces interactivas pragmáticas con grandes modelos lingüísticos como GPT/GLM, optimizadas específicamente para la experiencia de traducción, lectura, pulido y redacción de documentos. Utiliza un diseño modular...
hace 1 año
056.4K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher: herramienta automatizada de investigación en profundidad para redactar informes de investigación completos.

Introducción general OpenDeepResearcher es una herramienta de investigación profunda automatizada de código abierto diseñada para mejorar la eficiencia de la investigación mediante técnicas de inteligencia artificial. El proyecto está desarrollado por mshumer y alojado en GitHub.OpenDeepResear...
hace 1 año
056.4K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

Markdown To Poster: convierta Markdown en pósters para redes sociales/pequeños rojos con edición en línea y soporte de despliegue con un solo clic.

Descripción general Markdown to Image es un componente React para renderizar texto Markdown en imágenes de medios sociales visualmente atractivas. El proyecto también incluye un editor web incorporado que se puede utilizar como un editor en línea de Markdown a póster....
hace 1 año
056.4K
Agent-Wiz:分析AI智能体工作流程和安全风险

Agent-Wiz: análisis de los flujos de trabajo y los riesgos de seguridad de AI Intelligentsia

Introducción general Agent-Wiz es una herramienta de línea de comandos Python de código abierto diseñada para desarrolladores, investigadores y equipos de seguridad. Puede extraer flujos de trabajo complejos de los principales marcos de inteligencia artificial como LangGraph, CrewAI, AutoGen, etc., para generar...
hace 1 año
056.4K
PR Agent:自动化拉取请求分析工具

PR Agent: herramienta automatizada de análisis de pull requests

Introducción general PR-Agent es una herramienta de código abierto desarrollada por Qodo para automatizar el procesamiento de pull requests (solicitudes de extracción) mediante tecnología de IA. La herramienta es capaz de proporcionar retroalimentación automatizada, sugerencias y análisis para ayudar a los desarrolladores a realizar revisiones de código de manera más eficiente....
hace 1 año
056.3K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension: Extensión del navegador para sincronizar contenidos generados por IA con plataformas de autopublicación en un clic

Introducción General MultiPost-Extension es una extensión del navegador de gran alcance diseñado para ayudar a los usuarios publicar contenido en múltiples plataformas de medios sociales en un solo clic. La extensión soporta la publicación simultánea en más de 10 plataformas principales, incluyendo Zhihu, Weibo, Xiaohongshu, TikTok ...
hace 1 año
056.2K
Pyramid Flow:快手推出的开源版

Pyramid Flow: una versión de código abierto de "Kringle" lanzada por Racer, basada en SD3 y que funciona en GPU de menos de 8 GB (versión de despliegue con un solo clic).

Introducción exhaustiva Pyramid Flow es un eficaz método autorregresivo de generación de vídeo basado en la técnica Flow Matching. El método consigue una mayor eficiencia computacional en la generación y descompresión de contenidos de vídeo interpolando entre diferentes resoluciones y niveles de ruido....
hace 1 año
056.2K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: IA motriz basada en el aprendizaje por refuerzo para estudiar problemas complejos

Introducción general DeepResearcher es un proyecto de código abierto desarrollado por el equipo GAIR-NLP de la Universidad Jiao Tong de Shanghai. Se trata de una herramienta de investigación inteligente basada en grandes modelos lingüísticos (LLM), entrenados de principio a fin en entornos web reales mediante aprendizaje por refuerzo (RL). El proyecto ...
hace 1 año
056.2K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: Marco de orquestación de cuerpos inteligentes con soporte de agentes RAG y LLM para simplificar el desarrollo de aplicaciones de IA

Introducción general Dynamiq es un marco de orquestación de IA de código abierto diseñado para aplicaciones de IA de agentes y Large Language Modelling (LLM). Su objetivo es simplificar el desarrollo de aplicaciones basadas en IA, especialmente en el área de la Generación Aumentada de Recuperación (RAG) y la orquestación de agentes LLM.Dynamiq propone...
hace 1 año
056.2K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: una inteligencia que integra más de 500 herramientas de investigación para automatizar las tareas científicas y de investigación.

Introducción completa SciToolAgent es una plataforma de herramientas de código abierto desarrollada por el Centro de Innovación de la Universidad de Zhejiang en Hangzhou (HICAI-ZJU). Integra más de 500 herramientas científicas a través de tecnologías de grafos de conocimiento (SciToolKG) y modelado de grandes lenguajes para ayudar a los investigadores a enfrentarse a...
hace 1 año
056.1K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general mac assistant es un proyecto de cuerpo de inteligencia AI diseñado para macOS, con el objetivo de simplificar las operaciones del usuario mediante la combinación de software nativo y funciones web. Actualmente, el proyecto es compatible con las API OpenAI y GEMINI, y tiene previsto ...
hace 1 año
056.1K
self.so:一键生成精美的个人简历网页

self.so: ¡Genera una bonita página de CV con un solo clic!

Introducción general self.so es una herramienta de código abierto diseñada para convertir rápidamente un CV o un perfil de LinkedIn en un sitio web personal. Los usuarios simplemente cargan un CV en PDF o introducen un enlace de LinkedIn, y el sistema lo convierte en un sitio web personal utilizando tecnología de IA (basada en Tog...
hace 1 año
056.1K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Generador de muestras de texto a vídeo cero lanzado por el equipo de investigación de IA de Picsart

Introducción general Text2Video-Zero es una implementación oficial de un generador de texto a vídeo de muestra cero para GitHub desarrollado por el equipo Picsart AI Research.El proyecto proporciona una forma de utilizar pistas de texto para generar texto con consistencia temporal y...
hace 2 años
056K
MemFree:本地知识库与搜索信息混合的AI搜索引擎

MemFree: un motor de búsqueda de inteligencia artificial para mezclar bases de conocimiento local e información de búsqueda

Introducción general MemFree es un avanzado motor de búsqueda híbrido de IA capaz de buscar y hacer preguntas a través de texto, imágenes, documentos y páginas web. Proporciona acceso con un solo clic a los resultados de búsqueda de texto, mapas mentales, imágenes y vídeos.MemFree pretende extraer información de la base de conocimientos del usuario y...
hace 1 año
056K
agents.json:智能体通过自然语言与API交互的开源规范

agents.json: una especificación de código abierto para que las inteligencias interactúen con las API a través del lenguaje natural.

Introducción general agents.json es una especificación de código abierto desarrollada por el equipo Wildcard AI, basada en el estándar OpenAPI, diseñada para permitir que las inteligencias se comuniquen eficientemente con las APIs a través del lenguaje natural. Utiliza archivos JSON estructurados para definir ...
hace 1 año
056K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送

InsightExpress: generar informes de investigación basados en IA y enviarlos por correo electrónico

Descripción general InsightExpress es una aplicación basada en Next.js que genera informes de investigación impulsados por IA basados en temas suministrados por el usuario y los envía por correo electrónico a los usuarios. La aplicación aprovecha la IA de Langflow ...
hace 1 año
056K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: Automatización de navegadores, implementación de código abierto de OpenAI Operator

Introducción general AI Web Operator es una herramienta de código abierto AI navegador operador diseñado para simplificar la experiencia del usuario en el navegador mediante la integración de múltiples tecnologías de IA y SDKs. La herramienta se basa en Browserbase y Vercel....
hace 1 año
055.9K
XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目

XiaoYuanKouSuan_Auto: Herramienta automática de preguntas y respuestas XiaoYuanKouSuan, que resuelve eficazmente temas de aritmética oral.

Introducción completa Ape Mouth Calculator Automatic Question Answer Tool es un proyecto de código abierto basado en Python diseñado para resolver eficientemente las preguntas de la aplicación Ape Mouth Calculator a través de scripts de reconocimiento OCR y automatización. La herramienta hace uso de tecnologías como OpenCV y Tesseract para poder identificar las preguntas en la pantalla en tiempo real....
hace 2 años
055.9K
Rankify:支持信息检索与重排序的Python工具包

Rankify: un conjunto de herramientas de Python para la recuperación y reordenación de la información

Introducción general Rankify es un conjunto de herramientas Python de código abierto desarrollado por el Data Science Group de la Universidad de Innsbruck, Austria. Se centra en la recuperación de información, la reordenación y la generación de aumento de la recuperación (RAG), proporcionando un marco unificado. El conjunto de herramientas incluye 40 puntos de referencia...
hace 1 año
055.8K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: una herramienta de código abierto para la conexión y gestión flexibles de inteligencias artificiales

Introducción general AgentIQ es una herramienta de código abierto de NVIDIA diseñada para ayudar a los desarrolladores a conectar y gestionar eficientemente las inteligencias de IA. Permite a las inteligencias de diferentes marcos colaborar sin problemas, conectar datos y herramientas empresariales y crear flujos de trabajo como funciones de llamada. Lo más importante de la herramienta...
hace 1 año
055.8K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: genere datos de entrenamiento de IA mediante la API gratuita de big models, generación de datos de entrenamiento de big models a coste 0.

Introducción completa SFT-data-builder es un proyecto de código abierto diseñado para generar datos de entrenamiento SFT de alta calidad utilizando la API gratuita Big Model combinada con datos de dominio privado de los usuarios. La herramienta admite múltiples formatos de modelos de IA y ofrece generación con un solo clic, generación por lotes, edición flexible y...
hace 1 año
055.8K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: un modelo de lenguaje visual de código abierto para el razonamiento multimodal

Introducción exhaustiva R1-Onevision es un modelo de macrolenguaje multimodal de código abierto desarrollado por el equipo Fancy-MLLM, centrado en la combinación profunda de visión y lenguaje, capaz de procesar entradas multimodales como imágenes y texto, y de actuar en los campos del razonamiento visual, la comprensión de imágenes, la resolución matemática, etc. ....
hace 1 año
055.7K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli

Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...
hace 1 año
055.6K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI: proyecto de código abierto de navegación por herramientas ligeras de IA

Introducción completa Tap4 AI WebUI es un proyecto de sitio web de navegación de herramientas de IA de código abierto, diseñado para ayudar a los usuarios a construir fácilmente su propio catálogo de herramientas de IA. El proyecto utiliza Next.js y la pila de tecnología Supabase , soporte para la optimización SEO multi-idioma para proporcionar AI...
hace 1 año
055.6K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: un entorno de programación visual de código abierto para probar y evaluar la eficacia de grandes sugerencias de modelos lingüísticos

Introducción general ChainForge es un entorno de programación visual de código abierto diseñado para probar y evaluar la eficacia de grandes modelos de lenguaje (LLM). Proporciona un entorno de ingeniería de señales de flujo de datos a través del cual los usuarios pueden explorar y analizar rápidamente la calidad de las diferentes señales en la respuesta LLM....
hace 1 año
055.6K
简单易用的开源AI写作助手

Asistente de escritura con inteligencia artificial de código abierto y fácil de usar

Introducción general AI Writing Assistant es un asistente de escritura AI de código abierto basado en Next.js, alojado en GitHub, diseñado para ayudar a escritores, creadores de contenido y profesionales de la redacción a mejorar la eficiencia y la calidad de su escritura a través de la tecnología de inteligencia artificial. La herramienta permite a los usuarios detallar...
hace 1 año
055.5K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: inteligencias polivalentes que revisan, validan y formatean los resultados para obtener resultados de alta calidad.

Introducción exhaustiva Kheish es un agente multirol de código abierto diseñado para tareas de modelado de grandes lenguajes (LLM) que requieren una colaboración estructurada paso a paso.Kheish es más que un simple coordinador, es un agente inteligente por derecho propio, que solicita módulos bajo demanda, integra...
hace 1 año
055.5K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: Integración de múltiples fuentes de datos en un único archivo de texto

Introducción completa OneFileLLM es una herramienta de línea de comandos de código abierto diseñada para consolidar múltiples fuentes de datos en un único archivo de texto para facilitar la entrada en grandes modelos lingüísticos (LLM). Permite procesar repositorios de GitHub, artículos de ArXiv, transcripciones de vídeos de YouTube,...
hace 12 meses
055.5K
Story-Flicks:输入主题自动生成儿童短故事视频

Story-Flicks: introduce temas para generar automáticamente vídeos de cuentos infantiles

Introducción completa Story-Flicks es una herramienta de IA de código abierto centrada en ayudar a los usuarios a generar rápidamente vídeos de historias en alta definición. Los usuarios sólo tienen que introducir un tema de la historia, y el sistema generará el contenido de la historia a través de un modelo de lenguaje grande, y combinar las imágenes generadas por IA, audio y subtítulos para...
hace 1 año
055.5K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: integra fácilmente múltiples modelos de IA y crea aplicaciones multimodales basadas en Gradio

Introducción general ai-gradio es un conjunto de herramientas Python de código abierto diseñado para ayudar a los desarrolladores a integrar y utilizar fácilmente múltiples modelos de IA. Construido sobre Gradio, el proyecto proporciona una interfaz unificada para soportar múltiples modelos y servicios de IA. Ya sea texto, voz o vídeo...
hace 1 año
055.4K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

Generador llms.txt: Capture rápidamente el contenido del sitio web y genere conjuntos de datos de texto de formación LLM.

Introducción general llmstxt-generator es una herramienta profesional de extracción e integración de contenido web dedicada a la preparación de conjuntos de datos de texto de alta calidad para el entrenamiento y la inferencia en Large Language Models (LLM). La herramienta fue desarrollada por Mendable AI utilizando @firec...
hace 1 año
055.4K
Instructor:简化大语言模型结构化输出工作流的Python库

Instructor: una biblioteca de Python que simplifica los flujos de trabajo de salida estructurados para grandes modelos lingüísticos.

Introducción general Instructor es una popular biblioteca de Python diseñada para procesar resultados estructurados de grandes modelos lingüísticos (LLM). Basada en Pydantic, proporciona una API sencilla, transparente y fácil de usar para gestionar datos...
hace 1 año
055.4K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: sistema de sincronización labial y edición de vídeo basado en audio

Introducción general VideoReTalking es un sistema innovador que permite al usuario generar vídeos faciales sincronizados con los labios a partir del audio de entrada, produciendo vídeos de salida de alta calidad y sincronizados con los labios incluso con diferentes emociones. El sistema divide este objetivo en tres tareas consecutivas: con expresiones típicas...
hace 1 año
055.4K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN: un modelo de código abierto para generar música/bandas sonoras multipista y crear fácilmente clips musicales para varios instrumentos.

Introducción general MuseGAN es un proyecto de generación musical basado en redes generativas adversariales (GAN) diseñado para generar música multipista (multiinstrumento). El proyecto es capaz de generar música desde cero o acompañada de pistas suministradas por el usuario.MuseGAN utiliza Lakh Pianor...
hace 1 año
055.3K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: a bi-directional pipelined parallel algorithm to improve the efficiency of large-scale AI model training (DeepSeek Open Source Week Day 4)

Introducción general DualPipe es una tecnología de código abierto desarrollada por el equipo de DeepSeek-AI centrada en mejorar la eficiencia del entrenamiento de modelos de IA a gran escala. Se trata de un innovador algoritmo paralelo bidireccional canalizado que se utiliza principalmente en DeepSeek-V3 y R1....
hace 1 año
055.3K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: ¡utiliza los grandes modelos de Qwen en la barra de menús de Mac para conversar en cualquier momento!

Introducción general Qwen4Mac es un proyecto de código abierto diseñado para integrar el Qwen Large Language Model (LLM) en la barra de menú del Mac, facilitando a los usuarios su llamada y uso en cualquier momento. El proyecto está desarrollado y mantenido por andreaturchet y proporciona una manera fácil para que los usuarios...
hace 1 año
055.2K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: una persona digital secundaria que permite la retransmisión en directo de la estación B y la interacción por voz.

VirtualWife es un proyecto de persona digital virtual de código abierto creado por el desarrollador yakami129. Actualmente se encuentra en fase de incubación. El objetivo es crear un personaje virtual con "alma", con el que el usuario pueda interactuar como con un amigo. El proyecto cuenta con el apoyo de B Station Live...
hace 1 año
055.2K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher: recuperación eficiente de documentos privados de empresas y preguntas y respuestas inteligentes

Descripción general Deep Searcher es una herramienta que combina potentes modelos de big language (como DeepSeek y OpenAI) y bases de datos vectoriales (como Milvus) diseñados para buscar, evaluar y razonar basándose en datos privados, proporcionando respuestas altamente precisas...
hace 1 año
055.1K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: generación de vídeos con control preciso de la postura humana, creación de bailarinas

Introducción general DisPose es un innovador proyecto de inteligencia artificial de código abierto centrado en la generación controlada de animación de imágenes de personajes. Desarrollado por un equipo de investigadores y de código abierto en GitHub, el proyecto utiliza técnicas avanzadas de aprendizaje profundo para lograr un control preciso de la animación de personajes mediante la descomposición de la información de pose esquelética.D...
hace 1 año
055.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: una versión de código abierto del modelo OpenAI o1 basado en Qwen2-7B-Instruye el ajuste fino para explorar modelos de inferencia abiertos para resolver problemas complejos.

Introducción Marco-o1 es un modelo de razonamiento abierto desarrollado por Alibaba International Digital Commerce Group (AIDC-AI) para resolver problemas complejos del mundo real. El modelo combina el ajuste fino de Chain of Thought (CoT), Monte Carlo Tree Search (MCTS) y estrategias de razonamiento innovadoras....
hace 1 año
055K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: resuma un libro entero en un clic, destile eficazmente el contenido del libro y capte rápidamente las ideas centrales.

Introducción completa TextDistiller es una herramienta avanzada basada en IA diseñada para resumir libros capítulo a capítulo o en su totalidad, proporcionando una visión general concisa pero completa. Con TextDistiller, los usuarios pueden captar rápidamente las ideas centrales y los puntos clave de cualquier libro...
hace 1 año
054.9K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: un servicio todo en uno que utiliza modelos visuales para la ingestión de documentos y la agrupación inteligente basada en la jerarquía de párrafos de texto.

Introducción general Chunkr es una API autoalojada dedicada a convertir archivos PDF, PPTX, DOCX y Excel en datos aptos para su uso en RAG (Retrieval Augmented Generation) y LLM (Large Language Modelling). El proyecto fue desarrollado por Lumina...
hace 1 año
054.9K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Modelo de transferencia de maquillaje jerárquico autosupervisado, maquillaje virtual, migración del maquillaje a nuevos retratos.

Introducción exhaustiva SHMT (Self-supervised Hierarchical Makeup Transfer) es un proyecto de migración de maquillaje jerárquico autosupervisado basado en un modelo de difusión latente, cuyo objetivo es lograr una alta calidad de los efectos de maquillaje mediante métodos de aprendizaje no supervisados....
hace 1 año
054.9K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: sistema de procesamiento de documentos PDF y preguntas y respuestas basado en FastAPI

Introducción general FastAPI DocGPT es un sistema de cuestionarios sobre documentos basado en FastAPI que permite a los usuarios cargar archivos PDF y realizar cuestionarios basados en el contenido de los documentos. El sistema utiliza la tecnología de incrustación de OpenAI para incrustar el contenido del documento en una base de datos vectorial Q...
hace 1 año
054.9K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: un transformador autorregresivo de una etapa para la generación automática de canciones

Introducción SongGen es un modelo autorregresivo de Transformación de una sola etapa, de código abierto, diseñado para tareas de generación de texto a canción. El modelo es capaz de generar canciones que contienen voces y pistas de acompañamiento de entrada de texto.SongGen proporciona un control de grano fino sobre una amplia gama de atributos musicales ...
hace 1 año
054.9K
StickerBaker:用AI制作个性贴纸图片

StickerBaker: Crea pegatinas personalizadas con IA

Descripción general stickerbaker es un creador de pegatinas de código abierto que utiliza tecnología de inteligencia artificial para crear una gran variedad de pegatinas interesantes. Tanto si quieres una simple pegatina de un gato como si quieres hacer una serie de pegatinas diversas, stickerbaker puede satisfacer tus necesidades....
hace 2 años
054.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: extrae los datos del cuerpo de una URL HTML, salida texto plano/markdown

Introducción general magic-html es una biblioteca de Python diseñada para simplificar el proceso de extracción del contenido de la región del cuerpo a partir de HTML. Tanto si se trata de estructuras HTML complejas como de páginas web sencillas, esta biblioteca pretende proporcionar una interfaz cómoda y eficiente a los usuarios. Soporta la extracción multimodal...
hace 2 años
054.8K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: herramientas de gestión de marcadores AI de código abierto, compatible con múltiples formatos, clasificación inteligente de etiquetas, búsqueda de texto completo

Descripción general Hoarder es una herramienta de gestión de marcadores autoalojada que permite almacenar enlaces, notas, PDF e imágenes. Utiliza tecnología de IA para el etiquetado automático y ofrece funciones de búsqueda de texto completo. Los usuarios pueden utilizar el plugin de Chrome y el plugin de Firefox...
hace 1 año
054.7K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: plataforma de búsqueda de grandes modelos y AI localizada para datos personales (avance)

Introducción Quanta Quest es el primer producto del mundo con "end-side big model + C-side data localisation" como dirección de evolución central. Ayuda a los usuarios a almacenar todos los datos de Gmail, Notion, Dropbox, etc. localmente, y procesarlos a través de la base de datos vectorial para garantizar...
hace 1 año
054.7K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch: una herramienta de visualización para supervisar y optimizar los procesos de LLM basada en el marco DSPy

Introducción completa LangWatch es una plataforma completa diseñada para las operaciones de grandes modelos lingüísticos (LLM), que proporciona supervisión, análisis, evaluación, gestión de conjuntos de datos y optimización de pistas. La plataforma se basa en el marco DSPy de la Universidad de Stanford y está diseñada para ayudar a los usuarios a gestionar y optimizar mejor...
hace 1 año
054.7K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: Iluminación de imágenes con herramientas de pintura inteligentes

Introducción general LuminaBrush es una innovadora herramienta interactiva de edición de imágenes para efectos de iluminación, impulsada por tecnología de inteligencia artificial. El proyecto utiliza un marco de dos etapas para procesar imágenes: la primera etapa transforma la imagen de entrada en un aspecto "uniformemente iluminado", mientras que la segunda genera...
hace 1 año
054.7K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM: búsqueda de datos en la web basada en temas, generación de artículos con citas, informes de artículos largos

Introducción general STORM es un sistema de integración de conocimientos y generación de artículos desarrollado por el equipo Oval de la Universidad de Stanford. Se centra en la generación exhaustiva de artículos tipo Wikipedia (documentos sistemáticos) desde cero. El sistema utiliza modelos lingüísticos a gran escala para la investigación de temas, la preparación de sinopsis y la simulación de...
hace 1 año
054.6K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: un nuevo marco de orquestación de agentes impulsado por LLM y EKG (conocimiento del sector)

Introducción general muAgent es un innovador marco multiinteligentsia desarrollado por Ant Group. El marco ayuda a los usuarios a ejecutar diversos procedimientos operativos estándar (SOP) complejos bajo orientación humana mediante arrastrar y soltar en lienzo y escritura de texto simple, en colaboración con multiintelligentsia, llamadas a funciones, intérpretes de código y otras tecnologías....
hace 1 año
054.6K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat: asistente de programación asistido por IA basado en la línea de comandos del terminal con el complemento VSCode.

Introducción general Auto-Coder.Chat es una herramienta de programación asistida por IA basada en terminal diseñada para mejorar la eficiencia de programación de los desarrolladores a través de medios inteligentes. La herramienta se puede utilizar con cualquier IDE para permitir la programación asistida por IA en herramientas de desarrollo.Auto...
hace 1 año
054.6K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: un marco para la colaboración multiinteligente en clústeres

Quantum Swarm es un marco de inteligencia artificial de código abierto centrado en el desarrollo y la investigación de inteligencia poblacional AI. El proyecto es mantenido por el equipo de Quarm AI en GitHub y tiene como objetivo proporcionar una plataforma flexible y eficiente para construir y probar sistemas multiinteligencia.Quan...
hace 1 año
054.5K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: convierte dibujos estáticos en animaciones de bocetos guiadas por texto, simplificando el proceso de animación.

Introducción general FlipSketch es un proyecto de código abierto diseñado para convertir dibujos estáticos en animaciones guiadas por texto. Alojado en GitHub, el proyecto proporciona una herramienta innovadora que permite a los usuarios generar efectos de animación a partir de descripciones de texto.FlipSketch combina...
hace 1 año
054.5K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...
hace 1 año
054.4K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher: búsqueda profunda y razonamiento por pasos para responder a preguntas complejas

Descripción general II-Researcher es una herramienta de investigación de IA de código abierto desarrollada por el equipo Intelligent-Internet y alojada en GitHub.Está diseñada para la búsqueda profunda y el razonamiento complejo, con la capacidad de buscar a través de páginas web inteligentes y sub...
hace 1 año
054.3K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill: extracción por lotes de información estructurada de documentos y análisis automatizado

Introducción general Rowfill es una plataforma de procesamiento de documentos de código abierto diseñada para trabajadores del conocimiento. Utiliza técnicas avanzadas de inteligencia artificial para extraer, analizar y procesar datos de documentos complejos, imágenes y PDFs.Rowfill soporta Native Large Language Model (LLM) y Ope...
hace 1 año
054.3K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de generación de poses para hacer bailar las fotos de Missy

Introducción general X-Dyna es un proyecto de código abierto desarrollado por ByteDance para generar animaciones dinámicas de retratos utilizando técnicas de difusión de muestra cero. El proyecto utiliza expresiones faciales y movimientos corporales en vídeo de unidad para animar imágenes de retratos individuales, generando efectos de movimiento realistas y conscientes del contexto.X-D...
hace 1 año
054.3K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA: Inteligencia Artificial basada en LangGraph para controlar operaciones informáticas

LangGraph CUA es un proyecto de código abierto desarrollado por el equipo de LangChain. Se basa en el marco LangGraph, lo que permite a los desarrolladores utilizar Python para construir inteligencias AI que pueden operar directamente el ordenador. El núcleo de esta herramienta ...
hace 1 año
054.3K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: soluciones eficaces de formación de modelos de IA a gran escala

Introducción ColossalAI es una plataforma de código abierto desarrollada por HPC-AI Technologies, con el objetivo de proporcionar una solución eficiente y rentable para el entrenamiento y la inferencia de modelos de IA a gran escala. Al soportar múltiples estrategias paralelas, gestión de memoria heterogénea y entrenamiento de precisión mixta, ColossalAI...
hace 1 año
054.2K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: Controla el movimiento de los objetos en el vídeo, añadiendo o restando cualquier objeto en movimiento en el vídeo.

Introducción general Go-with-the-Flow es un proyecto de código abierto desarrollado por el equipo de investigación de Netflix Eyeline Studios para controlar los patrones de movimiento de los modelos de difusión de vídeo mediante la distorsión del ruido. El proyecto permite al usuario determinar cómo la cámara de la escena y...
hace 1 año
054K
TableGPT2:表格数据集成的多模态模型

TableGPT2: un modelo multimodal para la integración de datos tabulares

Introducción general TableGPT2 es un modelo multimodal desarrollado por un equipo de la Universidad de Zhejiang, centrado en la integración y el procesamiento de datos tabulares. El modelo está preentrenado y perfeccionado para poder realizar tareas relacionadas con datos de tablas, al tiempo que mantiene unas sólidas capacidades de lenguaje y codificación de propósito general.TableGP...
hace 1 año
053.9K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT: modelización de los conocimientos jurídicos chinos, apoyo a los cuestionarios jurídicos y formación para los exámenes judiciales.

Introducción general LaWGPT es un proyecto de código abierto apoyado por el Grupo de Investigación de Aprendizaje Automático y Minería de Datos de la Universidad de Nanjing, que se dedica a construir un gran modelo lingüístico basado en el conocimiento jurídico chino. Se basa en modelos chinos genéricos (como Chinese-LLaMA y ChatGLM)...
hace 1 año
053.9K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora: Extracción de subtítulos de audiolibros y traducción multilingüe, transcripción de audiolibros a varios idiomas

Introducción LiberSonora, que significa "sonido libre", es un potente conjunto de herramientas de código abierto para audiolibros. Es compatible con la extracción inteligente de subtítulos, la generación de títulos AI, traducción multi-idioma, etc., y es capaz de procesamiento por lotes fuera de línea bajo GPU acceleration.LiberSo...
hace 1 año
053.9K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: Creación de un marco de desarrollo de aplicaciones de datos nativas de IA que integra la gestión multimodelo y el procesamiento inteligente de datos

Introducción general DB-GPT es un marco de desarrollo de aplicaciones de datos nativas de IA de código abierto construido utilizando AWEL (Agentic Workflow Expression Language) y tecnologías de cuerpo inteligente. El proyecto pretende crear una infraestructura en el ámbito de los grandes modelos...
hace 1 año
053.9K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V: un modelo gráfico híbrido de razonamiento multimodal de código abierto por Kunlun Wanwen

Introducción general Skywork-R1V es un modelo de razonamiento multimodal de código abierto desarrollado por el equipo SkyworkAI (Kunlun Wanwei) y publicado en GitHub.Es capaz de procesar imágenes y texto simultáneamente, realizar razonamientos lógicos multipaso, y es particularmente bueno analizando problemas complejos de imágenes. Este...
hace 1 año
053.8K