Proyecto AI de código abierto

Total 1020 artículos
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码

Morphic: motor de búsqueda de código abierto impulsado por inteligencia artificial que ofrece preguntas y respuestas inteligentes, búsqueda de vídeos y generación de código de interfaz de usuario.

Introducción general Morphic es un motor de búsqueda basado en tecnología de IA con una interfaz de usuario generativa diseñada para ofrecer preguntas y respuestas inteligentes y una experiencia de búsqueda eficiente. Los usuarios pueden realizar una gran variedad de búsquedas con Morphic, incluyendo texto, vídeo, etc., y pueden guardar el historial de búsqueda y compartir los resultados.Mo...
hace 2 años
061.9K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Generador de muestras de texto a vídeo cero lanzado por el equipo de investigación de IA de Picsart

Introducción general Text2Video-Zero es una implementación oficial de un generador de texto a vídeo de muestra cero para GitHub desarrollado por el equipo Picsart AI Research.El proyecto proporciona una forma de utilizar pistas de texto para generar texto con consistencia temporal y...
hace 2 años
061.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: Complemento del navegador para que ChatGPT funcione en otras páginas web

Introducción general ChatGPT Box es una extensión de navegador de código abierto diseñada para integrar profundamente ChatGPT en el navegador de un usuario. Desarrollada por josStorer, la herramienta soporta múltiples idiomas y proporciona una variedad de características tales como llamar a pares de chat en cualquier página...
hace 1 año
061.8K
Lecca:无代码构建AI智能体与AI工作流构建平台

Lecca: Creación de plataformas de inteligencia artificial y flujo de trabajo de inteligencia artificial sin código

Introducción exhaustiva Lecca es una potente plataforma de IA que permite a los usuarios configurar y desplegar grandes modelos lingüísticos (LLM) con múltiples herramientas y flujos de trabajo. Los usuarios pueden construir, personalizar y automatizar fácilmente sus agentes de IA.Lecca ofrece una amplia selección de proveedores de IA y modelos...
hace 1 año
061.8K
Agent-Wiz:分析AI智能体工作流程和安全风险

Agent-Wiz: análisis de los flujos de trabajo y los riesgos de seguridad de AI Intelligentsia

Introducción general Agent-Wiz es una herramienta de línea de comandos Python de código abierto diseñada para desarrolladores, investigadores y equipos de seguridad. Puede extraer flujos de trabajo complejos de los principales marcos de inteligencia artificial como LangGraph, CrewAI, AutoGen, etc., para generar...
hace 1 año
061.8K
OneLine:生成热点事件时间轴的AI工具

OneLine: una herramienta de IA para generar cronologías de acontecimientos candentes

Introducción general OneLine es una herramienta de código abierto para generar cronologías de eventos alojada en GitHub y desarrollada por el usuario chengtx809. Genera rápidamente una línea de tiempo de eventos por palabras clave introducidas por el usuario, mostrando la hora, título, descripción y personas relacionadas del evento....
hace 1 año
061.7K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: una herramienta de código abierto para generar retratos hablados realistas

Introducción general FantasyTalking es un proyecto de código abierto desarrollado por el equipo Fantasy-AMAP, centrado en la generación de realismo hablando videos retrato a través de la unidad de audio. El proyecto se basa en el modelo avanzado de difusión de vídeo Wan2.1 , combinado con el codificador de audio Wa...
hace 1 año
061.7K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension: Extensión del navegador para sincronizar contenidos generados por IA con plataformas de autopublicación en un clic

Introducción General MultiPost-Extension es una extensión del navegador de gran alcance diseñado para ayudar a los usuarios publicar contenido en múltiples plataformas de medios sociales en un solo clic. La extensión soporta la publicación simultánea en más de 10 plataformas principales, incluyendo Zhihu, Weibo, Xiaohongshu, TikTok ...
hace 1 año
061.7K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

OpenHealthForAll: asistente de IA para la gestión de datos sanitarios personales, carga de informes de exámenes para un plan de salud personalizado.

Introducción general OpenHealthForAll es un proyecto de código abierto diseñado para ayudar a los usuarios a gestionar y comprender sus datos personales de salud. Aprovechando la tecnología de inteligencia artificial, OpenHealthForAll proporciona un asistente de salud de gestión local para ayudar a los usuarios a gestionar mejor...
hace 1 año
061.7K
Instructor:简化大语言模型结构化输出工作流的Python库

Instructor: una biblioteca de Python que simplifica los flujos de trabajo de salida estructurados para grandes modelos lingüísticos.

Introducción general Instructor es una popular biblioteca de Python diseñada para procesar resultados estructurados de grandes modelos lingüísticos (LLM). Basada en Pydantic, proporciona una API sencilla, transparente y fácil de usar para gestionar datos...
hace 1 año
061.6K
self.so:一键生成精美的个人简历网页

self.so: ¡Genera una bonita página de CV con un solo clic!

Introducción general self.so es una herramienta de código abierto diseñada para convertir rápidamente un CV o un perfil de LinkedIn en un sitio web personal. Los usuarios simplemente cargan un CV en PDF o introducen un enlace de LinkedIn, y el sistema lo convierte en un sitio web personal utilizando tecnología de IA (basada en Tog...
hace 1 año
061.6K
Claude生成深度研究报告的MCP服务

Servicio MCP de Claude para generar informes de investigación en profundidad

Introducción general MCP Server Deep Research es una herramienta de código abierto que genera automáticamente informes de investigación estructurados para problemas complejos mediante inteligencia artificial y búsqueda en la web. Los usuarios introducen una pregunta de investigación y la herramienta la desglosa, busca información autorizada, evalúa la credibilidad de las fuentes...
hace 1 año
061.6K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: un marco de automatización de IA de código abierto que admite la colaboración multiinteligencia

Introducción general LangManus es un marco de automatización de IA de código abierto alojado en GitHub. Desarrollado por un grupo de antiguos compañeros en su tiempo libre, se trata de un proyecto de orientación académica con el objetivo de combinar modelos lingüísticos y herramientas especializadas para la búsqueda web, el rastreo de datos y la ejecución de código....
hace 1 año
061.6K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: Automatización de navegadores, implementación de código abierto de OpenAI Operator

Introducción general AI Web Operator es una herramienta de código abierto AI navegador operador diseñado para simplificar la experiencia del usuario en el navegador mediante la integración de múltiples tecnologías de IA y SDKs. La herramienta se basa en Browserbase y Vercel....
hace 1 año
061.6K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: herramienta interactiva de edición de imágenes, control de la posición de las imágenes mediante apuntar y hacer clic y arrastrar y soltar.

Introducción general DragGAN es una herramienta interactiva de edición de imágenes basada en Redes Generativas Adversariales (GAN). Fue lanzada por Xingang Pan et al. en SIGGRAPH 2023 y tiene como objetivo permitir a los usuarios manipular intuitivamente a través de simples operaciones de apuntar y hacer clic y arrastrar y soltar....
hace 1 año
061.5K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

Generador llms.txt: Capture rápidamente el contenido del sitio web y genere conjuntos de datos de texto de formación LLM.

Introducción general llmstxt-generator es una herramienta profesional de extracción e integración de contenido web dedicada a la preparación de conjuntos de datos de texto de alta calidad para el entrenamiento y la inferencia en Large Language Models (LLM). La herramienta fue desarrollada por Mendable AI utilizando @firec...
hace 1 año
061.4K
GaiaNet node:安装和运行自己的本地模型在线代理服务

Nodo GaiaNet: instale y ejecute su propio modelo local de servicio proxy en línea

Introducción general GaiaNet-AI/gaianet-node es un proyecto de código abierto que permite a los usuarios instalar rápidamente la pila de software de nodos por defecto en Mac, Linux o Windows WSL con un solo comando. Los usuarios pueden inicializar nodos, personalizar configuraciones, descargar...
hace 2 años
061.4K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Academic: Mejor artículo académico de Arxiv Traducción, corrección de errores e interpretación de códigos

Introducción general GPT Academic es una plataforma interactiva para grandes modelos lingüísticos optimizada para la investigación académica, que proporciona herramientas para interfaces interactivas pragmáticas con grandes modelos lingüísticos como GPT/GLM, optimizadas específicamente para la experiencia de traducción, lectura, pulido y redacción de documentos. Utiliza un diseño modular...
hace 2 años
061.4K
Pyramid Flow:快手推出的开源版

Pyramid Flow: una versión de código abierto de "Kringle" lanzada por Racer, basada en SD3 y que funciona en GPU de menos de 8 GB (versión de despliegue con un solo clic).

Introducción exhaustiva Pyramid Flow es un eficaz método autorregresivo de generación de vídeo basado en la técnica Flow Matching. El método consigue una mayor eficiencia computacional en la generación y descompresión de contenidos de vídeo interpolando entre diferentes resoluciones y niveles de ruido....
hace 2 años
061.4K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: integra fácilmente múltiples modelos de IA y crea aplicaciones multimodales basadas en Gradio

Introducción general ai-gradio es un conjunto de herramientas Python de código abierto diseñado para ayudar a los desarrolladores a integrar y utilizar fácilmente múltiples modelos de IA. Construido sobre Gradio, el proyecto proporciona una interfaz unificada para soportar múltiples modelos y servicios de IA. Ya sea texto, voz o vídeo...
hace 1 año
061.4K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI Portrait Master versión china: Herramienta de palabras clave para optimizar la generación de retratos

Introducción General ComfyUI Portrait Master versión China es una herramienta de generación de palabras clave para retratos diseñada para creadores de imágenes AI. La herramienta ayuda a los usuarios a generar retratos de alta calidad mediante la optimización de las palabras clave. Los usuarios pueden elegir diferentes lentes según la demanda...
hace 2 años
061.3K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: un modelo de lenguaje visual de código abierto para el razonamiento multimodal

Introducción exhaustiva R1-Onevision es un modelo de macrolenguaje multimodal de código abierto desarrollado por el equipo Fancy-MLLM, centrado en la combinación profunda de visión y lenguaje, capaz de procesar entradas multimodales como imágenes y texto, y de actuar en los campos del razonamiento visual, la comprensión de imágenes, la resolución matemática, etc. ....
hace 1 año
061.3K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: plataforma de código abierto para el aprendizaje por refuerzo del razonamiento a gran escala

Introducción general Open-Reasoner-Zero es un proyecto de código abierto centrado en la investigación del aprendizaje por refuerzo (RL), desarrollado por el equipo Open-Reasoner-Zero en GitHub. Su objetivo es proporcionar un entrenamiento eficiente, escalable y fácil de usar...
hace 1 año
061.2K
Rankify:支持信息检索与重排序的Python工具包

Rankify: un conjunto de herramientas de Python para la recuperación y reordenación de la información

Introducción general Rankify es un conjunto de herramientas Python de código abierto desarrollado por el Data Science Group de la Universidad de Innsbruck, Austria. Se centra en la recuperación de información, la reordenación y la generación de aumento de la recuperación (RAG), proporcionando un marco unificado. El conjunto de herramientas incluye 40 puntos de referencia...
hace 1 año
061.2K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher: herramienta automatizada de investigación en profundidad para redactar informes de investigación completos.

Introducción general OpenDeepResearcher es una herramienta de investigación profunda automatizada de código abierto diseñada para mejorar la eficiencia de la investigación mediante técnicas de inteligencia artificial. El proyecto está desarrollado por mshumer y alojado en GitHub.OpenDeepResear...
hace 1 año
061.1K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: sistema de procesamiento de documentos PDF y preguntas y respuestas basado en FastAPI

Introducción general FastAPI DocGPT es un sistema de cuestionarios sobre documentos basado en FastAPI que permite a los usuarios cargar archivos PDF y realizar cuestionarios basados en el contenido de los documentos. El sistema utiliza la tecnología de incrustación de OpenAI para incrustar el contenido del documento en una base de datos vectorial Q...
hace 2 años
061.1K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: Marco de orquestación de cuerpos inteligentes con soporte de agentes RAG y LLM para simplificar el desarrollo de aplicaciones de IA

Introducción general Dynamiq es un marco de orquestación de IA de código abierto diseñado para aplicaciones de IA de agentes y Large Language Modelling (LLM). Su objetivo es simplificar el desarrollo de aplicaciones basadas en IA, especialmente en el área de la Generación Aumentada de Recuperación (RAG) y la orquestación de agentes LLM.Dynamiq propone...
hace 2 años
061.1K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: extrae los datos del cuerpo de una URL HTML, salida texto plano/markdown

Introducción general magic-html es una biblioteca de Python diseñada para simplificar el proceso de extracción del contenido de la región del cuerpo a partir de HTML. Tanto si se trata de estructuras HTML complejas como de páginas web sencillas, esta biblioteca pretende proporcionar una interfaz cómoda y eficiente a los usuarios. Soporta la extracción multimodal...
hace 2 años
061.1K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: resuma un libro entero en un clic, destile eficazmente el contenido del libro y capte rápidamente las ideas centrales.

Introducción completa TextDistiller es una herramienta avanzada basada en IA diseñada para resumir libros capítulo a capítulo o en su totalidad, proporcionando una visión general concisa pero completa. Con TextDistiller, los usuarios pueden captar rápidamente las ideas centrales y los puntos clave de cualquier libro...
hace 2 años
061.1K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: una solución de memoria a largo plazo basada en el perfil del usuario para aplicaciones de IA

Introducción general Memobase es un sistema de memoria basado en el perfil del usuario diseñado para soportar una memoria de usuario duradera para aplicaciones de IA generativa. Tanto si estás construyendo un compañero virtual, una herramienta educativa o un asistente personalizado, Memobase ayuda a tu IA a recordar, comprender y crecer con el uso de...
hace 1 año
061K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM: búsqueda de datos en la web basada en temas, generación de artículos con citas, informes de artículos largos

Introducción general STORM es un sistema de integración de conocimientos y generación de artículos desarrollado por el equipo Oval de la Universidad de Stanford. Se centra en la generación exhaustiva de artículos tipo Wikipedia (documentos sistemáticos) desde cero. El sistema utiliza modelos lingüísticos a gran escala para la investigación de temas, la preparación de sinopsis y la simulación de...
hace 1 año
061K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: inteligencias polivalentes que revisan, validan y formatean los resultados para obtener resultados de alta calidad.

Introducción exhaustiva Kheish es un agente multirol de código abierto diseñado para tareas de modelado de grandes lenguajes (LLM) que requieren una colaboración estructurada paso a paso.Kheish es más que un simple coordinador, es un agente inteligente por derecho propio, que solicita módulos bajo demanda, integra...
hace 1 año
060.9K
agents.json:智能体通过自然语言与API交互的开源规范

agents.json: una especificación de código abierto para que las inteligencias interactúen con las API a través del lenguaje natural.

Introducción general agents.json es una especificación de código abierto desarrollada por el equipo Wildcard AI, basada en el estándar OpenAPI, diseñada para permitir que las inteligencias se comuniquen eficientemente con las APIs a través del lenguaje natural. Utiliza archivos JSON estructurados para definir ...
hace 1 año
060.9K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: generación de vídeos con control preciso de la postura humana, creación de bailarinas

Introducción general DisPose es un innovador proyecto de inteligencia artificial de código abierto centrado en la generación controlada de animación de imágenes de personajes. Desarrollado por un equipo de investigadores y de código abierto en GitHub, el proyecto utiliza técnicas avanzadas de aprendizaje profundo para lograr un control preciso de la animación de personajes mediante la descomposición de la información de pose esquelética.D...
hace 1 año
060.9K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher: recuperación eficiente de documentos privados de empresas y preguntas y respuestas inteligentes

Descripción general Deep Searcher es una herramienta que combina potentes modelos de big language (como DeepSeek y OpenAI) y bases de datos vectoriales (como Milvus) diseñados para buscar, evaluar y razonar basándose en datos privados, proporcionando respuestas altamente precisas...
hace 1 año
060.9K
MemFree:本地知识库与搜索信息混合的AI搜索引擎

MemFree: un motor de búsqueda de inteligencia artificial para mezclar bases de conocimiento local e información de búsqueda

Introducción general MemFree es un avanzado motor de búsqueda híbrido de IA capaz de buscar y hacer preguntas a través de texto, imágenes, documentos y páginas web. Proporciona acceso con un solo clic a los resultados de búsqueda de texto, mapas mentales, imágenes y vídeos.MemFree pretende extraer información de la base de conocimientos del usuario y...
hace 2 años
060.9K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos

Introducción general LivePortrait es una herramienta avanzada de animación dinámica de retratos AI desarrollada por Racer Technology. Utiliza una innovadora tecnología de IA para transformar imágenes fijas en vívidas animaciones de vídeo. Tanto si utiliza fotos reales, estilos de animación o retratos artísticos, LivePo...
hace 2 años
060.9K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: creación de grafos de conocimiento y motores de búsqueda personales de ejecución local

Introducción general Unigraph es un grafo de conocimiento de propósito general y motor de búsqueda personal diseñado para proporcionar a los usuarios un espacio de trabajo integrado que les ayude a gestionar y buscar una amplia variedad de datos en su vida personal. Con Unigraph, los usuarios pueden integrar datos de distintas fuentes en un...
hace 1 año
060.9K
StickerBaker:用AI制作个性贴纸图片

StickerBaker: Crea pegatinas personalizadas con IA

Descripción general stickerbaker es un creador de pegatinas de código abierto que utiliza tecnología de inteligencia artificial para crear una gran variedad de pegatinas interesantes. Tanto si quieres una simple pegatina de un gato como si quieres hacer una serie de pegatinas diversas, stickerbaker puede satisfacer tus necesidades....
hace 2 años
060.8K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: IA motriz basada en el aprendizaje por refuerzo para estudiar problemas complejos

Introducción general DeepResearcher es un proyecto de código abierto desarrollado por el equipo GAIR-NLP de la Universidad Jiao Tong de Shanghai. Se trata de una herramienta de investigación inteligente basada en grandes modelos lingüísticos (LLM), entrenados de principio a fin en entornos web reales mediante aprendizaje por refuerzo (RL). El proyecto ...
hace 1 año
060.8K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: ¡utiliza los grandes modelos de Qwen en la barra de menús de Mac para conversar en cualquier momento!

Introducción general Qwen4Mac es un proyecto de código abierto diseñado para integrar el Qwen Large Language Model (LLM) en la barra de menú del Mac, facilitando a los usuarios su llamada y uso en cualquier momento. El proyecto está desarrollado y mantenido por andreaturchet y proporciona una manera fácil para que los usuarios...
hace 1 año
060.8K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: una inteligencia que integra más de 500 herramientas de investigación para automatizar las tareas científicas y de investigación.

Introducción completa SciToolAgent es una plataforma de herramientas de código abierto desarrollada por el Centro de Innovación de la Universidad de Zhejiang en Hangzhou (HICAI-ZJU). Integra más de 500 herramientas científicas a través de tecnologías de grafos de conocimiento (SciToolKG) y modelado de grandes lenguajes para ayudar a los investigadores a enfrentarse a...
hace 1 año
060.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general mac assistant es un proyecto de cuerpo de inteligencia AI diseñado para macOS, con el objetivo de simplificar las operaciones del usuario mediante la combinación de software nativo y funciones web. Actualmente, el proyecto es compatible con las API OpenAI y GEMINI, y tiene previsto ...
hace 1 año
060.8K
XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目

XiaoYuanKouSuan_Auto: Herramienta automática de preguntas y respuestas XiaoYuanKouSuan, que resuelve eficazmente temas de aritmética oral.

Introducción completa Ape Mouth Calculator Automatic Question Answer Tool es un proyecto de código abierto basado en Python diseñado para resolver eficientemente las preguntas de la aplicación Ape Mouth Calculator a través de scripts de reconocimiento OCR y automatización. La herramienta hace uso de tecnologías como OpenCV y Tesseract para poder identificar las preguntas en la pantalla en tiempo real....
hace 2 años
060.7K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli

Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...
hace 1 año
060.7K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: un servicio todo en uno que utiliza modelos visuales para la ingestión de documentos y la agrupación inteligente basada en la jerarquía de párrafos de texto.

Introducción general Chunkr es una API autoalojada dedicada a convertir archivos PDF, PPTX, DOCX y Excel en datos aptos para su uso en RAG (Retrieval Augmented Generation) y LLM (Large Language Modelling). El proyecto fue desarrollado por Lumina...
hace 1 año
060.6K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill: extracción por lotes de información estructurada de documentos y análisis automatizado

Introducción general Rowfill es una plataforma de procesamiento de documentos de código abierto diseñada para trabajadores del conocimiento. Utiliza técnicas avanzadas de inteligencia artificial para extraer, analizar y procesar datos de documentos complejos, imágenes y PDFs.Rowfill soporta Native Large Language Model (LLM) y Ope...
hace 1 año
060.5K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送

InsightExpress: generar informes de investigación basados en IA y enviarlos por correo electrónico

Descripción general InsightExpress es una aplicación basada en Next.js que genera informes de investigación impulsados por IA basados en temas suministrados por el usuario y los envía por correo electrónico a los usuarios. La aplicación aprovecha la IA de Langflow ...
hace 1 año
060.5K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: una herramienta de código abierto para la conexión y gestión flexibles de inteligencias artificiales

Introducción general AgentIQ es una herramienta de código abierto de NVIDIA diseñada para ayudar a los desarrolladores a conectar y gestionar eficientemente las inteligencias de IA. Permite a las inteligencias de diferentes marcos colaborar sin problemas, conectar datos y herramientas empresariales y crear flujos de trabajo como funciones de llamada. Lo más importante de la herramienta...
hace 1 año
060.4K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: un transformador autorregresivo de una etapa para la generación automática de canciones

Introducción SongGen es un modelo autorregresivo de Transformación de una sola etapa, de código abierto, diseñado para tareas de generación de texto a canción. El modelo es capaz de generar canciones que contienen voces y pistas de acompañamiento de entrada de texto.SongGen proporciona un control de grano fino sobre una amplia gama de atributos musicales ...
hace 1 año
060.3K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: Integración de múltiples fuentes de datos en un único archivo de texto

Introducción completa OneFileLLM es una herramienta de línea de comandos de código abierto diseñada para consolidar múltiples fuentes de datos en un único archivo de texto para facilitar la entrada en grandes modelos lingüísticos (LLM). Permite procesar repositorios de GitHub, artículos de ArXiv, transcripciones de vídeos de YouTube,...
hace 1 año
060.3K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de generación de poses para hacer bailar las fotos de Missy

Introducción general X-Dyna es un proyecto de código abierto desarrollado por ByteDance para generar animaciones dinámicas de retratos utilizando técnicas de difusión de muestra cero. El proyecto utiliza expresiones faciales y movimientos corporales en vídeo de unidad para animar imágenes de retratos individuales, generando efectos de movimiento realistas y conscientes del contexto.X-D...
hace 1 año
060.3K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: un entorno de programación visual de código abierto para probar y evaluar la eficacia de grandes sugerencias de modelos lingüísticos

Introducción general ChainForge es un entorno de programación visual de código abierto diseñado para probar y evaluar la eficacia de grandes modelos de lenguaje (LLM). Proporciona un entorno de ingeniería de señales de flujo de datos a través del cual los usuarios pueden explorar y analizar rápidamente la calidad de las diferentes señales en la respuesta LLM....
hace 2 años
060.2K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: a bi-directional pipelined parallel algorithm to improve the efficiency of large-scale AI model training (DeepSeek Open Source Week Day 4)

Introducción general DualPipe es una tecnología de código abierto desarrollada por el equipo de DeepSeek-AI centrada en mejorar la eficiencia del entrenamiento de modelos de IA a gran escala. Se trata de un innovador algoritmo paralelo bidireccional canalizado que se utiliza principalmente en DeepSeek-V3 y R1....
hace 1 año
060.2K
简单易用的开源AI写作助手

Asistente de escritura con inteligencia artificial de código abierto y fácil de usar

Introducción general AI Writing Assistant es un asistente de escritura AI de código abierto basado en Next.js, alojado en GitHub, diseñado para ayudar a escritores, creadores de contenido y profesionales de la redacción a mejorar la eficiencia y la calidad de su escritura a través de la tecnología de inteligencia artificial. La herramienta permite a los usuarios detallar...
hace 1 año
060.2K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: un nuevo marco de orquestación de agentes impulsado por LLM y EKG (conocimiento del sector)

Introducción general muAgent es un innovador marco multiinteligentsia desarrollado por Ant Group. El marco ayuda a los usuarios a ejecutar diversos procedimientos operativos estándar (SOP) complejos bajo orientación humana mediante arrastrar y soltar en lienzo y escritura de texto simple, en colaboración con multiintelligentsia, llamadas a funciones, intérpretes de código y otras tecnologías....
hace 2 años
060.2K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat: asistente de programación asistido por IA basado en la línea de comandos del terminal con el complemento VSCode.

Introducción general Auto-Coder.Chat es una herramienta de programación asistida por IA basada en terminal diseñada para mejorar la eficiencia de programación de los desarrolladores a través de medios inteligentes. La herramienta se puede utilizar con cualquier IDE para permitir la programación asistida por IA en herramientas de desarrollo.Auto...
hace 1 año
060.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: una versión de código abierto del modelo OpenAI o1 basado en Qwen2-7B-Instruye el ajuste fino para explorar modelos de inferencia abiertos para resolver problemas complejos.

Introducción Marco-o1 es un modelo de razonamiento abierto desarrollado por Alibaba International Digital Commerce Group (AIDC-AI) para resolver problemas complejos del mundo real. El modelo combina el ajuste fino de Chain of Thought (CoT), Monte Carlo Tree Search (MCTS) y estrategias de razonamiento innovadoras....
hace 2 años
060.1K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Modelo de transferencia de maquillaje jerárquico autosupervisado, maquillaje virtual, migración del maquillaje a nuevos retratos.

Introducción exhaustiva SHMT (Self-supervised Hierarchical Makeup Transfer) es un proyecto de migración de maquillaje jerárquico autosupervisado basado en un modelo de difusión latente, cuyo objetivo es lograr una alta calidad de los efectos de maquillaje mediante métodos de aprendizaje no supervisados....
hace 1 año
060K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...
hace 1 año
060K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch: una herramienta de visualización para supervisar y optimizar los procesos de LLM basada en el marco DSPy

Introducción completa LangWatch es una plataforma completa diseñada para las operaciones de grandes modelos lingüísticos (LLM), que proporciona supervisión, análisis, evaluación, gestión de conjuntos de datos y optimización de pistas. La plataforma se basa en el marco DSPy de la Universidad de Stanford y está diseñada para ayudar a los usuarios a gestionar y optimizar mejor...
hace 1 año
060K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: sistema de sincronización labial y edición de vídeo basado en audio

Introducción general VideoReTalking es un sistema innovador que permite al usuario generar vídeos faciales sincronizados con los labios a partir del audio de entrada, produciendo vídeos de salida de alta calidad y sincronizados con los labios incluso con diferentes emociones. El sistema divide este objetivo en tres tareas consecutivas: con expresiones típicas...
hace 1 año
059.9K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora: Extracción de subtítulos de audiolibros y traducción multilingüe, transcripción de audiolibros a varios idiomas

Introducción LiberSonora, que significa "sonido libre", es un potente conjunto de herramientas de código abierto para audiolibros. Es compatible con la extracción inteligente de subtítulos, la generación de títulos AI, traducción multi-idioma, etc., y es capaz de procesamiento por lotes fuera de línea bajo GPU acceleration.LiberSo...
hace 1 año
059.9K
TableGPT2:表格数据集成的多模态模型

TableGPT2: un modelo multimodal para la integración de datos tabulares

Introducción general TableGPT2 es un modelo multimodal desarrollado por un equipo de la Universidad de Zhejiang, centrado en la integración y el procesamiento de datos tabulares. El modelo está preentrenado y perfeccionado para poder realizar tareas relacionadas con datos de tablas, al tiempo que mantiene unas sólidas capacidades de lenguaje y codificación de propósito general.TableGP...
hace 2 años
059.9K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT: modelización de los conocimientos jurídicos chinos, apoyo a los cuestionarios jurídicos y formación para los exámenes judiciales.

Introducción general LaWGPT es un proyecto de código abierto apoyado por el Grupo de Investigación de Aprendizaje Automático y Minería de Datos de la Universidad de Nanjing, que se dedica a construir un gran modelo lingüístico basado en el conocimiento jurídico chino. Se basa en modelos chinos genéricos (como Chinese-LLaMA y ChatGLM)...
hace 1 año
059.9K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: un marco para la colaboración multiinteligente en clústeres

Quantum Swarm es un marco de inteligencia artificial de código abierto centrado en el desarrollo y la investigación de inteligencia poblacional AI. El proyecto es mantenido por el equipo de Quarm AI en GitHub y tiene como objetivo proporcionar una plataforma flexible y eficiente para construir y probar sistemas multiinteligencia.Quan...
hace 1 año
059.7K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: una interfaz de chat limpia para interactuar con los modelos nativos de Ollama

Introducción general HiOllama es una interfaz fácil de usar basada en Python y Gradio, diseñada para interactuar con los modelos de Ollama. Proporciona una interfaz web sencilla e intuitiva que admite la generación de texto en tiempo real y funciones de gestión de modelos. Los usuarios pueden ajustar parámetros como la temperatura y la mayoría...
hace 2 años
059.7K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: convierte dibujos estáticos en animaciones de bocetos guiadas por texto, simplificando el proceso de animación.

Introducción general FlipSketch es un proyecto de código abierto diseñado para convertir dibujos estáticos en animaciones guiadas por texto. Alojado en GitHub, el proyecto proporciona una herramienta innovadora que permite a los usuarios generar efectos de animación a partir de descripciones de texto.FlipSketch combina...
hace 2 años
059.5K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA: Inteligencia Artificial basada en LangGraph para controlar operaciones informáticas

LangGraph CUA es un proyecto de código abierto desarrollado por el equipo de LangChain. Se basa en el marco LangGraph, lo que permite a los desarrolladores utilizar Python para construir inteligencias AI que pueden operar directamente el ordenador. El núcleo de esta herramienta ...
hace 1 año
059.5K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: una persona digital secundaria que permite la retransmisión en directo de la estación B y la interacción por voz.

VirtualWife es un proyecto de persona digital virtual de código abierto creado por el desarrollador yakami129. Actualmente se encuentra en fase de incubación. El objetivo es crear un personaje virtual con "alma", con el que el usuario pueda interactuar como con un amigo. El proyecto cuenta con el apoyo de B Station Live...
hace 1 año
059.5K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架

Chitu (Red Rabbit): el equipo de Tsinghua lanza un marco de razonamiento de alto rendimiento basado en grandes modelos lingüísticos

Chitu es un marco de razonamiento de código abierto desarrollado por el equipo PACMAN de la Universidad de Tsinghua, llamado "Red Rabbit", que está especialmente diseñado para ejecutar grandes modelos lingüísticos. Se centra en la eficiencia, la flexibilidad y la practicidad , lo que permite a las empresas desplegar rápidamente grandes modelos en diferentes dispositivos . Chitu soporta una variedad de hardware ...
hace 1 año
059.5K
DSPy Examples:展示DSPy功能的实用示例

Ejemplos DSPy: Ejemplos prácticos que demuestran la funcionalidad de DSPy

Introducción general La base de código de ejemplos DSPy es una base de código GitHub mantenida por el equipo de IA de Langtrace que muestra una variedad de programas de IA de ejemplo construidos con DSPy. La base de código está diseñada para demostrar las muchas características de DSPy a través de ejemplos del mundo real para ayudar a los...
hace 1 año
059.4K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: Creación de un marco de desarrollo de aplicaciones de datos nativas de IA que integra la gestión multimodelo y el procesamiento inteligente de datos

Introducción general DB-GPT es un marco de desarrollo de aplicaciones de datos nativas de IA de código abierto construido utilizando AWEL (Agentic Workflow Expression Language) y tecnologías de cuerpo inteligente. El proyecto pretende crear una infraestructura en el ámbito de los grandes modelos...
hace 1 año
059.3K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes en tiempo real de OpenAI: una aplicación multiinteligente de interacción cuerpo-voz (ejemplo de OpenAI)

Introducción General OpenAI Realtime Agents es un proyecto de código abierto que tiene como objetivo mostrar cómo la API en tiempo real de OpenAI se puede utilizar para construir aplicaciones de voz corporal multi-inteligente. Proporciona un modelo de cuerpo inteligente de alto nivel (tomado de OpenAI Swarm) que permite...
hace 1 año
059.3K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: una interfaz gráfica web para interactuar con todos los modelos y API de OpenAI.

Introducción general Ortlin es una interfaz gráfica de usuario basada en web diseñada para ayudar a cualquier persona, usuarios técnicos y no técnicos por igual, a interactuar fácilmente con las API de OpenAI y los modelos subyacentes. Es completamente gratuita y de código abierto, lo que permite a los usuarios aprovechar las ventajas de OpenAI sin complicaciones...
hace 2 años
059.3K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: plataforma de búsqueda de grandes modelos y AI localizada para datos personales (avance)

Introducción Quanta Quest es el primer producto del mundo con "end-side big model + C-side data localisation" como dirección de evolución central. Ayuda a los usuarios a almacenar todos los datos de Gmail, Notion, Dropbox, etc. localmente, y procesarlos a través de la base de datos vectorial para garantizar...
hace 2 años
059.3K