Proyecto AI de código abierto

Total 1020 artículos
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: simulación multiinteligente de las interacciones en redes sociales de millones de usuarios para estudiar fenómenos sociales complejos

Introducción general OASIS (Open Agent Social Interaction Simulations) es un simulador de redes sociales de código abierto capaz de simular el comportamiento de hasta un millón de usuarios. La plataforma combina un modelo lingüístico a gran escala con un...
hace 5 meses
03.1K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly: una plataforma de redacción basada en IA que orquesta procesos sobre un lienzo libre para la generación automatizada de artículos.

Introducción completa Refly es un motor de creación nativo de IA basado en canvas gratuito diseñado para ayudar a los usuarios a convertir ideas en contenido de alta calidad a través del diálogo multihilo, la integración de la base de conocimientos, la memoria contextual y la tecnología de búsqueda inteligente. La plataforma cubre más de 20 plantillas de escenarios profesionales, incluyendo...
hace 6 meses
03.2K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: Habilita cualquier LLM para automatizar operaciones en Android y PC.

Introducción general ClickClickClick es un framework desarrollado por BandarLabs que pretende automatizar operaciones en Android y PC utilizando cualquier Large Language Model (LLM) local o remoto. El proyecto se encuentra actualmente en una fase altamente experimental y soporta una variedad de modelos como...
hace 8 meses
02.6K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

tarjeta de luz: HTML5 herramienta generadora de tarjetas, crear hermosas tarjetas de contenido de herramientas simples

Descripción general lightcard es una herramienta de generación de tarjetas simple y elegante diseñada para ayudar a los usuarios a crear fácilmente hermosas tarjetas de contenido. La herramienta soporta contenido de texto personalizado, múltiples estilos de temas y códigos QR para hacer la creación más fácil y divertida. Los usuarios pueden editar el título, el cuerpo y el autor...
hace 8 meses
02.9K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: la clásica herramienta de código abierto para colorear fotos y vídeos en blanco y negro mediante técnicas de IA

Introducción exhaustiva DeOldify es un proyecto de código abierto basado en tecnología de aprendizaje profundo dedicado a la coloración y restauración inteligente de fotos y vídeos en blanco y negro. El proyecto utiliza un innovador método de entrenamiento NoGAN para resolver con éxito los defectos comunes de las redes GAN tradicionales en el proceso de coloreado de imágenes....
hace 8 meses
03.7K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: creación de herramientas inteligentes de automatización web para que las inteligencias artificiales manejen fácilmente los navegadores

Introducción exhaustiva Browser-Use es una innovadora herramienta de automatización web de código abierto diseñada específicamente para permitir que los modelos lingüísticos (LLM) interactúen de forma natural con los sitios web. Proporciona un marco potente y flexible que admite una amplia gama de modelos lingüísticos convencionales, como GPT-4, Claud...
hace 8 meses
03.9K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: un marco de código abierto para optimizar los proyectos de avisos con el fin de mejorar el rendimiento de las tareas.

Introducción completa PromptWizard es un marco de código abierto desarrollado por Microsoft que utiliza un mecanismo autoevolutivo que permite al modelo generar, evaluar y mejorar las palabras clave y generar ejemplos por sí mismo, mejorando la calidad del resultado mediante una retroalimentación continua. Puede optimizar de forma autónoma las palabras clave, generar y seleccionar ejemplos adecuados y...
hace 8 meses
03.2K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: Genera modelos de código abierto de imagen a vídeo que admiten el control de la lente y el control de la amplitud de movimiento.

Introducción general Ruyi-Models es un proyecto de código abierto diseñado para generar vídeos de alta calidad a partir de imágenes. Desarrollado por el equipo IamCreateAI, el proyecto soporta la generación de vídeo cinemático a 768 de resolución, 24 fotogramas por segundo, 120 fotogramas en 5 segundos...
hace 8 meses
02.6K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: generación de entradas de blog a partir de contenidos de voz basados en LangGraph, blogs de redacción automatizada

Introducción general Robo Blogger es una innovadora herramienta de creación de blogs diseñada para simplificar el proceso de generación de contenidos mediante la tecnología de voz a texto. Los usuarios pueden grabar ideas a través de cualquier aplicación de voz a texto, y Robo Blogger convierte esas ideas en contenido de blog estructurado....
hace 8 meses
03.1K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: motor de física generativa de código abierto para la simulación de mundos dinámicos en 4D basados en la física real.

Introducción general Genesis es un mundo de física generativa diseñado para la robótica de propósito general y el aprendizaje de IA personificada. Proporciona una plataforma de simulación unificada que admite la simulación de una amplia gama de materiales y fenómenos físicos.Genesis tiene como objetivo desbloquear la IA generativa y la simulación física mediante la combinación...
hace 8 meses
03.5K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: modelo texto-imagen para generar imágenes de alta calidad, con soporte para generar carteles chinos

Introducción exhaustiva Kolors es un modelo de generación de texto a imagen a gran escala desarrollado por el equipo Racer, basado en técnicas de difusión de potencial. El modelo se ha entrenado con miles de millones de pares de datos de texto-imagen y es capaz de generar imágenes complejas de alta calidad y precisión semántica con soporte para entradas en chino e inglés.Kolors en calidad visual...
hace 8 meses
03.1K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreado de dibujos animados, sombreado automático de imágenes en blanco y negro para mejorar la coherencia y la calidad del color de las imágenes.

Introducción ColorFlow es una herramienta de autocoloreado de secuencias de imágenes desarrollada por el equipo ARC de Tencent para resolver el problema del autocoloreado de secuencias de imágenes en blanco y negro. La herramienta utiliza un proceso de sombreado mejorado para generar con precisión los colores de varios elementos a través de un conjunto de imágenes de referencia, incluidos los colores del pelo de los personajes y los servicios....
hace 8 meses
02.6K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: herramienta todo en uno para la restauración y edición de imágenes lanzada por Tencent ARC

Introducción general BrushEdit es una herramienta integral de reparación y edición de imágenes desarrollada por Tencent ARC Labs. La herramienta se basa en la última tecnología de IA y es capaz de identificar y reparar automáticamente los defectos en las imágenes, mientras que el apoyo a la edición interactiva por users.BrushEdit combina una variedad de...
hace 8 meses
03K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

Esquemas: genera salidas de texto estructurado mediante expresiones regulares, JSON o modelos Pydantic.

Introducción general Outlines es una biblioteca de código abierto desarrollada por dottxt-ai para mejorar la aplicación de Large Language Models (LLMs) a través de la generación de texto estructurado. La biblioteca admite diversas integraciones de modelos, como OpenAI, transformadores...
hace 6 meses
03K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: modelo de generación directa de voces de rap a partir de letras y pistas de acompañamiento (conjunto de datos abierto actualmente).

Introducción general RapBank es un conjunto de datos y herramientas diseñado para la generación de letras de rap. El proyecto fue creado por NZqian para proporcionar a investigadores y desarrolladores datos de alta calidad sobre letras de rap mediante la recopilación y el procesamiento de...
hace 8 meses
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: un sistema avanzado de recuperación de IA (RAG) para el análisis sintáctico de contenidos multimodales y la combinación del grafo de conocimiento con la búsqueda híbrida

Introducción completa R2R (RAG to Riches) es un sistema avanzado de recuperación de IA que admite la funcionalidad de generación aumentada de recuperación (RAG) con características listas para la producción. Construido sobre una API RESTful en contenedores, el sistema proporciona análisis de contenido multimodal, funcionalidad de búsqueda híbrida...
hace 8 meses
03K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: un modelo de comprensión multimodal de extremo a extremo que soporta la comprensión y el análisis multimodal de texto, imagen y audio.

Introducción exhaustiva Infini-Megrez es una solución de inteligencia de borde desarrollada por la cúpula central incuestionable (Infinigence AI), cuyo objetivo es lograr una comprensión y un análisis multimodales eficientes mediante el codiseño de hardware y software. El núcleo del proyecto es el modelo Megrez-3B, que soporta grafos...
hace 7 meses
02.7K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: generación de mundos 3D explorables en 360° a partir de una sola imagen (código de código abierto progresivo)

Introducción general GenEx es un modelo avanzado de IA capaz de generar un mundo tridimensional de 360° totalmente explorable a partir de una sola imagen. Los usuarios pueden explorar interactivamente este mundo generado.GenEx empuja los límites de la IA figurativa en el espacio imaginativo y tiene el potencial de...
hace 8 meses
02.9K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: un motor RAG de código abierto basado en la comprensión profunda de los documentos, que proporciona flujos de trabajo de generación eficientes y mejorados por la recuperación.

Introducción exhaustiva RAGFlow es un motor de generación aumentada de recuperación (RAG) de código abierto basado en la tecnología de comprensión profunda de documentos. Proporciona un flujo de trabajo RAG eficiente para empresas de todos los tamaños, incorporando un modelo de lenguaje a gran escala (LLM) que puede proporcionar datos en formatos complejos basados en...
hace 7 meses
03.8K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: un cliente de visualización de flujos de trabajo para modelos de IA basado en la orquestación de nodos

Introducción general NodeTool es una innovadora plataforma de creación de IA diseñada para proporcionar una interfaz sencilla e intuitiva para entusiastas de la IA, desarrolladores, científicos de datos y creativos. Tanto si eres un artista, desarrollador o principiante, NodeTool te ayuda a crear rápidamente prototipos creativos....
hace 8 meses
02.7K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank: gestión del presupuesto diario basada en inteligencia artificial para facilitar el seguimiento de los presupuestos diarios

Descripción general Porkybank es una aplicación de gestión de finanzas personales de código abierto diseñada para ayudar a los usuarios a controlar fácilmente su presupuesto diario. Con una sencilla fórmula (Ingresos - Gastos) / Días = Efectivo, los usuarios pueden visualizar su situación financiera. El proyecto está alojado en GitHu...
hace 7 meses
02.8K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: un marco de inteligencia colaborativa multirol para simplificar tareas complejas

Introducción exhaustiva CrewAI es un marco avanzado diseñado para orquestar la colaboración entre agentes de rol y de IA autónoma. Al facilitar la inteligencia colaborativa, CrewAI permite a los agentes trabajar juntos sin problemas para resolver tareas complejas. Tanto si está creando una plataforma de asistente inteligente, automatizando equipos de atención al cliente o...
hace 8 meses
03.5K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: ajuste virtual de modelos de alta fidelidad y ajuste de la pose de los personajes, Meta modelo de generación de imágenes de personajes controlable de código abierto

Introducción exhaustiva Leffa es un marco unificado para generar imágenes de personajes controlables, que permite la manipulación precisa de la apariencia del personaje (por ejemplo, ajuste virtual) y la pose (por ejemplo, transferencia de pose). El marco reduce significativamente la distorsión de detalles finos dirigiendo la consulta de destino para centrarse en la clave de referencia correcta en la capa de atención, con...
hace 8 meses
03.8K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: generación de efectos sonoros sincronizados y bandas sonoras para secuencias de vídeo, herramienta de coformación multimodal vídeo-audio.

Introducción general MMAudio es un proyecto de código abierto cuyo objetivo es generar audio sincronizado de alta calidad mediante el entrenamiento multimodal conjunto. Desarrollado por Ho Kei Cheng et al. en la Universidad China de Hong Kong, la función principal del proyecto es generar audio sincronizado a partir de la entrada de vídeo y/o texto.MM...
hace 8 meses
04K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: configuración flexible de las herramientas nativas de diálogo y tratamiento de documentos de IA

Introducción general H2O GPT es un proyecto de código abierto cuyo objetivo es proporcionar capacidades privatizadas de chat y procesamiento de documentos. El proyecto se basa en la licencia Apache 2.0 y admite diversos modelos de GPT, como LLaMa2, Mistral, Falcon y otros. Uso ...
hace 8 meses
03.5K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: Chatbots personalizados para la integración rápida de múltiples fuentes de datos

Introducción general OpenChat es una consola de chatbot fácil de usar diseñada para simplificar el uso de modelos lingüísticos extensos (LLM). Mediante un proceso de configuración en dos pasos, OpenChat permite a los usuarios crear y gestionar fácilmente varios chatbots personalizados. La plataforma es compatible con G...
hace 7 meses
02.7K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT: Garantice la privacidad de los datos hablando con varios documentos en dispositivos locales.

Introducción general LocalGPT es un proyecto de código abierto diseñado para permitir a los usuarios hablar con documentos en dispositivos locales, garantizando la privacidad de los datos. Mediante el uso de varios modelos de código abierto, LocalGPT puede procesar y comprender el contenido de los documentos sin subir los datos a la nube. El proyecto es compatible con diversos p...
hace 8 meses
03.3K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: un sistema de preguntas y respuestas sobre documentos con un flujo de procesamiento RAG totalmente localizado

Introducción general PrivateGPT es un proyecto de IA disponible para entornos de producción que permite a los usuarios cuestionar documentos utilizando modelos lingüísticos a gran escala (LLM) sin conexión a Internet. El proyecto garantiza la privacidad de los datos para 100%, con todos los datos dispuestos en el entorno de ejecución del usuario....
hace 8 meses
02.4K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: plataforma inteligente de carrozado para la automatización de flujos de trabajo y la ejecución autónoma de tareas

Descripción general AutoGPT es una potente plataforma diseñada para ayudar a los usuarios a crear, desplegar y gestionar agentes de IA en ejecución continua y automatizar flujos de trabajo complejos. Desarrollada por Significant Gravitas, la plataforma ofrece una amplia gama de herramientas y funciones que permiten a los usuarios centrarse...
hace 8 meses
03.2K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: herramienta interactiva de edición de imágenes, control de la posición de las imágenes mediante apuntar y hacer clic y arrastrar y soltar.

Introducción general DragGAN es una herramienta interactiva de edición de imágenes basada en Redes Generativas Adversariales (GAN). Fue lanzada por Xingang Pan et al. en SIGGRAPH 2023 y tiene como objetivo permitir a los usuarios manipular intuitivamente a través de simples operaciones de apuntar y hacer clic y arrastrar y soltar....
hace 8 meses
03.4K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: un marco basado en Qwen para aplicaciones de agentes inteligentes, que incluye llamadas a herramientas, intérpretes de código, RAG y extensiones de Chrome.

Introducción completa Qwen-Agent es un marco de aplicación de agente inteligente desarrollado sobre la base de Qwen 2.0 y superiores, con capacidades tales como seguimiento de comandos, uso de herramientas, planificación y memoria. El marco proporciona una variedad de aplicaciones de ejemplo como asistentes de navegador, intérpretes de código y asistentes personalizados....
hace 8 meses
03.5K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: un creador de portadas en línea diseñado para generar portadas personalizadas para blogs, vídeos cortos, redes sociales y mucho más.

Introducción general Mini-Cover es una herramienta de generación de portadas en línea de código abierto diseñada para generar portadas personalizadas para plataformas como blogs, vídeos cortos y redes sociales. Desarrollada por JLinMr, la herramienta pretende ofrecer una solución sencilla y eficaz para ayudar a los usuarios a generar rápidamente portadas que se ajusten a sus necesidades....
hace 8 meses
02.7K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Herramienta de conversión inteligente de documentos de Microsoft para convertir varios archivos al formato Markdown

Introducción general MarkItDown es una herramienta Python desarrollada por Microsoft diseñada para convertir diversos archivos y documentos ofimáticos al formato Markdown. La herramienta admite una amplia gama de tipos de archivo, como PDF, PowerPoint, Word, Excel, diagramas...
hace 8 meses
03.5K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

Claude Engineer: un asistente de diálogo corporal inteligente que genera y gestiona de forma autónoma herramientas de IA utilizando el modelo Claude.

Introducción general Claude Engineer es una interfaz interactiva de línea de comandos (CLI) desarrollada por Doriandarko que utiliza el modelo Claude-3.5-Sonnet de Anthropic para ayudar en las tareas de desarrollo de software...
hace 5 meses
02.9K
Swarms:多智能体编排框架,企业级生产工具

Swarms: marco de orquestación multiinteligencia, herramienta de producción empresarial

Introducción general Swarms es un marco de orquestación multiagente listo para la producción de nivel empresarial diseñado para impulsar la productividad empresarial mediante la gestión eficiente de agentes y el procesamiento de tareas. Con soporte para múltiples modelos, múltiples sistemas de memoria y creación de agentes personalizados, el marco proporciona un diseño modular y capacidades de registro integrales para garantizar que el sistema...
hace 8 meses
02.6K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: Las imágenes de retratos con audio generan vídeos de demostración digitales con expresiones faciales vivas

Introducción general Sonic es una innovadora plataforma centrada en la percepción global del audio y diseñada para generar vívidas animaciones de retratos controladas por audio. Desarrollada por un equipo de investigadores de Tencent y la Universidad de Zhejiang, la plataforma utiliza información de audio para controlar las expresiones faciales y los movimientos de la cabeza con el fin de generar vídeos animados naturales y fluidos.S...
hace 4 meses
03K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: un macromodelo multimodal de audio para el diálogo de voz en tiempo real de extremo a extremo, una implementación de código abierto de la interacción de voz GPT-4o

Introducción general Ultravox es un innovador modelo multimodal de lenguaje amplio (LLM) diseñado para el procesamiento del habla en tiempo real. A diferencia de los sistemas tradicionales de reconocimiento del habla, Ultravox elimina la necesidad de una etapa separada de reconocimiento del habla de audio (ASR), y es capaz de convertir directamente el audio en un espacio de alta dimensión en...
hace 8 meses
02.9K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: herramienta para la sincronización labial de vídeo de alta calidad, optimizada para Wav2Lip

Introducción general Easy-Wav2Lip es una herramienta mejorada basada en Wav2Lip diseñada para simplificar el proceso de sincronización labial de vídeo. La herramienta ofrece una configuración e implementación más sencillas con soporte para Google Colab e instalación local. Mediante la optimización del algoritmo, Ea...
hace 8 meses
04.7K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: investigación web y redacción de informes utilizando LLM nativo, profundizando automáticamente en temas especificados por el usuario y generando resúmenes.

Introducción general Research Rabbit es un asistente nativo de investigación y resumen web basado en LLM (Large Language Model). Después de que el usuario proporcione un tema de investigación, Research Rabbit genera una consulta de búsqueda, obtiene resultados web relevantes y resume estos resultados....
hace 4 meses
02.6K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: un cliente Python que demuestra el proceso de ejecución de un organismo inteligente, proporcionando una interfaz gráfica de usuario intuitiva.

Introducción completa AgentClientDemo es un proyecto completo de Python que integra funcionalidad inteligente (Agente) y cliente (Cliente). El proyecto está basado en el framework PyQt y proporciona una interfaz gráfica de usuario (G...
hace 8 meses
02.7K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: un servicio todo en uno que utiliza modelos visuales para la ingestión de documentos y la agrupación inteligente basada en la jerarquía de párrafos de texto.

Introducción general Chunkr es una API autoalojada dedicada a convertir archivos PDF, PPTX, DOCX y Excel en datos aptos para su uso en RAG (Retrieval Augmented Generation) y LLM (Large Language Modelling). El proyecto fue desarrollado por Lumina...
hace 8 meses
03.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Convierta rápidamente los repositorios de código de Github en texto apto para la comprensión del LLM

Introducción general GitIngest es una herramienta de código abierto diseñada para transformar los repositorios de código de GitHub en texto adecuado para las sugerencias de Large Language Model (LLM). Con una sencilla operación, los usuarios pueden extraer y formatear el contenido de cualquier repositorio de GitHub para adaptarlo al LLM...
hace 8 meses
03.6K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: comparador de capacidades de programación LLM de código abierto, visión en tiempo real de los mejores modelos de generación de código

Introducción general CodeArena es una plataforma única diseñada para mostrar los mejores modelos de generación de código abierto (LLM) a través de enfrentamientos en tiempo real. Los usuarios pueden ver diferentes LLMs compitiendo en las mismas tareas de programación y ver los modelos con mejor rendimiento a través de tablas de clasificación en tiempo real. La plataforma utiliza Tog...
hace 8 meses
02.6K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Introducción general ChatFree es un proyecto de código abierto que pretende liberar las aplicaciones de IA de los usuarios de las limitaciones de los navegadores para que se ejecuten localmente. Creado utilizando la API GPT, Copilot está diseñado para soportar una amplia gama de software ofimático como Office, Word, WPS, etc. El proyecto fue desarrollado por ...
hace 8 meses
02.5K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: Genere dibujos lineales y bocetos de alta calidad, retropropagación de palabras clave de imágenes, instalación de paquetes con un solo clic.

Introducción general Sketch-Gen es una herramienta de dibujo lineal y generación de bocetos basada en tecnología de IA y diseñada para ayudar a artistas y diseñadores a generar rápidamente dibujos lineales y bocetos de alta calidad. Derivada del proyecto Paints-UNDO, la herramienta utiliza modelos avanzados de aprendizaje automático que pueden...
hace 8 meses
02.7K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser: API automatizada de navegación web para crear inteligencia y aplicaciones que controlen el funcionamiento del navegador.

Introducción general Steel Browser es una API de navegador de código abierto diseñada para agentes y aplicaciones de IA. Proporciona una instancia de navegador completa que permite a los usuarios automatizar operaciones web sin preocuparse por la infraestructura.Steel Browser soporta...
hace 8 meses
04K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vídeo híbrido de Vincennes: generación de secuencias realistas de vídeo de alta calidad, generación de vídeo de código abierto de Tencent de modelos de gran tamaño

Introducción Tencent Mixed Yuan Text Generation Video (disponible en Yuanbao APP) es una plataforma de generación de vídeo basada en tecnología de IA lanzada por Tencent. La plataforma utiliza el Tencent Mixed Yuan Big Model con un potente conocimiento entre dominios y comprensión del lenguaje natural para generar vídeos de alta calidad basados en las descripciones de texto de los usuarios....
hace 7 meses
03.5K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: Automatización de la inteligencia de manipulación del escritorio con la biblioteca PyAutoGUI

Introducción General Clevrr Computer es un proyecto de código abierto que tiene como objetivo automatizar las operaciones del sistema mediante el uso de la biblioteca PyAutoGUI. El proyecto se inspiró en Anthropic para diseñar un agente de automatización que pueda realizar operaciones de forma precisa y eficiente utilizando ...
hace 8 meses
02.5K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: marco de agentes de vídeo inteligentes para realizar flujos de trabajo de búsqueda, edición y generación de vídeo con descripciones en lenguaje natural.

Introducción general Director es un marco de trabajo de código abierto diseñado para simplificar y optimizar las interacciones y los flujos de trabajo de vídeo mediante la creación de agentes de vídeo inteligentes. El marco se basa en la infraestructura de "vídeo como datos" de VideoDB y es capaz de gestionar tareas de vídeo complejas como la búsqueda, edición, compilación y generación de...
hace 8 meses
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: Confiar en MCP para consultar y resumir los mensajes de WeChat en Claude

Introducción general MCP Server ChatSum es un proyecto de código abierto diseñado para ayudar a los usuarios a consultar y resumir los mensajes de chat. El proyecto está alojado en GitHub y proporciona un potente conjunto de herramientas que permite a los usuarios consultar los registros de chat basándose en parámetros específicos y generar los resúmenes correspondientes....
hace 5 meses
03.1K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: Wisdom Spectrum lanzó un potente modelo de generación de textos ultralargos, que permite generar más de 10.000 palabras en una sola conversación.

Introducción LongWriter es una potente herramienta de generación de textos largos desarrollada por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM). La herramienta se basa en el avanzado Long Context Language Model (LLM) y es capaz de generar textos largos de más de 10.000 palabras.LongWriter...
hace 8 meses
02.7K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展

Plate: editor de texto enriquecido basado en inteligencia artificial y compatible con extensiones de plug-in enriquecidas.

Descripción general Plate es un editor de texto enriquecido impulsado por IA construido sobre React y TypeScript, diseñado para proporcionar una experiencia de edición altamente personalizable y extensible. Utiliza Slate.js en su núcleo, combinado con una moderna interfaz de usuario ...
hace 8 meses
03.6K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN: un modelo de código abierto para generar música/bandas sonoras multipista y crear fácilmente clips musicales para varios instrumentos.

Introducción general MuseGAN es un proyecto de generación musical basado en redes generativas adversariales (GAN) diseñado para generar música multipista (multiinstrumento). El proyecto es capaz de generar música desde cero o acompañada de pistas suministradas por el usuario.MuseGAN utiliza Lakh Pianor...
hace 8 meses
02.6K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: Genera copias de vídeo y vídeos cortos en HD en un clic introduciendo un tema de vídeo

Introducción completa MoneyPrinterTurbo es un proyecto de código abierto que utiliza la tecnología avanzada AI big model para lograr la función de generar vídeos cortos de alta definición con un solo clic. Los usuarios sólo tienen que proporcionar un tema de vídeo o palabras clave, el sistema generará automáticamente la copia de vídeo, clips de vídeo, subtítulos de vídeo y...
hace 5 meses
02.8K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: Herramienta de línea de comandos para utilizar los servicios de MCP en cualquier modelo grande, no depende de Claude.

Introducción general La CLI del proveedor de contexto de modelo (mcp-cli) es una herramienta de línea de comandos a nivel de protocolo para interactuar con un servidor de proveedor de contexto de modelo. La herramienta permite a los usuarios enviar comandos, consultar datos e interactuar con diversos recursos proporcionados por el servidor...
hace 5 meses
03.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: un marco de trabajo en Python para crear flujos de trabajo controlados y transparentes del Cuerpo de Inteligencia Artificial

Introducción general ControlFlow es un framework Python desarrollado por PrefectHQ centrado en la construcción y gestión de flujos de trabajo de IA. Proporciona un marco estructurado y orientado al desarrollador para definir flujos de trabajo y delegar tareas a la generación de Large Language Model (LLM)....
hace 8 meses
03.3K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: un mapa de referencia de retratos para generar vídeos coherentes con los personajes, rápida integración multiterminal

Introducción ConsisID es un proyecto de código abierto desarrollado por el grupo de Yuan Rong en la Universidad de Pekín, cuyo objetivo es lograr la generación de texto a vídeo coherente con la identidad (IPT2V) mediante técnicas de descomposición de frecuencias. El núcleo del proyecto es un sistema DiT (Diffusion Transfor...
hace 8 meses
03.5K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers: una biblioteca ligera para la observabilidad de la IA que rastrea los datos de las solicitudes de API compatibles con OpenAI.

Introducción general Observers es un SDK de Python de código abierto diseñado para proporcionar una observabilidad completa para las API de IA generativa. La biblioteca permite a los usuarios rastrear y registrar fácilmente interacciones con modelos de IA y almacenar estas observaciones en múltiples backends. Ya sea...
hace 8 meses
02.6K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): plataforma de código abierto para crear y gestionar grafos de conocimiento, con soporte nativo para aplicaciones RAG.

Introducción Knowledge Graph Studio (KGS) es una plataforma de código abierto diseñada para simplificar el proceso de creación y gestión de grafos de conocimiento nativos de RAG. La plataforma ofrece resolución de entidades basada en reglas, construcción modular de grafos,...
hace 8 meses
03.1K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

mAIstro de informes: Genere informes detallados sobre cualquier tema personalizado, como análisis de negocio, informes de fin de año, etc.

Descripción general Report mAIstro es una potente herramienta diseñada para ayudar a los usuarios a crear fácilmente informes personalizados mediante la tecnología de procesamiento del lenguaje natural. La herramienta utiliza la tecnología LangChain para transformar los temas y estructuras proporcionados por el usuario en informes detallados dentro de...
hace 4 meses
02.8K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: modelo de generación de activos 3D desarrollado por Microsoft, compatible con múltiples formatos y de edición flexible.

Introducción general TRELLIS es un modelo de generación de activos 3D a gran escala desarrollado por Microsoft. Es capaz de recibir indicaciones de texto o imágenes y generar activos 3D de alta calidad en diversos formatos, como campos radiales, gaussianos 3D y mallas.
hace 8 meses
03.9K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: una herramienta eficaz de aprendizaje y previsión de predicciones meteorológicas mundiales a medio plazo basada en modelos de difusión

Introducción general GraphCast es una herramienta avanzada de previsión meteorológica desarrollada por Google DeepMind que pretende mejorar la precisión de las previsiones meteorológicas globales a medio plazo mediante técnicas de aprendizaje profundo. El proyecto proporciona una variedad de modelos preentrenados y código de muestra, que los usuarios pueden...
hace 8 meses
02.6K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: un marco ligero y flexible para organismos inteligentes, con una sencilla configuración de roles y herramientas para gestionar múltiples cargas de tareas.

Introducción general Bambo es un nuevo tipo de framework proxy, que es más ligero y flexible que los frameworks convencionales y puede manejar una gran variedad de tareas de carga.Bambo consigue una funcionalidad proxy eficiente definiendo todas las herramientas del catálogo de herramientas y utilizando funciones personalizadas asíncronas. Los usuarios pueden...
hace 8 meses
02.9K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automatización de correo electrónico con IA localizada para la generación rápida de respuestas a borradores de correo electrónico (Gmail)

Introducción general LAMBDA (Local Auto MailBox Draft Assistant) es un sistema de automatización de correo electrónico con IA localizada diseñado para aprender del estilo de correo electrónico de un usuario y generar un borrador para cada correo no leído en la bandeja de entrada de Gmail....
hace 8 meses
02.8K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: una versión de código abierto del modelo OpenAI o1 basado en Qwen2-7B-Instruye el ajuste fino para explorar modelos de inferencia abiertos para resolver problemas complejos.

Introducción Marco-o1 es un modelo de razonamiento abierto desarrollado por Alibaba International Digital Commerce Group (AIDC-AI) para resolver problemas complejos del mundo real. El modelo combina el ajuste fino de Chain of Thought (CoT), Monte Carlo Tree Search (MCTS) y estrategias de razonamiento innovadoras....
hace 8 meses
03.3K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务

Flow (Laminar): un motor de tareas ligero para construir inteligencias que simplifica y gestiona con flexibilidad las tareas.

Introducción general Flow es un motor de tareas ligero diseñado para construir agentes de IA con un énfasis en la simplicidad y la flexibilidad. A diferencia de los flujos de trabajo tradicionales basados en nodos y bordes, Flow utiliza un sistema dinámico de colas de tareas que admite la ejecución paralela, la programación dinámica y la gestión inteligente de dependencias. Su concepto central es ...
hace 8 meses
02.8K
Laminar:开源AI产品工程化平台,轻松实现数据可视化追踪与评估

Laminar: plataforma de código abierto de ingeniería de productos de IA para facilitar el seguimiento y la evaluación de la visualización de datos

Introducción exhaustiva Laminar es una plataforma de optimización de ingeniería de IA de código abierto centrada en la ingeniería de IA desde los primeros principios. Ayuda a los usuarios a recopilar, comprender y utilizar datos para mejorar la calidad de las aplicaciones LLM (Large Language Modelling).
hace 8 meses
03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: analiza cada tipo de documento en datos disponibles en LLM, conservando toda la información del documento, como tablas e imágenes, en su totalidad.

Introducción general MegaParse es una potente y versátil herramienta de análisis sintáctico de documentos diseñada para optimizar el procesamiento de datos para el Large Language Model (LLM). Tanto si trabaja con texto, PDF, presentaciones de PowerPoint o documentos de Word, MegaParse...
hace 8 meses
03.1K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código abierto para la eliminación por lotes de fondos de imágenes y vídeos, optimizado para RMBG 2.0

Introducción general RMBG-2-Studio es una aplicación mejorada de eliminación y sustitución de fondos desarrollada sobre la base del modelo BRIA-RMBG-2.0. La aplicación está diseñada para proporcionar a los usuarios capacidades de procesamiento de fondo de imagen eficientes y precisas para una variedad de tipos de imágenes, incluyendo comercio electrónico, juegos y...
hace 8 meses
03.6K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative: una selección de alternativas de software de código abierto a los productos SaaS más utilizados, para encontrar las mejores alternativas de código abierto.

Introducción general OpenAlternative es una plataforma centrada en proporcionar alternativas de software de código abierto, con el objetivo de ayudar a los usuarios a encontrar herramientas de código abierto adecuadas para sustituir a los productos SaaS comerciales que utilizan a diario. El sitio ayuda a los usuarios a ahorrar dinero y mejorar a través de una cuidada colección de herramientas de código abierto...
hace 8 meses
02.3K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: resuma un libro entero en un clic, destile eficazmente el contenido del libro y capte rápidamente las ideas centrales.

Introducción completa TextDistiller es una herramienta avanzada basada en IA diseñada para resumir libros capítulo a capítulo o en su totalidad, proporcionando una visión general concisa pero completa. Con TextDistiller, los usuarios pueden captar rápidamente las ideas centrales y los puntos clave de cualquier libro...
hace 8 meses
03K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: un entorno de programación visual de código abierto para probar y evaluar la eficacia de grandes sugerencias de modelos lingüísticos

Introducción general ChainForge es un entorno de programación visual de código abierto diseñado para probar y evaluar la eficacia de grandes modelos de lenguaje (LLM). Proporciona un entorno de ingeniería de señales de flujo de datos a través del cual los usuarios pueden explorar y analizar rápidamente la calidad de las diferentes señales en la respuesta LLM....
hace 8 meses
02.7K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送

InsightExpress: generar informes de investigación basados en IA y enviarlos por correo electrónico

Descripción general InsightExpress es una aplicación basada en Next.js que genera informes de investigación impulsados por IA basados en temas suministrados por el usuario y los envía por correo electrónico a los usuarios. La aplicación aprovecha la IA de Langflow ...
hace 4 meses
02.6K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: proxy/reversión del canal Midjourney Discord para llamadas a la API de mapeo de IA (prueba gratuita).

Introducción completa Midjourney Proxy es un proyecto de código abierto diseñado para proporcionar servicios de proxy para el canal Discord de Midjourney, convirtiendo las funciones de dibujo AI en forma de API. El proyecto es completamente gratuito y de código abierto , soporte para el intercambio de caras con un solo clic , mezcla de imágenes , nacimiento de gráficos ...
hace 8 meses
03.5K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: AI digital people con interacción fluida en tiempo real en tarjetas gráficas de la serie 30/40

Introducción general DH_live es un proyecto de humano digital en tiempo real basado en el aprendizaje sin muestras, cuyo objetivo es proporcionar a los usuarios una experiencia de transmisión en directo fluida e interactiva. El proyecto es compatible con las tarjetas gráficas NVIDIA de las series 30 y 40 y es capaz de funcionar en tiempo real a más de 25 fps. Los usuarios pueden...
hace 9 meses
03.3K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new: modificación de código abierto basada en Bolt.new, herramientas de desarrollo de pila completa basadas en IA.

Descripción general multi-model-bolt.new es una versión modificada de Bolt.new que permite el uso de modelos TogetherAI, soportando características como el despliegue, la respuesta móvil y la entrada de voz. Los usuarios pueden ser solicitados directamente en el navegador, ejecutar...
hace 8 meses
03.8K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow: una herramienta de bajo código para crear potentes flujos de trabajo e inteligencia artificial

Introducción general Langflow es una herramienta de bajo código diseñada para que los desarrolladores construyan potentes agentes y flujos de trabajo de IA. Es compatible con el uso de cualquier API, modelo o base de datos, lo que simplifica el desarrollo de aplicaciones complejas AI.Langflow proporciona una interfaz visual intuitiva....
hace 8 meses
04K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund: sistema de negociación automatizado de código abierto que utiliza inteligencias múltiples para tomar decisiones complejas de negociación en fondos de cobertura.

Introducción general AI Hedge Fund es un fondo de cobertura de inteligencia artificial que utiliza un sistema multiagente para tomar decisiones comerciales. El sistema trabaja en colaboración con varios agentes especializados, como agentes de datos de mercado, agentes cuantitativos, agentes de gestión de riesgos y agentes de gestión de carteras, para...
hace 7 meses
04.1K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI Chatbot Supabase: código abierto Next.js y Supabase construyeron AI chatbot para un rápido despliegue en Vercel.

Introducción general AI Chatbot Supabase es una plantilla de chatbot AI de código abierto construida sobre Next.js y Supabase. Desarrollado por Vercel, el proyecto tiene como objetivo proporcionar una solución de chatbot totalmente funcional y personalizable. Por ...
hace 8 meses
04K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: una eficaz herramienta de generación de aumento de la recuperación (RAG) que admite múltiples bases de datos y modelos lingüísticos.

Introducción general RAGLite es un conjunto de herramientas Python para la Generación Aumentada de Recuperación (RAG) con soporte para bases de datos PostgreSQL o SQLite. Proporciona opciones de configuración flexibles que permiten a los usuarios elegir diferentes modelos de lenguaje y reordenadores....
hace 9 meses
03.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: Monitoriza las actividades de los usuarios de OpenWebUI, gestiona los límites de uso, soporta el despliegue con un solo clic.

Introducción General OpenWebUI-Monitor es un panel de control para monitorizar las actividades de los usuarios de OpenWebUI y gestionar las cuotas de uso. Te permite establecer eficientemente cuotas de usuario, ver datos de usuario e información visual en tiempo real, soporta despliegue con un clic, y facilita la gestión y monitorización de usuarios....
hace 9 meses
03.2K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: ingenieros de IA full-stack de código abierto que construyen e iteran rápidamente proyectos TypeScript completos.

Introducción general Srcbook es una plataforma de desarrollo de aplicaciones centrada en TypeScript diseñada para crear e iterar rápidamente aplicaciones web con asistentes de IA. Es compatible con el tiempo de ejecución nativo, proporciona una interfaz de bloc de notas interactivo y permite a los usuarios escribir y ejecutar código back-end.Srcbook está abierto...
hace 9 meses
03.1K