Proyecto AI de código abierto

Total 1020 artículos
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: Creación de un editor de texto enriquecido basado en inteligencia artificial compatible con varios marcos de trabajo frontales.

Introducción completa AIEditor es un editor de texto enriquecido de próxima generación impulsado por IA, basado en el desarrollo de componentes web, soporte para Vue, React, Angular y otros casi todos los principales marcos front-end. Es compatible con PC Web y ...
hace 10 meses
023.8K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Asistente de programación Vim nativo basado en LLM, programación inteligente segura sin conexión

Introducción General VimLM es un plugin de Vim que proporciona un asistente de código impulsado por el LLM nativo (Large Language Model). Interactuando con el modelo LLM nativo a través de los comandos de Vim, obtiene automáticamente el contexto del código y ayuda a los usuarios a editar código en Vim.VimLM está inspirado en...
hace 8 meses
023.8K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: descargador de vídeo por línea de comandos compatible con casi todas las plataformas de vídeo

Introducción general Lux es una biblioteca de descarga de vídeo rápida y sencilla y una herramienta de línea de comandos escrita en Go. Soporta la descarga de vídeos de múltiples sitios web, incluyendo YouTube, Bilibili, Youku, etc. Lux ofrece una variedad de opciones de descarga y características, tales como la descarga multi-hilo....
hace 9 meses
023.8K
Rankify:支持信息检索与重排序的Python工具包

Rankify: un conjunto de herramientas de Python para la recuperación y reordenación de la información

Introducción general Rankify es un conjunto de herramientas Python de código abierto desarrollado por el Data Science Group de la Universidad de Innsbruck, Austria. Se centra en la recuperación de información, la reordenación y la generación de aumento de la recuperación (RAG), proporcionando un marco unificado. El conjunto de herramientas incluye 40 puntos de referencia...
hace 7 meses
023.8K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Herramienta de supervisión de la degradación del servicio ChatGPT: Detección de degradaciones del servicio ChatGPT

Introducción completa La herramienta de monitorización de la degradación del servicio ChatGPT es un proyecto de código abierto diseñado para ayudar a los usuarios a detectar si su servicio ChatGPT se ha degradado debido a IPs de alto riesgo. La herramienta analiza los valores de dificultad de Proof of Work (PoW) para determinar si los usuarios...
hace 10 meses
023.8K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: herramienta de lectura de código fuente, que utiliza LLM para analizar el código, proporcionar explicaciones detalladas del código, soporte para una variedad de lenguajes de programación.

Introducción general askrepo es una herramienta de lectura de código fuente basada en LLM (Large Language Model). Puede leer el contenido de un archivo de texto gestionado por Git en un directorio especificado y enviarlo a la API Gemini de Google para proporcionar respuestas a preguntas basadas en preguntas especificadas....
hace 11 meses
023.8K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

Plugin NoneBot DeepSeek: Diálogo inteligente para el servicio de atención al cliente basado en NoneBot y DeepSeek.

Introducción General El plugin DeepSeek de NoneBot es un plugin de NoneBot que integra el modelo DeepSeek y está diseñado para proporcionar diálogo inteligente y funcionalidad de preguntas y respuestas. Al acceder al modelo DeepSeek, los usuarios pueden utilizar el plugin NoneBot...
hace 8 meses
023.7K
集成多种先进语音合成服务的开源运营项目

Proyecto operativo de código abierto que integra múltiples servicios avanzados de síntesis de voz

Introducción general Open-VoiceCanvas es una plataforma de síntesis de voz de código abierto desarrollada por el equipo ItusiAI. Soporta más de 50 idiomas, y puede convertir texto en habla natural, así como clonar voces personalizadas subiendo audio. El proyecto integra Ope...
hace 6 meses
023.7K
自动解析PDF内容并提取文字与表格的开源服务

Analice automáticamente el contenido del PDF y extraiga el texto y las tablas de los servicios de código abierto

Introducción Completa Analiza automáticamente el diseño de documentos PDF, identifica texto, títulos, imágenes, tablas, fórmulas y otros elementos de la página, y determina su orden correcto. La herramienta es compatible con la funcionalidad OCR y puede convertir PDF escaneados en texto con capacidad de búsqueda. Se ejecuta en Docker y proporciona dos modelos...
hace 6 meses
023.7K
Orchestra: Creación de equipos inteligentes de IA para un desarrollo colaborativo multiinteligencia más fácil y eficiente

Orchestra: Creación de equipos inteligentes de IA para un desarrollo colaborativo multiinteligencia más fácil y eficiente

Orchestra es un innovador framework ligero de Python que se centra en la construcción de sistemas colaborativos multi-inteligencia basados en el Large Language Model (LLM). Emplea un método único de organización de inteligencias para que múltiples inteligencias IA puedan trabajar en armonía como una orquesta sinfónica. Al modelar ...
hace 9 meses
023.7K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: una inteligencia que integra más de 500 herramientas de investigación para automatizar las tareas científicas y de investigación.

Introducción completa SciToolAgent es una plataforma de herramientas de código abierto desarrollada por el Centro de Innovación de la Universidad de Zhejiang en Hangzhou (HICAI-ZJU). Integra más de 500 herramientas científicas a través de tecnologías de grafos de conocimiento (SciToolKG) y modelado de grandes lenguajes para ayudar a los investigadores a enfrentarse a...
hace 7 meses
023.7K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: sistema de sincronización labial y edición de vídeo basado en audio

Introducción general VideoReTalking es un sistema innovador que permite al usuario generar vídeos faciales sincronizados con los labios a partir del audio de entrada, produciendo vídeos de salida de alta calidad y sincronizados con los labios incluso con diferentes emociones. El sistema divide este objetivo en tres tareas consecutivas: con expresiones típicas...
hace 10 meses
023.7K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: un sistema de preguntas y respuestas sobre documentos con un flujo de procesamiento RAG totalmente localizado

Introducción general PrivateGPT es un proyecto de IA disponible para entornos de producción que permite a los usuarios cuestionar documentos utilizando modelos lingüísticos a gran escala (LLM) sin conexión a Internet. El proyecto garantiza la privacidad de los datos para 100%, con todos los datos dispuestos en el entorno de ejecución del usuario....
hace 10 meses
023.6K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI Chatbot Supabase: código abierto Next.js y Supabase construyeron AI chatbot para un rápido despliegue en Vercel.

Introducción general AI Chatbot Supabase es una plantilla de chatbot AI de código abierto construida sobre Next.js y Supabase. Desarrollado por Vercel, el proyecto tiene como objetivo proporcionar una solución de chatbot totalmente funcional y personalizable. Por ...
hace 11 meses
023.6K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Proyecto de superresolución de imágenes de código abierto para mejorar la calidad de la resolución de imágenes.

Introducción general InvSR es un innovador proyecto de código abierto de superresolución de imágenes basado en técnicas de inversión de la difusión capaces de convertir imágenes de baja resolución en imágenes de alta calidad y alta resolución. El proyecto explota el rico conocimiento previo de la imagen incrustado en modelos de difusión a gran escala preentrenados y, mediante un mecanismo de muestreo flexible, admite...
hace 10 meses
023.6K
Docs:开源的协作笔记和文档管理工具

Docs: herramientas de código abierto para la gestión colaborativa de notas y documentos

Introducción general Docs es una plataforma colaborativa de código abierto para la toma de notas y la gestión de documentos desarrollada por el equipo de suitenumerique. Está construida usando tecnologías Django y React con el objetivo de proporcionar una herramienta fácil de usar para ayudar a los usuarios a tomar notas, gestionar...
hace 7 meses
023.6K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: inteligencias polivalentes que revisan, validan y formatean los resultados para obtener resultados de alta calidad.

Introducción exhaustiva Kheish es un agente multirol de código abierto diseñado para tareas de modelado de grandes lenguajes (LLM) que requieren una colaboración estructurada paso a paso.Kheish es más que un simple coordinador, es un agente inteligente por derecho propio, que solicita módulos bajo demanda, integra...
hace 9 meses
023.6K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: Captura automática de noticias para generar podcasts de audio

Introducción general AI Podcast Generator es una herramienta inteligente de generación de podcasts que utiliza tecnología avanzada de IA para crear automáticamente contenidos de audio atractivos a partir de fuentes web. El sistema genera narraciones de flujo natural capturando contenidos de noticias y convirtiéndolos en podcasts de audio. El proyecto se basa en la...
hace 11 meses
023.6K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automatización de correo electrónico con IA localizada para la generación rápida de respuestas a borradores de correo electrónico (Gmail)

Introducción general LAMBDA (Local Auto MailBox Draft Assistant) es un sistema de automatización de correo electrónico con IA localizada diseñado para aprender del estilo de correo electrónico de un usuario y generar un borrador para cada correo no leído en la bandeja de entrada de Gmail....
hace 10 meses
023.6K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: una solución de memoria a largo plazo basada en el perfil del usuario para aplicaciones de IA

Introducción general Memobase es un sistema de memoria basado en el perfil del usuario diseñado para soportar una memoria de usuario duradera para aplicaciones de IA generativa. Tanto si estás construyendo un compañero virtual, una herramienta educativa o un asistente personalizado, Memobase ayuda a tu IA a recordar, comprender y crecer con el uso de...
hace 8 meses
023.6K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: persona digital interactiva de voz en tiempo real con clonación personalizada de imágenes y tonos, compatible con soluciones de voz de extremo a extremo y soluciones en cascada.

Introducción general VideoChat es un proyecto de persona digital de interacción de voz en tiempo real basado en tecnología de código abierto, que admite tanto esquemas de voz de extremo a extremo (GLM-4-Voice - THG) como esquemas en cascada (ASR-LLM-TTS-THG). El proyecto permite a los usuarios personalizar la ...
hace 11 meses
023.6K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: un modelo que admite juegos de rol y diálogos complejos, con un rendimiento superior a 32b (con instalador de un solo clic).

Introducción exhaustiva Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 es un eficiente modelo de lenguaje diseñado para soportar juegos de rol complejos y diálogos de varias rondas. Profundamente optimizado sobre la base de Qwen 2.5-7B, cuenta con una excelente generación de texto y diálogo....
hace 8 meses
023.6K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: marco de agentes de vídeo inteligentes para realizar flujos de trabajo de búsqueda, edición y generación de vídeo con descripciones en lenguaje natural.

Introducción general Director es un marco de trabajo de código abierto diseñado para simplificar y optimizar las interacciones y los flujos de trabajo de vídeo mediante la creación de agentes de vídeo inteligentes. El marco se basa en la infraestructura de "vídeo como datos" de VideoDB y es capaz de gestionar tareas de vídeo complejas como la búsqueda, edición, compilación y generación de...
hace 10 meses
023.6K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: el estilo de interfaz unificado de OpenAI llama a varios modelos grandes, cambio rápido de modelo y pruebas comparativas.

Introducción completa aisuite es una interfaz sencilla y unificada diseñada para permitir a los desarrolladores invocar fácilmente los servicios de múltiples proveedores de IA generativa. Con una interfaz similar a OpenAI, aisuite facilita la interacción con los LLM (Large Language Models) más populares....
hace 11 meses
023.6K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: un servicio MCP para rastrear y organizar rápidamente la documentación técnica

Introducción general DevDocs es una herramienta de código abierto completamente gratuita desarrollada por el equipo CyberAGI y alojada en GitHub. Diseñada para programadores y desarrolladores de software, parte de la URL de un documento técnico, rastrea automáticamente las páginas relevantes y las organiza en un conciso ma...
hace 6 meses
023.5K
LLM API Engine:通过自然语言快速生成和部署API

LLM API Engine: generación y despliegue rápidos de API mediante lenguaje natural

Introducción general LLM API Engine es un proyecto de código abierto diseñado para ayudar a los desarrolladores a crear y desplegar rápidamente API impulsadas por IA.El proyecto aprovecha el Large Language Model (LLM) y las tecnologías de rastreo web inteligente para permitir a los usuarios crear API personalizadas a través de descripciones en lenguaje natural.Su principal...
hace 9 meses
023.5K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: herramienta de edición de vídeo sonoro 3D con profundidad de campo para retratos hablados

Introducción general JoyGen es un innovador marco de generación de vídeo en dos fases para rostros parlantes, centrado en resolver el problema de la generación de expresiones faciales basada en audio. Desarrollado por un equipo de Jingdong Technology, utiliza técnicas avanzadas de reconstrucción 3D y métodos de extracción de características de audio para capturar con precisión las características de identidad del hablante y la expresión...
hace 9 meses
023.5K
GAG:利用大模型模拟人类行为生成社交关系图谱

GAG: generación de un gráfico de relaciones sociales mediante un gran modelo para simular el comportamiento humano

Introducción general GraphAgent es un framework de código abierto alojado en GitHub y desarrollado por Ji-Cather. Utiliza el Large Language Model (LLM) para simular el comportamiento humano y generar gráficos sociales dinámicos con atributos textuales. Esta herramienta es adecuada para los...
hace 7 meses
023.5K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: proyecto de código abierto para la búsqueda por inferencia profunda mediante conocimiento local

Introducción exhaustiva Deep Searcher es una potente herramienta que combina grandes modelos lingüísticos (LLM) y bases de datos vectoriales diseñada para buscar, evaluar y razonar a partir de datos privados, proporcionando respuestas muy precisas e informes exhaustivos. Es adecuado para la gestión del conocimiento empresarial...
hace 8 meses
023.5K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api: integración con un solo clic de múltiples API gratuitas de grandes modelos, interfaces OpenAI externas unificadas.

Introducción simple-one-api es un proyecto de código abierto diseñado para simplificar la integración de múltiples APIs de big models. Soporta APIs compatibles con OpenAI como ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax y Deep-Seek....
hace 11 meses
023.5K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: una herramienta de código abierto para transformar fotos y vídeos en anime estilizado

Introducción general DCT-Net es un proyecto de código abierto desarrollado por la Academia DAMO y el Instituto Wang Xuan de Tecnología Informática de la Universidad de Pekín, cuyo objetivo es la transformación anime estilizada de imágenes. El proyecto utiliza técnicas de aprendizaje profundo a través de la Traducción Calibrada por Dominio (Domain-Calibrat...
hace 9 meses
023.5K
LM Speed:快速测试大模型API性能

LM Speed: Pruebas rápidas de rendimiento de API de modelos grandes

Introducción general LM Speed es una herramienta diseñada específicamente para desarrolladores de IA, y también está disponible como servicio en línea en lmspeed.net Su función principal es probar y analizar el rendimiento de las API de modelos lingüísticos, ayudando a los usuarios a identificar rápidamente los cuellos de botella de velocidad y optimizar las estrategias de llamada. Esta...
hace 6 meses
023.5K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: rastrea y resume las noticias sobre inteligencia artificial en tiempo real y las publica automáticamente en WeChat.

Introducción general ai-trend-publish es un proyecto de código abierto alojado en GitHub, desarrollado por el equipo OpenAISpace, centrado en el seguimiento y la publicación de las últimas tendencias en inteligencia artificial en tiempo real. Esta herramienta está diseñada para ayudar a desarrolladores, aficionados a la tecnología...
hace 8 meses
023.5K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: una herramienta para simplificar el proceso de ajuste de modelos de los principales lenguajes visuales de código abierto

Introducción Maestro es una herramienta desarrollada por Roboflow para simplificar y acelerar el proceso de ajuste fino de modelos multimodales, de modo que todo el mundo pueda entrenar sus propios macromodelos visuales. Proporciona recetas ya preparadas para el ajuste fino de modelos de lenguaje visual (VLM) populares como F...
hace 8 meses
023.5K
Agentarium: gestión y coordinación de interacciones entre múltiples inteligencias artificiales

Agentarium: gestión y coordinación de interacciones entre múltiples inteligencias artificiales

Introducción General Agentarium es un potente framework Python dedicado a la gestión y orquestación de agentes inteligentes de IA (Agentes). El framework proporciona una forma flexible e intuitiva de crear, gestionar y orquestar interacciones entre múltiples agentes de IA. Utiliza A...
hace 9 meses
023.5K
GaiaNet node:安装和运行自己的本地模型在线代理服务

Nodo GaiaNet: instale y ejecute su propio modelo local de servicio proxy en línea

Introducción general GaiaNet-AI/gaianet-node es un proyecto de código abierto que permite a los usuarios instalar rápidamente la pila de software de nodos por defecto en Mac, Linux o Windows WSL con un solo comando. Los usuarios pueden inicializar nodos, personalizar configuraciones, descargar...
hace 1 año
023.4K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: Una biblioteca de código abierto con soporte eficiente para operaciones matriciales FP8 (DeepSeek Open Source Week Day 3)

Introducción general DeepGEMM es una biblioteca FP8 GEMM (Generalised Matrix Multiplication) de código abierto desarrollada por el equipo DeepSeek, centrada en proporcionar un soporte eficiente de aritmética matricial. Está dirigida específicamente a la arquitectura NVIDIA Hopper para Tensor ...
hace 8 meses
023.4K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...
hace 5 meses
023.4K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: una eficaz herramienta de generación de aumento de la recuperación (RAG) que admite múltiples bases de datos y modelos lingüísticos.

Introducción general RAGLite es un conjunto de herramientas Python para la Generación Aumentada de Recuperación (RAG) con soporte para bases de datos PostgreSQL o SQLite. Proporciona opciones de configuración flexibles que permiten a los usuarios elegir diferentes modelos de lenguaje y reordenadores....
hace 11 meses
023.4K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos: herramienta de código abierto para la creación de documentos de identidad inteligentes con IA

Introducción completa HivisionIDPhotos es una herramienta de producción de fotos de documentos AI ligera de código abierto, puede identificar de forma inteligente la escena de la foto del usuario y la clave, para generar una foto de documento estándar en línea con una variedad de especificaciones. La herramienta soporta colores de fondo y tamaños personalizados, y en el futuro también lanzará...
hace 1 año
023.4K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: Automatización de la inteligencia de manipulación del escritorio con la biblioteca PyAutoGUI

Introducción General Clevrr Computer es un proyecto de código abierto que tiene como objetivo automatizar las operaciones del sistema mediante el uso de la biblioteca PyAutoGUI. El proyecto se inspiró en Anthropic para diseñar un agente de automatización que pueda realizar operaciones de forma precisa y eficiente utilizando ...
hace 10 meses
023.4K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: un entorno de programación visual de código abierto para probar y evaluar la eficacia de grandes sugerencias de modelos lingüísticos

Introducción general ChainForge es un entorno de programación visual de código abierto diseñado para probar y evaluar la eficacia de grandes modelos de lenguaje (LLM). Proporciona un entorno de ingeniería de señales de flujo de datos a través del cual los usuarios pueden explorar y analizar rápidamente la calidad de las diferentes señales en la respuesta LLM....
hace 11 meses
023.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: herramienta inteligente diseñada para analizar datos tabulares complejos

Introducción completa TableGPT Agent es una herramienta inteligente basada en el proyecto de código abierto GitHub, diseñada para procesar y analizar datos tabulares. Se basa en el modelo Big Language TableGPT2, que utiliza la interacción con el lenguaje natural para permitir a los usuarios consultar, manipular...
hace 8 meses
023.4K
TableGPT2:表格数据集成的多模态模型

TableGPT2: un modelo multimodal para la integración de datos tabulares

Introducción general TableGPT2 es un modelo multimodal desarrollado por un equipo de la Universidad de Zhejiang, centrado en la integración y el procesamiento de datos tabulares. El modelo está preentrenado y perfeccionado para poder realizar tareas relacionadas con datos de tablas, al tiempo que mantiene unas sólidas capacidades de lenguaje y codificación de propósito general.TableGP...
hace 11 meses
023.3K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: una herramienta de inteligencia artificial que ayuda a leer y analizar trabajos académicos

Introducción general Mad Professor (Grumpy Professor Reads Papers) es una herramienta académica de IA de código abierto diseñada para que investigadores y estudiantes simplifiquen la lectura y el análisis de documentos académicos. Integra procesamiento PDF, traducción IA, recuperación RAG, preguntas IA...
hace 5 meses
023.3K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

tarjeta de luz: HTML5 herramienta generadora de tarjetas, crear hermosas tarjetas de contenido de herramientas simples

Descripción general lightcard es una herramienta de generación de tarjetas simple y elegante diseñada para ayudar a los usuarios a crear fácilmente hermosas tarjetas de contenido. La herramienta soporta contenido de texto personalizado, múltiples estilos de temas y códigos QR para hacer la creación más fácil y divertida. Los usuarios pueden editar el título, el cuerpo y el autor...
hace 10 meses
023.3K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: un modelo de lenguaje visual de código abierto para el razonamiento multimodal

Introducción exhaustiva R1-Onevision es un modelo de macrolenguaje multimodal de código abierto desarrollado por el equipo Fancy-MLLM, centrado en la combinación profunda de visión y lenguaje, capaz de procesar entradas multimodales como imágenes y texto, y de actuar en los campos del razonamiento visual, la comprensión de imágenes, la resolución matemática, etc. ....
hace 8 meses
023.3K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: una herramienta para generar vídeos de retratos humanos digitales de medio cuerpo a partir de fotos

Introducción general ChatAnyone es un proyecto innovador desarrollado por el equipo HumanAIGC. Utiliza técnicas de inteligencia artificial para generar vídeos digitales de retratos humanos con movimientos de la parte superior del cuerpo a partir de una única foto y una entrada de audio. El proyecto se basa en un modelo jerárquico de difusión del movimiento que genera movimientos de la cabeza...
hace 7 meses
023.3K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

Markdown To Poster: convierta Markdown en pósters para redes sociales/pequeños rojos con edición en línea y soporte de despliegue con un solo clic.

Descripción general Markdown to Image es un componente React para renderizar texto Markdown en imágenes de medios sociales visualmente atractivas. El proyecto también incluye un editor web incorporado que se puede utilizar como un editor en línea de Markdown a póster....
hace 11 meses
023.3K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: un marco ligero y flexible para organismos inteligentes, con una sencilla configuración de roles y herramientas para gestionar múltiples cargas de tareas.

Introducción general Bambo es un nuevo tipo de framework proxy, que es más ligero y flexible que los frameworks convencionales y puede manejar una gran variedad de tareas de carga.Bambo consigue una funcionalidad proxy eficiente definiendo todas las herramientas del catálogo de herramientas y utilizando funciones personalizadas asíncronas. Los usuarios pueden...
hace 10 meses
023.3K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: una herramienta de IA para analizar las relaciones entre los personajes de un libro y generar gráficos

Introducción general Austen es una herramienta de IA de código abierto que utiliza el framework Angular y la inicialización Analogjs, combinados con la tecnología Mermaidjs para generar gráficos que ayudan a los usuarios a analizar las relaciones entre personajes en los libros. Los usuarios pueden...
hace 6 meses
023.3K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: un marco de código abierto TypeScript para construir rápidamente inteligencias de IA

Introducción general VoltAgent es un marco TypeScript de código abierto diseñado para que los desarrolladores construyan y orquesten rápidamente inteligencias de IA. Proporciona herramientas modulares y un modelo de desarrollo estandarizado que simplifica la interacción con grandes modelos de...
hace 5 meses
023.3K
MOFA Video:运动场适配技术将静态图像转换为视频

Vídeo MOFA: la tecnología de adaptación del campo de movimiento convierte imágenes fijas en vídeo

Introducción general MOFA-Video es una herramienta de generación de animación de imágenes de última generación que utiliza técnicas generativas de adaptación de campos de movimiento para convertir imágenes estáticas en vídeos dinámicos. Se ha desarrollado en colaboración con la Universidad de Tokio y Tencent AI Lab, y se presentará en la Conferencia Europea de Visión por Computador de 2024 (E...
hace 9 meses
023.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: una herramienta inteligente para automatizar las pruebas de software mediante IA

Introducción general TestDriver es un sitio web que utiliza tecnología de inteligencia artificial para ayudar a los desarrolladores a probar software. Automatiza la tarea de probar software simulando acciones humanas, como hacer clic con el ratón o teclear texto. En el corazón del sitio hay un "ordenador que utiliza un agente de IA" que funciona como una persona real...
hace 6 meses
023.3K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: una herramienta inteligente para automatizar la documentación de código Python

Introducción general DocAgent es una herramienta de código abierto de generación de documentación de código Python desarrollada por Meta AI. Utiliza la colaboración multi-inteligencia y el análisis jerárquico de código para generar automáticamente anotaciones de documentos de alta calidad y conscientes del contexto para bases de código Python (d...
hace 6 meses
023.3K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具

Feeds.Fun: feeds RSS que etiquetan y filtran automáticamente las noticias

Introducción general Feeds.Fun es una herramienta que ayuda a los usuarios a leer noticias de forma eficiente, con funciones básicas como el etiquetado automático de noticias y el filtrado de contenidos en función de las preferencias del usuario. Fue creada por el desarrollador Aliaksei Yaletski (nombre de usuario Tiendil) y está alojada en ...
hace 7 meses
023.3K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: un asistente de inteligencia artificial para la investigación profunda multilingüe

Introducción exhaustiva Deep Research Web UI es una herramienta asistente de investigación de código abierto basada en tecnología de IA, diseñada para ayudar a los usuarios a realizar investigaciones iterativas profundas sobre cualquier tema. Combina la potencia de los motores de búsqueda, el rastreo web y el modelado lingüístico a gran escala a través de una interfaz web intuitiva....
hace 7 meses
023.3K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: Genere dibujos lineales y bocetos de alta calidad, retropropagación de palabras clave de imágenes, instalación de paquetes con un solo clic.

Introducción general Sketch-Gen es una herramienta de dibujo lineal y generación de bocetos basada en tecnología de IA y diseñada para ayudar a artistas y diseñadores a generar rápidamente dibujos lineales y bocetos de alta calidad. Derivada del proyecto Paints-UNDO, la herramienta utiliza modelos avanzados de aprendizaje automático que pueden...
hace 10 meses
023.3K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragmentos: versiones de código abierto de aplicaciones como Claude Artifacts de Anthropic, Vercel v0 o GPT Engineer.

Introducción general Fragments by E2B es un proyecto de código abierto que proporciona una plantilla basada en Next.js para construir aplicaciones generadas íntegramente por IA. Desarrollado por E2B, el proyecto pretende simplificar y acelerar el proceso de desarrollo de aplicaciones de IA. Integra una variedad de ...
hace 11 meses
023.3K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: una herramienta de gestión que combina la aprobación automatizada inteligente de procesos con auditorías humanas.

Introducción general LLManager es una herramienta de gestión de aprobación inteligente de código abierto, desarrollada en base al marco LangGraph de LangChain, centrada en la automatización del procesamiento de las solicitudes de aprobación al tiempo que optimiza la toma de decisiones con revisión humana. Lo hace a través de la búsqueda semántica, el aprendizaje...
hace 6 meses
023.2K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

Simba: un sistema de gestión del conocimiento para organizar documentos, perfectamente integrado en cualquier sistema GAR.

Introducción general Simba es un sistema portátil de gestión del conocimiento (KMS) diseñado para integrarse perfectamente con cualquier sistema de generación de aumento de la recuperación (RAG). Creado por el usuario de GitHub GitHamza0206, el proyecto proporciona una solución eficiente de gestión del conocimiento para una variedad de...
hace 8 meses
023.2K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: herramienta de código abierto para generar rápidamente escenas 3D multiobjeto a partir de una sola imagen

Introducción general MIDI-3D es un proyecto de código abierto desarrollado por el equipo VAST-AI-Research para generar rápidamente escenas 3D con múltiples objetos a partir de una sola imagen para desarrolladores, investigadores y creadores. Esta herramienta se basa en la técnica de modelado de difusión multi-instancia...
hace 7 meses
023.2K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档

Conversor de documentos en la nube: complemento de descarga de documentos Flying Book, conversión de documentos Flying Book en la nube a documentos locales en formato Markdown.

Introducción general Cloud Document Converter es una extensión de Chrome diseñada para convertir documentos en la nube de Flying Book al formato Markdown. Los usuarios pueden descargar o copiar fácilmente documentos en la nube de Flying Book en formato Markdo...
hace 11 meses
023.2K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: un cliente de visualización de flujos de trabajo para modelos de IA basado en la orquestación de nodos

Introducción general NodeTool es una innovadora plataforma de creación de IA diseñada para proporcionar una interfaz sencilla e intuitiva para entusiastas de la IA, desarrolladores, científicos de datos y creativos. Tanto si eres un artista, desarrollador o principiante, NodeTool te ayuda a crear rápidamente prototipos creativos....
hace 10 meses
023.2K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: un asistente pedagógico inteligente que ofrece orientación personalizada sobre programación

Introducción general Coding-Tutor es un proyecto de código abierto alojado en GitHub y creado por el desarrollador iwangjian para proporcionar a los alumnos una experiencia de enseñanza de programación personalizada. Utiliza tecnología de IA conversacional para aprender basándose en los conocimientos...
hace 8 meses
023.2K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: una interfaz de chat limpia para interactuar con los modelos nativos de Ollama

Introducción general HiOllama es una interfaz fácil de usar basada en Python y Gradio, diseñada para interactuar con los modelos de Ollama. Proporciona una interfaz web sencilla e intuitiva que admite la generación de texto en tiempo real y funciones de gestión de modelos. Los usuarios pueden ajustar parámetros como la temperatura y la mayoría...
hace 11 meses
023.2K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: investigación web y redacción de informes utilizando LLM nativo, profundizando automáticamente en temas especificados por el usuario y generando resúmenes.

Introducción general Research Rabbit es un asistente nativo de investigación y resumen web basado en LLM (Large Language Model). Después de que el usuario proporcione un tema de investigación, Research Rabbit genera una consulta de búsqueda, obtiene resultados web relevantes y resume estos resultados....
hace 7 meses
023.2K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: motor de código abierto para la implantación de FLUX en entornos de baja densidad, Wan 2.1

Introducción general DiffSynth-Engine es un proyecto de código abierto lanzado por ModelScope, alojado en GitHub.Se basa en la tecnología de modelado de difusión, se centra en la generación eficiente de imágenes y vídeos, y es adecuado para que los desarrolladores desplieguen modelos de IA en entornos de producción....
hace 7 meses
023.2K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: proyecto experimental para ejecutar un modelo lingüístico a gran escala en un archivo PDF

Introducción general llm.pdf es un proyecto de código abierto que permite a los usuarios ejecutar grandes modelos lingüísticos (LLM) directamente en archivos PDF. Desarrollado por EvanZhouDev y alojado en GitHub, este proyecto demuestra un enfoque innovador: al Em...
hace 5 meses
023.2K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: reproducción de imágenes de retratos con luz natural (inédito)

Descripción general SynthLight es una herramienta de reiluminación de retratos basada en un modelo de difusión. Aprende a volver a renderizar imágenes faciales sintéticas para conseguir ajustes de efectos de iluminación en fotos de retratos reales. La herramienta utiliza un motor de renderizado físico para generar conjuntos de datos que simulan transformaciones de la iluminación en diferentes condiciones de luz...
hace 9 meses
023.2K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: un proyecto de código abierto para entrenar a la IA a realizar acciones web con demostraciones humanas

Introducción general Optexity es un proyecto de código abierto en GitHub, desarrollado por el equipo de Optexity. Su núcleo es utilizar datos de demostración humana para entrenar a la IA a completar tareas informáticas, especialmente operaciones de páginas web. El proyecto contiene tres bibliotecas de código: Compute...
hace 7 meses
023.2K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: conversión sin pérdidas de PDF a HTML, manteniendo el formato del texto, adecuado para trabajos académicos y composición de revistas.

Introducción completa pdf2htmlEX es una herramienta de código abierto diseñada para convertir archivos PDF a formato HTML , mediante el análisis del contenido del archivo PDF y el uso de HTML + CSS para restaurar con precisión su efecto visual , el documento PDF se ...
hace 11 meses
023.2K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Adaptador de historias: Genere ilustraciones gráficas continuas y coherentes basadas en una historia larga.

Introducción general Story-Adapter es un innovador marco de visualización de historias que convierte relatos textuales en secuencias de imágenes coherentes. Desarrollado por investigadores, este proyecto emplea un enfoque iterativo que no requiere formación para generar ilustraciones de historias de alta calidad. El marco se caracteriza por su capacidad para...
hace 9 meses
023.1K