Proyecto AI de código abierto

Total 1020 artículos
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector: un modelo base para generar gráficos vectoriales SVG a partir de imágenes y texto

Introducción general StarVector es un proyecto de código abierto creado por desarrolladores como Juan A. Rodríguez para convertir imágenes y texto en gráficos vectoriales escalables (SVG). Esta herramienta utiliza un modelo de lenguaje visual para poder entender el contenido de la imagen y el texto....
hace 7 meses
024.5K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: generación de consultas SQL precisas a partir de texto mediante técnicas RAG

Introducción exhaustiva Vanna es un marco Python de código abierto con licencia del MIT centrado en la generación de consultas SQL mediante técnicas RAG (Retrieval Augmented Generation). Los usuarios pueden entrenar modelos RAG, aplicarlos a sus propios datos, y luego hacer preguntas, y Vanna devolverá los s...
hace 9 meses
024.5K
ACE++:用文本指令精准对图像局部编辑的多功能开源工具

ACE++: una versátil herramienta de código abierto para la edición local precisa de imágenes con comandos de texto

Introducción general ACE++ es un proyecto de código abierto desarrollado por el equipo ali-vilab de Alibaba Tongyi Lab (Laboratorio Tongyi). Se basa en el modelo FLUX.1-Fill-dev y pretende conseguir la generación y compilación de imágenes mediante sencillos comandos textuales....
hace 7 meses
024.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: Marco de orquestación de cuerpos inteligentes con soporte de agentes RAG y LLM para simplificar el desarrollo de aplicaciones de IA

Introducción general Dynamiq es un marco de orquestación de IA de código abierto diseñado para aplicaciones de IA de agentes y Large Language Modelling (LLM). Su objetivo es simplificar el desarrollo de aplicaciones basadas en IA, especialmente en el área de la Generación Aumentada de Recuperación (RAG) y la orquestación de agentes LLM.Dynamiq propone...
hace 11 meses
024.4K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: Predecir la probabilidad de acontecimientos futuros basándose en el conocimiento de las búsquedas

Introducción general Forecast AI es una magnífica plataforma de predicción basada en tecnología avanzada de inteligencia artificial. Utiliza potentes algoritmos de análisis de datos y aprendizaje automático para proporcionar a los usuarios predicciones muy precisas sobre acontecimientos futuros. Ya se trate de elecciones políticas, tendencias económicas o acontecimientos sociales, Forecast ...
hace 1 año
024.4K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

Claude Engineer: un asistente de diálogo corporal inteligente que genera y gestiona de forma autónoma herramientas de IA utilizando el modelo Claude.

Introducción general Claude Engineer es una interfaz interactiva de línea de comandos (CLI) desarrollada por Doriandarko que utiliza el modelo Claude-3.5-Sonnet de Anthropic para ayudar en las tareas de desarrollo de software...
hace 7 meses
024.4K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: una plataforma de desarrollo de bajo código para aplicaciones de IA generativa de nivel empresarial

Introducción BuffGPT es una plataforma de desarrollo de aplicaciones de IA de código abierto basada en el Large Language Model (LLM), que proporciona funciones listas para usar como el procesamiento de datos, la invocación de modelos, la recuperación RAG y la orquestación visual de flujos de trabajo para ayudar a los usuarios a construir y operar fácilmente aplicaciones de IA generativa. La plataforma admite...
hace 7 meses
024.4K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: Asistente de Chat de Documentos, obtenga respuestas fiables a partir de documentos individuales, fuentes web, soporte a la implantación local.

Introducción general DocsGPT es un asistente de documentación de código abierto diseñado para simplificar el proceso de consulta de la documentación del proyecto. Mediante la integración de un potente modelo GPT , los desarrolladores pueden hacer fácilmente preguntas sobre el proyecto y obtener respuestas precisas.DocsGPT soporta el despliegue local para garantizar la privacidad de los datos mientras...
hace 11 meses
024.4K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Una interfaz fácil de usar para ComfyUI para agilizar el flujo de trabajo

Introducción general ComfyUI-disty-Flow es un nodo personalizado que proporciona una interfaz de usuario amigable para ComfyUI. Está pensado para simplificar la ejecución de flujos de trabajo proporcionando una interfaz de usuario alternativa a la creación de flujos de trabajo.ComfyUI-disty...
hace 9 meses
024.4K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: Chatbots personalizados para la integración rápida de múltiples fuentes de datos

Introducción general OpenChat es una consola de chatbot fácil de usar diseñada para simplificar el uso de modelos lingüísticos extensos (LLM). Mediante un proceso de configuración en dos pasos, OpenChat permite a los usuarios crear y gestionar fácilmente varios chatbots personalizados. La plataforma es compatible con G...
hace 9 meses
024.4K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: servicio de almacenamiento y recuperación de documentos basado en incrustación visual

Introducción general ColiVara es un servicio de almacenamiento y recuperación de documentos basado en la tecnología de incrustación visual. Elimina la necesidad de reconocimiento óptico de caracteres (OCR) o extracción de texto y evita los problemas de formularios rotos o imágenes perdidas.ColiVara admite más de 100 formatos de archivo, incluidos PDF...
hace 8 meses
024.4K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: Ofrecer una solución de puerta de enlace de IA eficiente para simplificar la gestión de microservicios y mejorar la seguridad

Introducción completa Higress es una pasarela de API nativa de la nube desarrollada por Alibaba, construida sobre Istio y Envoy, diseñada para proporcionar soluciones eficientes de programación de tráfico, gobernanza de servicios y seguridad. Admite extensiones de plugin Wasm para múltiples lenguajes de programación para negocios de IA....
hace 11 meses
024.3K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: plataforma de búsqueda de grandes modelos y AI localizada para datos personales (avance)

Introducción Quanta Quest es el primer producto del mundo con "end-side big model + C-side data localisation" como dirección de evolución central. Ayuda a los usuarios a almacenar todos los datos de Gmail, Notion, Dropbox, etc. localmente, y procesarlos a través de la base de datos vectorial para garantizar...
hace 12 meses
024.3K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: un marco RAG para la comprensión de vídeos ultralargos con soporte para la recuperación multimodal y la construcción de grafos de conocimiento

Introducción VideoRAG es un marco generativo de recuperación mejorado diseñado para procesar y comprender vídeos contextuales muy largos. La herramienta combina una base de conocimiento textual basada en grafos con la codificación jerárquica multimodal del contexto para procesar eficientemente en una sola GPU NVIDIA RTX 3090....
hace 8 meses
024.3K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model: Vídeo de referencia del mapa de retratos estáticos Vídeo de generación de movimiento de retratos

Introducción general Thin-Plate-Spline-Motion-Model es un innovador proyecto de generación de animación de imágenes presentado en CVPR 2022. El proyecto se basa en la teoría de las transformadas spline de placa delgada y es capaz de lograr movimiento de alta calidad a partir de imágenes fijas basadas en la conducción de vídeo....
hace 9 meses
024.3K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: una plataforma de IA para generar activos digitales modelados en 3D de alta resolución

Introducción general Neural4D es una innovadora plataforma basada en IA que se centra en ayudar a los usuarios a generar rápidamente modelos y animaciones 3D de alta calidad con la simple introducción de texto o imágenes. Desarrollada por DreamTech, se basa en la tecnología líder mundial de generación de modelos 3D de gran tamaño de extremo a extremo....
hace 8 meses
024.3K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, una plataforma para construir modelos base de IA del mundo físico.

Introducción completa NVIDIA Cosmos es una plataforma de modelado basada en mundos para desarrolladores, diseñada específicamente para ayudar a los desarrolladores de IA de física a crear sus sistemas de IA de física mejor y más rápido. La plataforma ofrece una amplia gama de modelos preentrenados, incluidos modelos de difusión y autorregresivos...
hace 9 meses
024.3K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: manejo automatizado de smartphones mediante inteligencias multimodales

Introducción AppAgent es un marco de agente multimodal basado en un modelo de lenguaje amplio (LLM) diseñado para manipular aplicaciones de teléfonos inteligentes. El marco imita interacciones humanas como toques y deslizamientos a través de un espacio de manipulación simplificado, eliminando así la necesidad de acceso al back-end del sistema y extendiendo su uso a través de diferentes aplicaciones....
hace 10 meses
024.3K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: comparador de capacidades de programación LLM de código abierto, visión en tiempo real de los mejores modelos de generación de código

Introducción general CodeArena es una plataforma única diseñada para mostrar los mejores modelos de generación de código abierto (LLM) a través de enfrentamientos en tiempo real. Los usuarios pueden ver diferentes LLMs compitiendo en las mismas tareas de programación y ver los modelos con mejor rendimiento a través de tablas de clasificación en tiempo real. La plataforma utiliza Tog...
hace 10 meses
024.3K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic: extracción de información estructurada para tablas complejas

El objetivo del reconocimiento de tablas es analizar tablas en imágenes, identificar con precisión las estructuras de las tablas y la ubicación de las celdas, y reducirlas a formatos de tabla estructurados (por ejemplo, HTML). En la actual era de la información, una gran cantidad de datos tabulares importantes sigue existiendo en estado no estructurado (por ejemplo, documentos escaneados con imágenes de tablas estadísticas...).
hace 7 meses
024.2K
Supermemory:导入书签和网页内容构建个人知识库

Supermemoria: importar marcadores y contenidos web para crear una base de conocimientos personal

Introducción general Supermemory es un proyecto de código abierto diseñado para ayudar a los usuarios a construir su "segundo cerebro". Con una potente extensión de Chrome y tecnología de IA, permite a los usuarios guardar, organizar y recuperar fácilmente datos de páginas web, marcadores de Twitter...
hace 9 meses
024.2K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: una herramienta de código abierto para la extracción y exploración eficientes de datos estructurados

Introducción exhaustiva Knowledge Table (Tabla de conocimientos) es un proyecto de código abierto diseñado para simplificar el proceso de extracción y exploración de datos estructurados a partir de documentos no estructurados. Los usuarios pueden crear representaciones estructuradas del conocimiento, como tablas y gráficos, mediante una interfaz de consulta en lenguaje natural. La herramienta permite personalizar la extracción ...
hace 1 año
024.2K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: una plataforma sin código y de código abierto que rastrea automáticamente datos web y los convierte en API u hojas de cálculo.

Introducción completa Maxun es una plataforma de extracción de datos web sin código de código abierto que permite a los usuarios entrenar robots en cuestión de minutos para rastrear automáticamente datos web y convertirlos en API u hojas de cálculo. La plataforma admite paginación y desplazamiento, se adapta a los cambios en el diseño del sitio web, proporciona un potente rastreo de datos...
hace 9 meses
024.2K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: un modelo de lenguaje visual ligero de código abierto para la retropropagación por lotes de palabras clave de imágenes

Introducción exhaustiva Moondream es un modelo de lenguaje visual ligero de código abierto diseñado para habilitar capacidades de descripción de imágenes mediante técnicas de aprendizaje profundo y visión por ordenador. El modelo es capaz de funcionar de manera eficiente en una variedad de plataformas, y es particularmente adecuado para dispositivos edge.Moondream utiliza técnicas avanzadas y...
hace 9 meses
024.2K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: herramientas de gestión de marcadores AI de código abierto, compatible con múltiples formatos, clasificación inteligente de etiquetas, búsqueda de texto completo

Descripción general Hoarder es una herramienta de gestión de marcadores autoalojada que permite almacenar enlaces, notas, PDF e imágenes. Utiliza tecnología de IA para el etiquetado automático y ofrece funciones de búsqueda de texto completo. Los usuarios pueden utilizar el plugin de Chrome y el plugin de Firefox...
hace 10 meses
024.2K
Coding Agent:基于Langgraph构建的简单编程助手

Agente de codificación: un sencillo asistente de programación basado en Langgraph

Introducción general Coding Agent es un asistente de programación inteligente desarrollado por AbhinavTheDev, diseñado para ayudar a los desarrolladores a mejorar su eficiencia en la programación. La herramienta utiliza tecnología de inteligencia artificial para generar código de forma automática, proporcionar sugerencias de programación y ayudar a los desarrolladores...
hace 9 meses
024.2K
闲鱼卖家全天自动值守的AI客服机器人

Bots de atención al cliente con inteligencia artificial que son atendidos automáticamente por los vendedores de Idle Fish a lo largo del día.

Introducción completa XianyuAutoAgent es un sistema robótico de atención al cliente inteligente diseñado para la plataforma Idlefish, de código abierto por el desarrollador shaxiu en GitHub. Utiliza la tecnología de IA para lograr 7×24 horas de servicio automático para ayudar a los vendedores de pescado...
hace 7 meses
024.2K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): asistente de voz local en tiempo real, versión de código abierto de Siri.

Introducción general Ichigo es un proyecto de IA de voz en tiempo real de código abierto que pretende ampliar los modelos de lenguaje basados en texto con capacidades de "escucha" nativa. El proyecto utiliza técnicas de fusión temprana inspiradas en el documento Chameleon de Meta.El objetivo de Ichigo es convertirse...
hace 9 meses
024.2K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: generación de modelos de conversión de texto en voz específicos para cada hablante a partir de un texto de entrada

Introducción general Parler-TTS es una biblioteca de modelos de texto a voz (TTS) de código abierto desarrollada por Hugging Face, diseñada para generar habla de alta calidad y sonido natural. El modelo es capaz de generar habla a partir de un texto de entrada con un estilo de locutor específico (por ejemplo, género, tono, estilo de habla...
hace 8 meses
024.2K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude: una interfaz de chat que fusiona el razonamiento en cadena R1 de DeepSeek con la creatividad de Claude

Introducción exhaustiva DeepClaude es una API de inferencia e interfaz de chat de alto rendimiento de Large Language Model (LLM) que integra las capacidades de inferencia encadenada (CoT) de DeepSeek R1 con la creatividad y generación de código del modelo antrópico Claude....
hace 9 meses
024.2K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: una plataforma inteligente de preguntas y respuestas basada en grafos de conocimiento

Yuxi-Know es una plataforma inteligente de preguntas y respuestas de código abierto que combina el grafo de conocimiento y la tecnología RAG (Retrieval Augmented Generation) para ayudar a los usuarios a obtener rápidamente respuestas precisas. Se basa en Neo4j para almacenar el grafo de conocimiento , utilizando FastAPI y VueJS estructura...
hace 6 meses
024.1K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: un modelo de comprensión de vídeo de código abierto para generar descripciones de vídeo de alta calidad

Introducción general Tarsier es una familia de modelos de videolenguaje de código abierto desarrollada por ByteDance para generar descripciones de vídeo de alta calidad. Consta de una estructura sencilla: el CLIP-ViT procesa los fotogramas de vídeo, combinado con un Large Language Model (LLM) para analizar...
hace 6 meses
024.1K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: creación de inteligencias artificiales con memoria, conocimientos y herramientas

Introducción general PhiData es un marco de trabajo diseñado para desarrollar asistentes de IA inteligentes. Permite a los asistentes de IA entablar conversaciones a largo plazo, proporcionar un contexto empresarial preciso y realizar diversas operaciones mediante capacidades mejoradas de memoria, integración de conocimientos e invocación de herramientas.PhiData no solo mejora los asistentes de IA....
hace 7 meses
024.1K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: ingenieros de IA full-stack de código abierto que construyen e iteran rápidamente proyectos TypeScript completos.

Introducción general Srcbook es una plataforma de desarrollo de aplicaciones centrada en TypeScript diseñada para crear e iterar rápidamente aplicaciones web con asistentes de IA. Es compatible con el tiempo de ejecución nativo, proporciona una interfaz de bloc de notas interactivo y permite a los usuarios escribir y ejecutar código back-end.Srcbook está abierto...
hace 11 meses
024.1K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code: herramienta de AI para convertir capturas de pantalla en código front-end limpio.

Introducción general Screenshot-to-Code es una herramienta de código abierto que utiliza inteligencia artificial para convertir capturas de pantalla, borradores de diseño y diseños Figma en código limpio y funcional. La herramienta soporta múltiples tecnologías front-end, incluyendo HTML, Tailwind CS...
hace 12 meses
024.1K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: creación de una herramienta de colaboración en tareas multiinteligencia en una frase

Introducción general Cooragent es un marco de colaboración de agentes de IA de código abierto desarrollado por LeapLab en la Universidad de Tsinghua y alojado en GitHub. Permite a los usuarios crear agentes de IA inteligentes con una descripción de una frase y admite múltiples agentes para colaborar en tareas complejas. El marco proporciona dos...
hace 5 meses
024.1K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: una herramienta automatizada de coloreado de líneas para colorear rápidamente dibujos anime de líneas en blanco y negro.

Introducción exhaustiva MangaNinjia es un proyecto de código abierto desarrollado por Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), centrado en el procesamiento automatizado del coloreado de dibujos lineales. Esta herramienta consigue un ajuste preciso del color de las imágenes de referencia mediante técnicas de aprendizaje profundo, mejorando enormemente...
hace 9 meses
024.1K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: rastreo de datos de Twitter y análisis de datos de usuarios X y tweets

Introducción general X-Kit es una herramienta de código abierto diseñada para rastrear y analizar datos y tweets de usuarios de X (antes Twitter). Desarrollada por el usuario de GitHub xiaoxiunique, la herramienta está diseñada para ayudar a los usuarios a automatizar el proceso de obtención de información básica y tweets sobre un determinado usuario de X y...
hace 10 meses
024.1K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de generación de poses para hacer bailar las fotos de Missy

Introducción general X-Dyna es un proyecto de código abierto desarrollado por ByteDance para generar animaciones dinámicas de retratos utilizando técnicas de difusión de muestra cero. El proyecto utiliza expresiones faciales y movimientos corporales en vídeo de unidad para animar imágenes de retratos individuales, generando efectos de movimiento realistas y conscientes del contexto.X-D...
hace 9 meses
024.1K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: una herramienta de código abierto para generar retratos hablados realistas

Introducción general FantasyTalking es un proyecto de código abierto desarrollado por el equipo Fantasy-AMAP, centrado en la generación de realismo hablando videos retrato a través de la unidad de audio. El proyecto se basa en el modelo avanzado de difusión de vídeo Wan2.1 , combinado con el codificador de audio Wa...
hace 5 meses
024.1K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: servicio de razonamiento LLM basado en datos externos de grafos de conocimiento en tiempo real.

Introducción exhaustiva Diffbot LLM Reasoning Server es un innovador sistema de modelado lingüístico a gran escala con optimizaciones y mejoras especiales basadas en la arquitectura del modelo LLama. La característica más importante del proyecto es la integración de Knowledge Graph en tiempo real con la generación mejorada de recuperación...
hace 9 meses
024.1K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Generador de muestras de texto a vídeo cero lanzado por el equipo de investigación de IA de Picsart

Introducción general Text2Video-Zero es una implementación oficial de un generador de texto a vídeo de muestra cero para GitHub desarrollado por el equipo Picsart AI Research.El proyecto proporciona una forma de utilizar pistas de texto para generar texto con consistencia temporal y...
hace 1 año
024.1K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

Bilingual Book Maker: Utiliza la traducción automática para crear libros electrónicos bilingües.

Introducción general Bilingual Book Maker es un proyecto de código abierto diseñado para ayudar a los usuarios a crear versiones multilingües de libros electrónicos utilizando tecnología de IA. La herramienta utiliza principalmente ChatGPT para la traducción y soporta múltiples formatos de archivo, incluyendo epub, txt y srt....
hace 8 meses
024K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Descripción general Quadratic es una herramienta de hoja de cálculo inteligente de código abierto que combina características de IA, código y conectividad de datos diseñadas para proporcionar a los usuarios potentes capacidades de procesamiento y análisis de datos. Al soportar lenguajes de programación como Python, SQL y Rust, Quadratic...
hace 8 meses
024K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock: herramienta de análisis de valores basada en IA, seguimiento en tiempo real de las cotizaciones de valores elegidos por el usuario y análisis en profundidad basados en IA.

Introducción completa go-stock es una herramienta de análisis de acciones con IA construida sobre Wails y NaiveUI. La herramienta es capaz de monitorizar en tiempo real las cotizaciones de las acciones, proporcionando visualización de costes y beneficios/pérdidas y función de empuje de alarma arriba/abajo. Todos los datos se guardan localmente para...
hace 8 meses
024K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Sistema de inversión AI: sistema automatizado de toma de decisiones de inversión en acciones A, que utiliza un sistema de inteligencia múltiple para analizar los datos del mercado.

Introducción exhaustiva A_Share_investment_Agent es una ayuda para la toma de decisiones de inversión en acciones A basada en un sistema de inteligencias múltiples. El sistema está diseñado para analizar los datos del mercado, calcular el valor intrínseco de las acciones, analizar el sentimiento del mercado y los datos fundamentales a través de múltiples inteligencias colaborativas para...
hace 9 meses
024K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN: un modelo de código abierto para generar música/bandas sonoras multipista y crear fácilmente clips musicales para varios instrumentos.

Introducción general MuseGAN es un proyecto de generación musical basado en redes generativas adversariales (GAN) diseñado para generar música multipista (multiinstrumento). El proyecto es capaz de generar música desde cero o acompañada de pistas suministradas por el usuario.MuseGAN utiliza Lakh Pianor...
hace 10 meses
024K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: un mapa de referencia de retratos para generar vídeos coherentes con los personajes, rápida integración multiterminal

Introducción ConsisID es un proyecto de código abierto desarrollado por el grupo de Yuan Rong en la Universidad de Pekín, cuyo objetivo es lograr la generación de texto a vídeo coherente con la identidad (IPT2V) mediante técnicas de descomposición de frecuencias. El núcleo del proyecto es un sistema DiT (Diffusion Transfor...
hace 10 meses
024K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: recuperar contenidos y resumir conocimientos a partir de documentos masivos de múltiples fuentes

Introducción wdoc es un potente sistema RAG (Retrieval Augmentation Generation) diseñado para procesar y analizar grandes cantidades de documentos diversos. Es capaz de recuperar a partir de una amplia gama de tipos de documentos, incluidos PDF, páginas web, vídeos de YouTube, archivos de audio, etc. wdoc es especialmente adecuado para procesar...
hace 8 meses
024K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: Creación de un marco de desarrollo de aplicaciones de datos nativas de IA que integra la gestión multimodelo y el procesamiento inteligente de datos

Introducción general DB-GPT es un marco de desarrollo de aplicaciones de datos nativas de IA de código abierto construido utilizando AWEL (Agentic Workflow Expression Language) y tecnologías de cuerpo inteligente. El proyecto pretende crear una infraestructura en el ámbito de los grandes modelos...
hace 7 meses
024K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

Podcast en chino de HN: captura automáticamente artículos tecnológicos populares, la IA genera resúmenes en chino y los convierte en podcasts.

Introducción general El proyecto Hacker News Chinese Podcast es una plataforma innovadora basada en tecnología de IA, cuyo objetivo es recopilar automáticamente los artículos más populares de Hacker News cada día y generar resúmenes en chino y contenidos de podcast mediante IA. El proyecto está dirigido por ccbikai ...
hace 8 meses
024K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: lienzo colaborativo de edición de código, versión de código abierto de OpenAI Canvas/Claude Artifacts

Introducción general LangChain presenta Open Canvas, una aplicación web de código abierto diseñada para mejorar la experiencia de edición y colaboración de documentos con funcionalidad de memoria de doble agente incorporada y smith integrado para observar todos los detalles de ejecución. La plataforma está impulsada por OpenA...
hace 7 meses
024K
Ovis:视觉与文本对齐模型,精准反推图像提示词

Ovis: un modelo de alineación visual y textual para la retropropagación precisa de palabras clave de imágenes

Introducción general Ovis (Open VISion) es un modelo de lenguaje multimodal (MLLM) de código abierto desarrollado por el equipo AIDC-AI del Grupo de Comercio Digital Internacional de Alibaba y alojado en GitHub.El modelo utiliza una innovadora técnica de alineación de estructura...
hace 7 meses
024K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: una plataforma de diálogo de análisis de datos para consultas de datos y generación de gráficos en lenguaje natural

Introducción general PandasAI es una plataforma de código abierto basada en Python diseñada para simplificar el proceso de análisis de datos mediante técnicas de procesamiento del lenguaje natural. Permite a los usuarios trabajar en un diálogo con bases de datos (por ejemplo, SQL, CSV, pandas, polars, mongodb, n...
hace 11 meses
024K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: diálogo hablado natural de baja latencia con IA

Introducción general RealtimeVoiceChat es un proyecto de código abierto centrado en conversaciones naturales y en tiempo real con inteligencia artificial a través de la voz. Los usuarios utilizan un micrófono para introducir su voz, y el sistema captura el audio a través de un navegador, lo convierte rápidamente en texto, y un gran modelo de lenguaje (LLM) genera de nuevo...
hace 5 meses
024K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: proyecto de código abierto de posicionamiento de vídeos por marcas de tiempo y preguntas y respuestas

Introducción general VideoMind es una herramienta de IA multimodal de código abierto centrada en la inferencia, las preguntas y respuestas y la generación de resúmenes para vídeos largos. Fue desarrollada por Ye Liu, de la Universidad Politécnica de Hong Kong, y un equipo del Show Lab de la Universidad Nacional de Singapur. La herramienta imita la comprensión humana del vídeo...
hace 4 meses
023.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks: pequeño simio cálculo oral notas inversas, ingeniería inversa y algoritmos de descifrado

Introducción completa Ape Mouth Calculator Reverse Notes es un proyecto de código abierto que tiene como objetivo documentar y compartir el proceso y los métodos de ingeniería inversa de la aplicación Ape Mouth Calculator. El proyecto contiene una variedad de herramientas y técnicas inversas para usar las instrucciones , como Frida, dexdump , etc., para ayudar a los usuarios a entender y descifrar la suma aritmética oral del pequeño simio....
hace 1 año
023.9K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: grandes modelos multimodales de código abierto para el tratamiento de imágenes, vídeos y textos

Introducción integral InternVL es un proyecto de big model multimodal de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai (OpenGVLab) y alojado en GitHub. Integra capacidades de procesamiento visual y lingüístico para apoyar la comprensión integral y la generación de imágenes, vídeos y textos.En...
hace 6 meses
023.9K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extracción y categorización de documentos en datos estructurados para optimizar el proceso de tratamiento de documentos.

Introducción exhaustiva ExtractThinker es una herramienta flexible de inteligencia de documentos que extrae y clasifica datos estructurados de documentos utilizando modelos de grandes lenguajes (LLM), proporcionando un flujo de trabajo de procesamiento de documentos sin fisuras similar a ORM. Es compatible con diversos cargadores de documentos, como Tess...
hace 9 meses
023.9K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: una herramienta mejorada de código abierto para incrustar conocimientos externos en grandes modelos

KBLaM es un proyecto de código abierto desarrollado por Microsoft , el nombre completo es "Knowledge Base augmented Language Model" ( Modelo de Lenguaje Aumentado de Base de Conocimiento ). Es a través de la conversión de conocimiento externo en vectores e incrustado en un gran modelo de...
hace 7 meses
023.9K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

Generador llms.txt: Capture rápidamente el contenido del sitio web y genere conjuntos de datos de texto de formación LLM.

Introducción general llmstxt-generator es una herramienta profesional de extracción e integración de contenido web dedicada a la preparación de conjuntos de datos de texto de alta calidad para el entrenamiento y la inferencia en Large Language Models (LLM). La herramienta fue desarrollada por Mendable AI utilizando @firec...
hace 9 meses
023.9K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: Iluminación de imágenes con herramientas de pintura inteligentes

Introducción general LuminaBrush es una innovadora herramienta interactiva de edición de imágenes para efectos de iluminación, impulsada por tecnología de inteligencia artificial. El proyecto utiliza un marco de dos etapas para procesar imágenes: la primera etapa transforma la imagen de entrada en un aspecto "uniformemente iluminado", mientras que la segunda genera...
hace 9 meses
023.9K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

Fast GraphRAG: una herramienta de generación de mejoras de búsqueda gráfica de gran precisión y bajo coste

Introducción completa Fast GraphRAG es una herramienta de código abierto desarrollada por Circlemind AI para permitir una generación de aumento de recuperación (RAG) eficiente y precisa mediante algoritmos de grafos de conocimiento y PageRank. La herramienta se adapta de forma inteligente al uso que el usuario...
hace 9 meses
023.9K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: reconocimiento de lenguas asiáticas y modelización de voz a texto para lenguas asiáticas

Introducción general Dolphin es un modelo de código abierto desarrollado por DataoceanAI y la Universidad de Tsinghua, centrado en el reconocimiento del habla y del lenguaje para las lenguas asiáticas. Es compatible con 40 lenguas de Asia Oriental, Asia Meridional, Asia Sudoriental y Oriente Medio, así como con 22 dialectos chinos...
hace 6 meses
023.9K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter: una herramienta de conversión de audio en tiempo real para la traducción del chino al inglés basada en el modelo multimodal Gemini.

TransRouter es una herramienta de traducción de voz en tiempo real basada en el modelo Gemini de Google, diseñada específicamente para la traducción de voz en tiempo real entre inglés y chino. La herramienta se integra perfectamente en software de videoconferencia como Zoom, proporcionando una potente herramienta para la traducción...
hace 9 meses
023.9K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreado de dibujos animados, sombreado automático de imágenes en blanco y negro para mejorar la coherencia y la calidad del color de las imágenes.

Introducción ColorFlow es una herramienta de autocoloreado de secuencias de imágenes desarrollada por el equipo ARC de Tencent para resolver el problema del autocoloreado de secuencias de imágenes en blanco y negro. La herramienta utiliza un proceso de sombreado mejorado para generar con precisión los colores de varios elementos a través de un conjunto de imágenes de referencia, incluidos los colores del pelo de los personajes y los servicios....
hace 10 meses
023.9K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: Experimenta un editor de código basado en IA, ¡haz de cada conversación un commit Git!

Introducción general Melty es un revolucionario editor de código de IA que combina conversaciones de chat con el control de versiones Git. Desarrollado por Charlie y Jackson de Replicate, esta herramienta pretende resolver los puntos débiles de las herramientas tradicionales de codificación de IA. Su mayor ...
hace 10 meses
023.8K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: carga de wireframes para generar código front-end basado en Llama4

Introducción general Napkins.dev es un proyecto libre de código abierto, la función principal es permitir a los usuarios subir capturas de pantalla de interfaz o wireframes para generar automáticamente código front-end ejecutable. Los usuarios sólo tienen que proporcionar un dibujo de diseño , la herramienta será a través del modelo Llama 4 ( por Juntos ...
hace 6 meses
023.8K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: Estructura de chat en grupo con modelos de gran tamaño: chatear con varios modelos lingüísticos de gran tamaño simultáneamente

Introducción general OpenAOE es un marco de chat de grupo de grandes modelos de código abierto, cuyo objetivo es resolver el problema de la falta de marcos de chat en el mercado actual con múltiples modelos respondiendo en paralelo. Con OpenAOE, los usuarios pueden hablar con múltiples Large Language Models (LLMs) al mismo tiempo y obtener una salida paralela. El marco soporta ...
hace 8 meses
023.8K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: una persona digital secundaria que permite la retransmisión en directo de la estación B y la interacción por voz.

VirtualWife es un proyecto de persona digital virtual de código abierto creado por el desarrollador yakami129. Actualmente se encuentra en fase de incubación. El objetivo es crear un personaje virtual con "alma", con el que el usuario pueda interactuar como con un amigo. El proyecto cuenta con el apoyo de B Station Live...
hace 7 meses
023.8K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...
hace 1 año
023.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: herramienta de generación y depuración automática de código con soporte multilingüe

Introducción general AutoDev es un proyecto de código abierto desarrollado por el equipo de Unit Mesh y alojado en GitHub, cuyo objetivo es mejorar la eficiencia de programación de los desarrolladores mediante tecnología de inteligencia artificial. Es un potente asistente de codificación que soporta múltiples lenguajes de programación, incluyendo Ja...
hace 8 meses
023.8K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: Herramienta de línea de comandos para utilizar los servicios de MCP en cualquier modelo grande, no depende de Claude.

Introducción general La CLI del proveedor de contexto de modelo (mcp-cli) es una herramienta de línea de comandos a nivel de protocolo para interactuar con un servidor de proveedor de contexto de modelo. La herramienta permite a los usuarios enviar comandos, consultar datos e interactuar con diversos recursos proporcionados por el servidor...
hace 7 meses
023.8K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: Convierte tus repositorios de GitHub en podcasts y escucha las actualizaciones de código en cualquier momento y lugar.

Introducción general GitPodcast es una herramienta innovadora diseñada para convertir los repositorios de GitHub en podcasts, permitiendo a los desarrolladores escuchar las actualizaciones de código en cualquier momento y lugar. Utilizando OpenAI y Azure Speech SDK, GitPodca...
hace 9 meses
023.8K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: Creación de un editor de texto enriquecido basado en inteligencia artificial compatible con varios marcos de trabajo frontales.

Introducción completa AIEditor es un editor de texto enriquecido de próxima generación impulsado por IA, basado en el desarrollo de componentes web, soporte para Vue, React, Angular y otros casi todos los principales marcos front-end. Es compatible con PC Web y ...
hace 10 meses
023.7K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Herramienta de supervisión de la degradación del servicio ChatGPT: Detección de degradaciones del servicio ChatGPT

Introducción completa La herramienta de monitorización de la degradación del servicio ChatGPT es un proyecto de código abierto diseñado para ayudar a los usuarios a detectar si su servicio ChatGPT se ha degradado debido a IPs de alto riesgo. La herramienta analiza los valores de dificultad de Proof of Work (PoW) para determinar si los usuarios...
hace 10 meses
023.7K
Rankify:支持信息检索与重排序的Python工具包

Rankify: un conjunto de herramientas de Python para la recuperación y reordenación de la información

Introducción general Rankify es un conjunto de herramientas Python de código abierto desarrollado por el Data Science Group de la Universidad de Innsbruck, Austria. Se centra en la recuperación de información, la reordenación y la generación de aumento de la recuperación (RAG), proporcionando un marco unificado. El conjunto de herramientas incluye 40 puntos de referencia...
hace 7 meses
023.7K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: descargador de vídeo por línea de comandos compatible con casi todas las plataformas de vídeo

Introducción general Lux es una biblioteca de descarga de vídeo rápida y sencilla y una herramienta de línea de comandos escrita en Go. Soporta la descarga de vídeos de múltiples sitios web, incluyendo YouTube, Bilibili, Youku, etc. Lux ofrece una variedad de opciones de descarga y características, tales como la descarga multi-hilo....
hace 9 meses
023.7K