Proyecto AI de código abierto

Total 1020 artículos
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: herramienta de conversión de texto a voz multilingüe (compatible con más de 7000 idiomas), rápida y controlable.

Introducción general IMS Toucan es un avanzado kit de herramientas de conversión de texto a voz (TTS) desarrollado por el Instituto de Procesamiento del Lenguaje Natural (IMS) de la Universidad de Stuttgart (Alemania). El kit de herramientas es compatible con más de 7000 idiomas y es rápido, controlable y requiere pocos recursos informáticos.IMS...
hace 6 meses
03.1K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT: Garantice la privacidad de los datos hablando con varios documentos en dispositivos locales.

Introducción general LocalGPT es un proyecto de código abierto diseñado para permitir a los usuarios hablar con documentos en dispositivos locales, garantizando la privacidad de los datos. Mediante el uso de varios modelos de código abierto, LocalGPT puede procesar y comprender el contenido de los documentos sin subir los datos a la nube. El proyecto es compatible con diversos p...
hace 8 meses
03.1K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos

Introducción general LivePortrait es una herramienta avanzada de animación dinámica de retratos AI desarrollada por Racer Technology. Utiliza una innovadora tecnología de IA para transformar imágenes fijas en vívidas animaciones de vídeo. Tanto si utiliza fotos reales, estilos de animación o retratos artísticos, LivePo...
hace 9 meses
03.1K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: un marco para la colaboración multiinteligente en clústeres

Quantum Swarm es un marco de inteligencia artificial de código abierto centrado en el desarrollo y la investigación de inteligencia poblacional AI. El proyecto es mantenido por el equipo de Quarm AI en GitHub y tiene como objetivo proporcionar una plataforma flexible y eficiente para construir y probar sistemas multiinteligencia.Quan...
hace 7 meses
03.1K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: Permite que la IA controle directamente tu ordenador, una implementación de código abierto del ordenador de control de Claude.

Introducción general Agent.exe es una aplicación Electron de código abierto que utiliza la API Sonnet Claude 3.5 de Anthropic para permitir a los usuarios controlar su ordenador local directamente a través de la IA. El proyecto fue desarrollado por K...
hace 8 meses
03.1K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: Genera y edita texto de imagen multilingüe, altamente controlable para generar múltiples líneas de chino en la imagen.

Introducción AnyText es una revolucionaria herramienta de generación y edición de texto visual multilingüe desarrollada a partir del modelo de difusión. Genera texto multilingüe natural y de alta calidad en imágenes y admite funciones flexibles de edición de texto. Fue desarrollada por un equipo de investigadores y presentada en ICLR 2024....
hace 7 meses
03.1K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: plataforma inteligente de carrozado para la automatización de flujos de trabajo y la ejecución autónoma de tareas

Descripción general AutoGPT es una potente plataforma diseñada para ayudar a los usuarios a crear, desplegar y gestionar agentes de IA en ejecución continua y automatizar flujos de trabajo complejos. Desarrollada por Significant Gravitas, la plataforma ofrece una amplia gama de herramientas y funciones que permiten a los usuarios centrarse...
hace 8 meses
03.1K
Browse AI:无代码提取和监控结构化数据

Explorar la IA: extraer y supervisar datos estructurados sin código

Presentación de Browse Browse AI es un software de automatización web sin codificación basado en la nube diseñado para ayudar a los usuarios a extraer y supervisar datos de cualquier sitio web sin necesidad de programación. Puede entrenar a un bot para que realice tareas de extracción, supervisión y automatización de datos con solo...
hace 11 meses
03.1K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: una eficaz herramienta de generación de aumento de la recuperación (RAG) que admite múltiples bases de datos y modelos lingüísticos.

Introducción general RAGLite es un conjunto de herramientas Python para la Generación Aumentada de Recuperación (RAG) con soporte para bases de datos PostgreSQL o SQLite. Proporciona opciones de configuración flexibles que permiten a los usuarios elegir diferentes modelos de lenguaje y reordenadores....
hace 9 meses
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Introducción Linly-Dubbing es una herramienta inteligente de traducción y doblaje multilingüe diseñada para proporcionar a los usuarios servicios de traducción de subtítulos y doblaje de vídeo multilingüe de alta calidad mediante la integración de tecnología avanzada de IA. La herramienta es especialmente adecuada para la educación internacional, la localización de contenidos globales y otros escenarios, ayudando...
hace 7 meses
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic: extracción de información estructurada para tablas complejas

El objetivo del reconocimiento de tablas es analizar tablas en imágenes, identificar con precisión las estructuras de las tablas y la ubicación de las celdas, y reducirlas a formatos de tabla estructurados (por ejemplo, HTML). En la actual era de la información, una gran cantidad de datos tabulares importantes sigue existiendo en estado no estructurado (por ejemplo, documentos escaneados con imágenes de tablas estadísticas...).
hace 5 meses
03K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: un modelo de lenguaje visual experto para la comprensión multimodal avanzada

Introducción exhaustiva DeepSeek-VL2 es una serie de modelos avanzados de lenguaje visual Mixture-of-Experts (MoE) que mejoran significativamente el rendimiento de su predecesor, DeepSeek-VL. Los modelos son útiles en preguntas y respuestas visuales, reconocimiento óptico de caracteres,...
hace 6 meses
03K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter: implementación con un solo clic de la herramienta de exportación de artículos por lotes de números públicos de wechat

Introducción completa wechat-article-exporter es una herramienta de código abierto diseñada para ayudar a los usuarios a exportar por lotes artículos WeChat número público. La herramienta es compatible con la exportación de audio y vídeo incrustado en el artículo sin la construcción de cualquier entorno , puede 100% restaurar el estilo del artículo , y el apoyo a la parte privada ...
hace 10 meses
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: Predecir la probabilidad de acontecimientos futuros basándose en el conocimiento de las búsquedas

Introducción general Forecast AI es una magnífica plataforma de predicción basada en tecnología avanzada de inteligencia artificial. Utiliza potentes algoritmos de análisis de datos y aprendizaje automático para proporcionar a los usuarios predicciones muy precisas sobre acontecimientos futuros. Ya se trate de elecciones políticas, tendencias económicas o acontecimientos sociales, Forecast ...
hace 11 meses
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: creación de inteligencias artificiales con memoria, conocimientos y herramientas

Introducción general PhiData es un marco de trabajo diseñado para desarrollar asistentes de IA inteligentes. Permite a los asistentes de IA entablar conversaciones a largo plazo, proporcionar un contexto empresarial preciso y realizar diversas operaciones mediante capacidades mejoradas de memoria, integración de conocimientos e invocación de herramientas.PhiData no solo mejora los asistentes de IA....
hace 5 meses
03K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC: admite la conversión en tiempo real de voz y canciones con menos muestras.

Introducción general Seed-VC es un proyecto de código abierto en GitHub, desarrollado por Plachtaa. Puede utilizar una pieza de 1 a 30 segundos de audio de referencia , el habla rápida o la conversión de canciones , sin formación adicional . El proyecto soporta la conversión de voz en tiempo real , retraso ...
hace 5 meses
03K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Vision is All You Need: Building an Intelligent Document Retrieval System Using Visual Language Models (Visión RAG)

Introducción Vision-is-all-you-need es un innovador proyecto de demostración del sistema visual RAG (Retrieval Augmented Generation) que abre nuevos caminos en la aplicación del Modelado del Lenguaje Visual (VLM) al ámbito del procesamiento de documentos. A diferencia de los métodos tradicionales de fragmentación de textos, el sistema...
hace 7 meses
03K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: generación de entradas de blog a partir de contenidos de voz basados en LangGraph, blogs de redacción automatizada

Introducción general Robo Blogger es una innovadora herramienta de creación de blogs diseñada para simplificar el proceso de generación de contenidos mediante la tecnología de voz a texto. Los usuarios pueden grabar ideas a través de cualquier aplicación de voz a texto, y Robo Blogger convierte esas ideas en contenido de blog estructurado....
hace 8 meses
03K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: evaluación de la memoria RAG Precisión de la GC y correlación de respuestas

Introducción exhaustiva Ragas es una herramienta diseñada específicamente para evaluar y optimizar sistemas de Generación Aumentada de Recuperación (RAG). Proporciona un amplio conjunto de métricas de evaluación mediante el análisis de las relaciones entre consultas, contextos de recuperación y respuestas generadas. Estas métricas incluyen fidelidad, relevancia de la respuesta, relevancia del contexto, on...
hace 7 meses
03K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: AI digital people con interacción fluida en tiempo real en tarjetas gráficas de la serie 30/40

Introducción general DH_live es un proyecto de humano digital en tiempo real basado en el aprendizaje sin muestras, cuyo objetivo es proporcionar a los usuarios una experiencia de transmisión en directo fluida e interactiva. El proyecto es compatible con las tarjetas gráficas NVIDIA de las series 30 y 40 y es capaz de funcionar en tiempo real a más de 25 fps. Los usuarios pueden...
hace 9 meses
03K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: modelos lingüísticos multimodales de código abierto para la interacción visual y verbal en tiempo real

Introducción general VITA es un proyecto líder de modelado de grandes lenguajes multimodales interactivos de código abierto, pionero en la capacidad de lograr una verdadera interacción multimodal completa. El proyecto lanzó VITA-1.0 en agosto de 2024, siendo pionero en el primer gran modelo de lenguaje interactivo completamente modal de código abierto.2024...
hace 7 meses
03K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter: herramienta de edición de imágenes estilo garabato con IA

Introducción general FramePainter es una revolucionaria herramienta de edición de imágenes basada en IA que utiliza una avanzada tecnología de difusión de vídeo y controles intuitivos Sketch para ayudar a los usuarios a lograr fácilmente una compleja edición de imágenes. Tanto si se trata de un simple ajuste como de una compleja transformación creativa, Fr...
hace 7 meses
03K
StickerBaker:用AI制作个性贴纸图片

StickerBaker: Crea pegatinas personalizadas con IA

Descripción general stickerbaker es un creador de pegatinas de código abierto que utiliza tecnología de inteligencia artificial para crear una gran variedad de pegatinas interesantes. Tanto si quieres una simple pegatina de un gato como si quieres hacer una serie de pegatinas diversas, stickerbaker puede satisfacer tus necesidades....
hace 11 meses
03K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fay Digital Human Framework: integración de modelos lingüísticos y personajes digitales tridimensionales para dar soporte a diversos escenarios de aplicación.

Introducción general Fay es un marco de trabajo de código abierto para humanos digitales virtuales en 3D que integra modelos lingüísticos y personajes digitales para diversos escenarios de aplicación, como guías de compras virtuales, presentadores virtuales, asistentes, camareros, profesores y asistentes móviles basados en voz o texto.
hace 7 meses
03K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Introducción general Devika es un ingeniero de software de IA avanzada que entiende instrucciones humanas de alto nivel, las descompone en pasos, estudia la información relevante y escribe código para lograr un objetivo determinado. Desarrolla software de forma inteligente utilizando modelos lingüísticos a gran escala, algoritmos de planificación y razonamiento y capacidades de navegación web.D...
hace 5 meses
03K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: herramienta profesional de creación de ilustraciones manga de cuatro paneles, generación de imágenes, edición de páginas manga

Introducción general SP-MangaEditer es una plataforma independiente de edición de manga diseñada para creadores de manga. La plataforma soporta generación de imágenes, edición por capas, ajuste de imágenes, aplicación de filtros y muchas otras funciones para ayudar a los usuarios a crear fácilmente ilustraciones manga de alta calidad. Los usuarios pueden manipular...
hace 7 meses
03K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: herramienta de conversión de voz a texto en tiempo real para el reconocimiento del habla en streaming de baja latencia basada en Whisper.

Introducción general RealtimeSTT es una eficaz biblioteca de conversión de voz a texto en tiempo real de baja latencia con detección avanzada de la actividad del habla y activación de la palabra de despertador. Ha sido desarrollada por Kolja Beigel para dar soporte a aplicaciones que requieren una conversión de voz a texto...
hace 7 meses
03K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: una herramienta de código abierto para generar materiales de estudio de palabras de 4º curso utilizando DeepSeek.

Introducción completa "Vocabulary Book by DeepSeek" es un proyecto de código abierto desarrollado sobre la base del gran modelo de DeepSeek, con el objetivo de ayudar a los estudiantes de inglés a dominar el vocabulario del nivel 4 de inglés universitario (CET-4) de manera eficiente. El proyecto está alojado en GitHub...
hace 6 meses
03K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers: motor de rendimiento para la inferencia de grandes modelos: aceleración extrema, potenciación flexible

KTransformers: Un framework Python de alto rendimiento para romper el cuello de botella de la inferencia de grandes modelos. Es más que una simple herramienta de ejecución de modelos, es un conjunto de motores de optimización de rendimiento extremo y una plataforma flexible de potenciación de interfaces. KTransf...
hace 6 meses
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: Confiar en MCP para consultar y resumir los mensajes de WeChat en Claude

Introducción general MCP Server ChatSum es un proyecto de código abierto diseñado para ayudar a los usuarios a consultar y resumir los mensajes de chat. El proyecto está alojado en GitHub y proporciona un potente conjunto de herramientas que permite a los usuarios consultar los registros de chat basándose en parámetros específicos y generar los resúmenes correspondientes....
hace 5 meses
03K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: big model API ligera convertida en interfaz OpenAI, archivo YAML para configurar el canal API

Introducción completa No front-end , pura configuración de archivos de configuración del canal API . Sólo tienes que escribir un archivo puede ejecutar una estación de API de su propia , el documento tiene una guía de configuración detallada , blanco amigable. uni-api es una gestión unificada de gran proyecto API modelo , lo que permite una ...
hace 9 meses
03K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: ingenieros de IA full-stack de código abierto que construyen e iteran rápidamente proyectos TypeScript completos.

Introducción general Srcbook es una plataforma de desarrollo de aplicaciones centrada en TypeScript diseñada para crear e iterar rápidamente aplicaciones web con asistentes de IA. Es compatible con el tiempo de ejecución nativo, proporciona una interfaz de bloc de notas interactivo y permite a los usuarios escribir y ejecutar código back-end.Srcbook está abierto...
hace 9 meses
03K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: revolucionarias herramientas de generación y clonación de voz

Introducción general GPT-SoVITS es una herramienta de conversión y síntesis de voz de código abierto que combina el modelo GPT y la tecnología de cambio de voz SoVITS. La herramienta admite la conversión de texto a voz sobre la marcha con cero y pocas muestras, y la migración de estilo de voz con sólo 5 segundos de muestras de audio. Entre sus funciones se incluyen la ...
hace 11 meses
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: ¡Acceso gratuito a GPT-4, Llama-3 y muchos otros modelos de IA a través de Raycast!

Introducción general Raycast-G4F (GPT4Free) es una potente extensión de Raycast que ofrece a los usuarios acceso gratuito a una amplia gama de modelos avanzados de IA, incluyendo GPT-4, Llama-3. La extensión no sólo proporciona transmisión de diálogos en tiempo real...
hace 7 meses
03K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: una biblioteca experimental para la optimización de grandes modelos de palabras clave, que optimiza automáticamente Prompt

Introducción general Promptimizer es una biblioteca experimental de optimización de palabras clave diseñada para ayudar a los usuarios a mejorar sistemáticamente las palabras clave de sus sistemas de IA. Al automatizar el proceso de optimización, Promptimizer puede mejorar el rendimiento de las palabras clave en tareas específicas. Los usuarios sólo tienen que...
hace 9 meses
03K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: un marco de flujo de trabajo de código abierto de IA que integra muchas palabras clave para gestionar eficazmente una variedad de transacciones.

Introducción general Fabric es un marco de IA de código abierto desarrollado por Daniel Miessler para simplificar y automatizar las tareas informáticas cotidianas y facilitar el uso de la inteligencia artificial. Ayuda a los usuarios de forma eficiente a través de un diseño modular y de palabras clave predefinidas (Patrones)...
hace 10 meses
03K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: marco de agentes de vídeo inteligentes para realizar flujos de trabajo de búsqueda, edición y generación de vídeo con descripciones en lenguaje natural.

Introducción general Director es un marco de trabajo de código abierto diseñado para simplificar y optimizar las interacciones y los flujos de trabajo de vídeo mediante la creación de agentes de vídeo inteligentes. El marco se basa en la infraestructura de "vídeo como datos" de VideoDB y es capaz de gestionar tareas de vídeo complejas como la búsqueda, edición, compilación y generación de...
hace 8 meses
03K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...
hace 4 meses
03K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: modelos de vídeo de código abierto para generar vídeos de acción humana de alta calidad

Introducción general SkyReels-V1 es un proyecto de código abierto desarrollado por el equipo SkyworkAI centrado en la generación de contenidos de vídeo de alta calidad centrados en el ser humano. El proyecto se basa en el modelo HunyuanVideo , a través de decenas de millones de clips de cine y televisión de alta calidad de micro...
hace 6 meses
03K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Introducción general Aider es una potente herramienta de código abierto que ayuda a los desarrolladores a escribir, editar y refactorizar código a través del diálogo en lenguaje natural. Como herramienta interactiva de programación por pares de IA, Aider es compatible con muchos de los principales lenguajes de programación y puede integrarse perfectamente en Git....
hace 4 meses
03K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: ¡Sube una foto de una habitación y rediseña su diseño con IA!

Introducción general RoomGPT es un proyecto de código abierto desarrollado por el usuario de GitHub Nutlope que permite a los usuarios subir fotos de habitaciones y generar versiones rediseñadas de las mismas utilizando tecnología de inteligencia artificial. El objetivo del proyecto es ofrecer a los usuarios acceso a un diseño de interiores profesional sin tener que pagar...
hace 9 meses
03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: analiza cada tipo de documento en datos disponibles en LLM, conservando toda la información del documento, como tablas e imágenes, en su totalidad.

Introducción general MegaParse es una potente y versátil herramienta de análisis sintáctico de documentos diseñada para optimizar el procesamiento de datos para el Large Language Model (LLM). Tanto si trabaja con texto, PDF, presentaciones de PowerPoint o documentos de Word, MegaParse...
hace 8 meses
03K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk: Asistente inteligente de búsqueda de empleo, colocación automatizada de CV (sólo en inglés)

Introducción general Auto_Jobs_Applier_AIHawk es una herramienta para automatizar la búsqueda de empleo utilizando tecnología de inteligencia artificial. Ayuda a los usuarios a automatizar el envío de un gran número de CV en un corto periodo de tiempo y a personalizarlos según su información personal y sus intenciones de búsqueda de empleo. La herramienta está diseñada...
hace 8 meses
03K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli

Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...
hace 4 meses
03K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...
hace 6 meses
03K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: resuma un libro entero en un clic, destile eficazmente el contenido del libro y capte rápidamente las ideas centrales.

Introducción completa TextDistiller es una herramienta avanzada basada en IA diseñada para resumir libros capítulo a capítulo o en su totalidad, proporcionando una visión general concisa pero completa. Con TextDistiller, los usuarios pueden captar rápidamente las ideas centrales y los puntos clave de cualquier libro...
hace 8 meses
03K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: un asistente nativo de programación de inteligencia artificial que se integra en VSCode

Introducción general Tabby es un asistente de programación de IA de código abierto desarrollado por el equipo TabbyML que los usuarios pueden desplegar ellos mismos localmente o en un servidor. Ofrece funciones similares a GitHub Copilot, como el autocompletado de código y las preguntas y respuestas...
hace 4 meses
03K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: herramientas de gestión de marcadores AI de código abierto, compatible con múltiples formatos, clasificación inteligente de etiquetas, búsqueda de texto completo

Descripción general Hoarder es una herramienta de gestión de marcadores autoalojada que permite almacenar enlaces, notas, PDF e imágenes. Utiliza tecnología de IA para el etiquetado automático y ofrece funciones de búsqueda de texto completo. Los usuarios pueden utilizar el plugin de Chrome y el plugin de Firefox...
hace 8 meses
03K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: un modelo de lenguaje visual ligero de código abierto para la retropropagación por lotes de palabras clave de imágenes

Introducción exhaustiva Moondream es un modelo de lenguaje visual ligero de código abierto diseñado para habilitar capacidades de descripción de imágenes mediante técnicas de aprendizaje profundo y visión por ordenador. El modelo es capaz de funcionar de manera eficiente en una variedad de plataformas, y es particularmente adecuado para dispositivos edge.Moondream utiliza técnicas avanzadas y...
hace 7 meses
03K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: herramienta de lectura de código fuente, que utiliza LLM para analizar el código, proporcionar explicaciones detalladas del código, soporte para una variedad de lenguajes de programación.

Introducción general askrepo es una herramienta de lectura de código fuente basada en LLM (Large Language Model). Puede leer el contenido de un archivo de texto gestionado por Git en un directorio especificado y enviarlo a la API Gemini de Google para proporcionar respuestas a preguntas basadas en preguntas especificadas....
hace 9 meses
03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: un marco RAG para la comprensión de vídeos ultralargos con soporte para la recuperación multimodal y la construcción de grafos de conocimiento

Introducción VideoRAG es un marco generativo de recuperación mejorado diseñado para procesar y comprender vídeos contextuales muy largos. La herramienta combina una base de conocimiento textual basada en grafos con la codificación jerárquica multimodal del contexto para procesar eficientemente en una sola GPU NVIDIA RTX 3090....
hace 6 meses
03K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: Asistente de Chat de Documentos, obtenga respuestas fiables a partir de documentos individuales, fuentes web, soporte a la implantación local.

Introducción general DocsGPT es un asistente de documentación de código abierto diseñado para simplificar el proceso de consulta de la documentación del proyecto. Mediante la integración de un potente modelo GPT , los desarrolladores pueden hacer fácilmente preguntas sobre el proyecto y obtener respuestas precisas.DocsGPT soporta el despliegue local para garantizar la privacidad de los datos mientras...
hace 9 meses
03K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: Las imágenes de retratos con audio generan vídeos de demostración digitales con expresiones faciales vivas

Introducción general Sonic es una innovadora plataforma centrada en la percepción global del audio y diseñada para generar vívidas animaciones de retratos controladas por audio. Desarrollada por un equipo de investigadores de Tencent y la Universidad de Zhejiang, la plataforma utiliza información de audio para controlar las expresiones faciales y los movimientos de la cabeza con el fin de generar vídeos animados naturales y fluidos.S...
hace 4 meses
03K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: herramienta todo en uno para la restauración y edición de imágenes lanzada por Tencent ARC

Introducción general BrushEdit es una herramienta integral de reparación y edición de imágenes desarrollada por Tencent ARC Labs. La herramienta se basa en la última tecnología de IA y es capaz de identificar y reparar automáticamente los defectos en las imágenes, mientras que el apoyo a la edición interactiva por users.BrushEdit combina una variedad de...
hace 8 meses
03K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks: pequeño simio cálculo oral notas inversas, ingeniería inversa y algoritmos de descifrado

Introducción completa Ape Mouth Calculator Reverse Notes es un proyecto de código abierto que tiene como objetivo documentar y compartir el proceso y los métodos de ingeniería inversa de la aplicación Ape Mouth Calculator. El proyecto contiene una variedad de herramientas y técnicas inversas para usar las instrucciones , como Frida, dexdump , etc., para ayudar a los usuarios a entender y descifrar la suma aritmética oral del pequeño simio....
hace 10 meses
03K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: una herramienta de código abierto para ajustar y entrenar modelos lingüísticos de gran tamaño

Introducción Unsloth es un proyecto de código abierto diseñado para proporcionar herramientas eficientes para el ajuste fino y la formación de grandes modelos lingüísticos (LLM). El proyecto soporta una variedad de modelos bien conocidos, incluyendo Llama, Mistral, Phi, y Gemma.Unsloth...
hace 6 meses
02.9K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: dobles de IA entrenados localmente con recuerdos y hábitos personales.

Second Me es un proyecto de código abierto desarrollado por el equipo Mindverse que te permite crear una IA en tu ordenador que actúa como un "doble digital", aprendiendo tus patrones y hábitos de habla a través de tus palabras y recuerdos, y convirtiéndose en una persona inteligente que entiende tus...
hace 5 meses
02.9K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: una inteligencia que integra más de 500 herramientas de investigación para automatizar las tareas científicas y de investigación.

Introducción completa SciToolAgent es una plataforma de herramientas de código abierto desarrollada por el Centro de Innovación de la Universidad de Zhejiang en Hangzhou (HICAI-ZJU). Integra más de 500 herramientas científicas a través de tecnologías de grafos de conocimiento (SciToolKG) y modelado de grandes lenguajes para ayudar a los investigadores a enfrentarse a...
hace 5 meses
02.9K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: lectura de archivos de texto de repositorios git y fragmentación rápida de modelos de gran tamaño

Introducción general Yek es una herramienta rápida basada en Rust para leer archivos de texto de repositorios o directorios, trocearlos y serializarlos para su uso en grandes modelos lingüísticos (LLM). La herramienta utiliza la regla .gitignore por defecto para omitir archivos innecesarios, y utiliza...
hace 7 meses
02.9K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: una interfaz de chat limpia para interactuar con los modelos nativos de Ollama

Introducción general HiOllama es una interfaz fácil de usar basada en Python y Gradio, diseñada para interactuar con los modelos de Ollama. Proporciona una interfaz web sencilla e intuitiva que admite la generación de texto en tiempo real y funciones de gestión de modelos. Los usuarios pueden ajustar parámetros como la temperatura y la mayoría...
hace 9 meses
02.9K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: una herramienta de código abierto para transformar fotos y vídeos en anime estilizado

Introducción general DCT-Net es un proyecto de código abierto desarrollado por la Academia DAMO y el Instituto Wang Xuan de Tecnología Informática de la Universidad de Pekín, cuyo objetivo es la transformación anime estilizada de imágenes. El proyecto utiliza técnicas de aprendizaje profundo a través de la Traducción Calibrada por Dominio (Domain-Calibrat...
hace 7 meses
02.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...
hace 7 meses
02.9K
E2B:安全云沙箱中的AI代码运行平台

E2B: plataforma de ejecución de código de inteligencia artificial en un entorno seguro en la nube

Introducción general E2B es una plataforma de código abierto diseñada para ejecutar código generado por IA en un entorno seguro en la nube. Es compatible con una amplia gama de lenguajes y marcos de programación y proporciona un entorno virtual aislado para garantizar la seguridad y la fiabilidad de la ejecución del código.
hace 7 meses
02.9K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: extensión de ayuda de IA que mejora la experiencia de desarrollo de VSCode, la anotación con un solo clic, la conversión y la generación de interfaz de usuario de código.

Introducción general AIDE (AI-assisted Development Extension) es una potente extensión de desarrollo asistido por IA para VSCode, centrada en proporcionar una asistencia de programación de IA única y útil. Es diferente de GitHu...
hace 7 meses
02.9K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos: herramienta de código abierto para la creación de documentos de identidad inteligentes con IA

Introducción completa HivisionIDPhotos es una herramienta de producción de fotos de documentos AI ligera de código abierto, puede identificar de forma inteligente la escena de la foto del usuario y la clave, para generar una foto de documento estándar en línea con una variedad de especificaciones. La herramienta soporta colores de fondo y tamaños personalizados, y en el futuro también lanzará...
hace 11 meses
02.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: Base de conocimientos + LLM Mentor inteligente de revisión de código para GitHub

Introducción completa CR-Mentor es una herramienta inteligente de revisión de código que combina una base de conocimientos profesional con la potencia de Large Language Modelling (LLM). No sólo admite la revisión de código para todos los lenguajes de programación, sino que también personaliza criterios de revisión exclusivos y áreas de enfoque para los equipos basándose en las mejores prácticas acumuladas en la base de conocimientos. A través de...
hace 9 meses
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: interfaz de chat para visualizar conversaciones basadas en árboles

Introducción general TreeGPT es una aplicación de chat de código abierto basada en Next.js, centrada en la visualización de conversaciones con grandes modelos lingüísticos (LLMs, por sus siglas en inglés, p. ej., GPTs) a través de estructuras de grafos en árbol (grafos acíclicos dirigidos, DAGs), sustituyendo a los métodos de chat lineales tradicionales para mejorar la velocidad y...
hace 6 meses
02.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: análisis sintáctico de documentos de formato complejo y extracción de datos multimodales en metadatos y texto

Introducción completa NV Ingest (NVIDIA Ingest) es un conjunto de microservicios de acceso temprano diseñados para analizar cientos de miles de PDF complejos y desordenados sin estructurar y otros documentos empresariales. Puede convertir estos documentos en metadatos y texto para incrustarlos en...
hace 7 meses
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: un sistema avanzado de recuperación de IA (RAG) para el análisis sintáctico de contenidos multimodales y la combinación del grafo de conocimiento con la búsqueda híbrida

Introducción completa R2R (RAG to Riches) es un sistema avanzado de recuperación de IA que admite la funcionalidad de generación aumentada de recuperación (RAG) con características listas para la producción. Construido sobre una API RESTful en contenedores, el sistema proporciona análisis de contenido multimodal, funcionalidad de búsqueda híbrida...
hace 8 meses
02.9K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalación con un solo clic de modelos de inteligencia artificial e interfaces de chat en ordenadores personales (con DeepSeek)

Introducción general AingDesk es un software de código abierto y gratuito diseñado para ayudar a los usuarios a implementar y ejecutar fácilmente varios modelos de IA en sus ordenadores locales. Ya se trate de un modelo DeepSeek o Llama, AingDesk permite una sencilla...
hace 6 meses
02.9K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: una API unificada para integrar la generación de voz bien conocida, la transcripción de voz y el modelado de voz

Introducción general Orate es un conjunto de herramientas de IA centrado en la generación y transcripción de voz. Proporciona una API unificada que se integra a la perfección con los principales proveedores de IA, como OpenAI, ElevenLabs y AssemblyAI, para ayudar a...
hace 6 meses
02.9K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: un marco de código abierto para construir aplicaciones modulares de GAR y probar rápidamente diversas estrategias de GAR.

Introducción general Cognita es un marco de código abierto desarrollado por TrueFoundry para simplificar el desarrollo de aplicaciones basadas en RAG (Retrieval-Augmented Generation). El framework proporciona un entorno estructurado, mod...
hace 7 meses
02.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Una interfaz fácil de usar para ComfyUI para agilizar el flujo de trabajo

Introducción general ComfyUI-disty-Flow es un nodo personalizado que proporciona una interfaz de usuario amigable para ComfyUI. Está pensado para simplificar la ejecución de flujos de trabajo proporcionando una interfaz de usuario alternativa a la creación de flujos de trabajo.ComfyUI-disty...
hace 7 meses
02.9K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: integra fácilmente múltiples modelos de IA y crea aplicaciones multimodales basadas en Gradio

Introducción general ai-gradio es un conjunto de herramientas Python de código abierto diseñado para ayudar a los desarrolladores a integrar y utilizar fácilmente múltiples modelos de IA. Construido sobre Gradio, el proyecto proporciona una interfaz unificada para soportar múltiples modelos y servicios de IA. Ya sea texto, voz o vídeo...
hace 6 meses
02.9K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: modelo texto-imagen para generar imágenes de alta calidad, con soporte para generar carteles chinos

Introducción exhaustiva Kolors es un modelo de generación de texto a imagen a gran escala desarrollado por el equipo Racer, basado en técnicas de difusión de potencial. El modelo se ha entrenado con miles de millones de pares de datos de texto-imagen y es capaz de generar imágenes complejas de alta calidad y precisión semántica con soporte para entradas en chino e inglés.Kolors en calidad visual...
hace 8 meses
02.9K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: una herramienta de evaluación visual para optimizar los sistemas de generación de mejoras de la recuperación

Introducción completa XRAG (eXamining the Core) es un marco de evaluación comparativa diseñado para evaluar los componentes subyacentes de los sistemas avanzados de generación de aumento de la recuperación (RAG). Mediante el perfilado y análisis de cada módulo central, XRAG proporciona información sobre cómo afectan las distintas configuraciones y componentes a los sistemas RAG....
hace 7 meses
02.9K
Supermemory:导入书签和网页内容构建个人知识库

Supermemoria: importar marcadores y contenidos web para crear una base de conocimientos personal

Introducción general Supermemory es un proyecto de código abierto diseñado para ayudar a los usuarios a construir su "segundo cerebro". Con una potente extensión de Chrome y tecnología de IA, permite a los usuarios guardar, organizar y recuperar fácilmente datos de páginas web, marcadores de Twitter...
hace 6 meses
02.9K