Proyecto AI de código abierto

Total 1020 artículos
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch: una herramienta de visualización para supervisar y optimizar los procesos de LLM basada en el marco DSPy

Introducción completa LangWatch es una plataforma completa diseñada para las operaciones de grandes modelos lingüísticos (LLM), que proporciona supervisión, análisis, evaluación, gestión de conjuntos de datos y optimización de pistas. La plataforma se basa en el marco DSPy de la Universidad de Stanford y está diseñada para ayudar a los usuarios a gestionar y optimizar mejor...
hace 7 meses
02K
PR Agent:自动化拉取请求分析工具

PR Agent: herramienta automatizada de análisis de pull requests

Introducción general PR-Agent es una herramienta de código abierto desarrollada por Qodo para automatizar el procesamiento de pull requests (solicitudes de extracción) mediante tecnología de IA. La herramienta es capaz de proporcionar retroalimentación automatizada, sugerencias y análisis para ayudar a los desarrolladores a realizar revisiones de código de manera más eficiente....
hace 7 meses
02.4K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: Plataforma de código abierto de modelización de grandes lenguajes financieros para análisis y predicción financiera

Introducción general FinGPT es una plataforma de modelización de gran lenguaje financiero de código abierto desarrollada por la AI4Finance Foundation, diseñada para que el sector financiero resuelva tareas financieras complejas e impulse la innovación en fintech.FinGPT utiliza técnicas de adaptación ligera y enfoques de aprendizaje de refuerzo....
hace 7 meses
02.6K
Coding Agent:基于Langgraph构建的简单编程助手

Agente de codificación: un sencillo asistente de programación basado en Langgraph

Introducción general Coding Agent es un asistente de programación inteligente desarrollado por AbhinavTheDev, diseñado para ayudar a los desarrolladores a mejorar su eficiencia en la programación. La herramienta utiliza tecnología de inteligencia artificial para generar código de forma automática, proporcionar sugerencias de programación y ayudar a los desarrolladores...
hace 7 meses
02.6K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: evaluación de la memoria RAG Precisión de la GC y correlación de respuestas

Introducción exhaustiva Ragas es una herramienta diseñada específicamente para evaluar y optimizar sistemas de Generación Aumentada de Recuperación (RAG). Proporciona un amplio conjunto de métricas de evaluación mediante el análisis de las relaciones entre consultas, contextos de recuperación y respuestas generadas. Estas métricas incluyen fidelidad, relevancia de la respuesta, relevancia del contexto, on...
hace 7 meses
03K
VeighNa:国内流行的开源量化交易框架

VeighNa: un marco de comercio cuantitativo de código abierto muy popular en China

Introducción exhaustiva VeighNa es una plataforma de negociación cuantitativa de código abierto basada en Python, desarrollada originalmente por operadores privados nacionales y lanzada oficialmente en 2015. Ha evolucionado desde un simple paquete de interfaz de negociación hasta un marco de desarrollo de negociación totalmente funcional. Los usuarios incluyen fondos de capital privado, certificados...
hace 5 meses
03.8K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter: la alternativa sin censura de código abierto a Character.AI

Introducción general OpenCharacter es una herramienta de creación de personajes de código abierto diseñada para proporcionar a los usuarios una experiencia de creación e interacción de personajes de IA ilimitada y sin filtros como alternativa a Character.AI. Los usuarios pueden crear y ejecutar sus propios personajes utilizando modelos nativos, o...
hace 7 meses
03.6K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: un marco de código abierto para ejecutar eficazmente tareas de IA y por lotes en cualquier nube

Introducción general SkyPilot es un marco de código abierto iniciado por el Sky Computing Lab de la Universidad de California, Berkeley, diseñado para ayudar a los usuarios a ejecutar eficientemente tareas de IA y procesamiento por lotes en cualquier infraestructura de nube. Es compatible con más de 14 servicios en la nube (incluidos ...
hace 6 meses
02K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: ¡la forma más rápida de ejecutar y ajustar LLM localmente!

Introducción general LlamaEdge es un proyecto de código abierto diseñado para simplificar el proceso de ejecución y puesta a punto de grandes modelos lingüísticos (LLM) en dispositivos locales o edge. El proyecto es compatible con la familia de modelos Llama2 y proporciona servicios API compatibles con OpenAI que permiten a los usuarios crear y ejecutar fácilmente...
hace 7 meses
02.5K
AutoGen:微软开发的多智能体对话框架

AutoGen: un marco de diálogo corporal multiinteligente desarrollado por Microsoft

Introducción general AutoGen es un marco de código abierto desarrollado por un equipo de investigadores de Microsoft centrado en simplificar la creación de grandes aplicaciones de modelos de lenguaje (LLM) mediante el diálogo entre cuerpos multiinteligentes. Permite a los desarrolladores crear agentes de IA que pueden dialogar entre sí y colaborar para resolver tareas. Este enfoque no sólo mejora el rendimiento de los LLM...
hace 7 meses
03.4K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: complemento del asistente web para el diálogo nativo con modelos de IA y la recuperación de documentos

Introducción general Page Assist es una extensión de navegador de código abierto diseñada para proporcionar a los usuarios una forma sencilla de interactuar con modelos locales de IA. Con esta extensión, los usuarios pueden abrir una barra lateral en cualquier página web para interactuar con modelos de IA que se ejecutan localmente.Page Assi...
hace 4 meses
04.6K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboración multiagente para el asistente de explotación de dispositivos móviles

Introducción general MobileAgent es un potente asistente de operación de dispositivos móviles diseñado para mejorar la eficiencia y la automatización de la operación de dispositivos móviles a través de la colaboración multi-agente y módulos de percepción visual mejorada. Está desarrollado por el equipo de X-PLUG y es compatible con Android y ...
hace 7 meses
03.3K
Orama:高性能全文本和向量搜索引擎

Orama: un motor de búsqueda vectorial y de libros a texto completo de alto rendimiento

Introducción general Orama es un motor de búsqueda de código abierto y alto rendimiento , escrito íntegramente en TypeScript , que soporta búsqueda de texto completo , búsqueda vectorial y búsqueda híbrida.Orama está diseñado para funcionar en cualquier entorno de ejecución JavaScript , proporcionando ...
hace 7 meses
02.9K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter: herramienta de edición de imágenes estilo garabato con IA

Introducción general FramePainter es una revolucionaria herramienta de edición de imágenes basada en IA que utiliza una avanzada tecnología de difusión de vídeo y controles intuitivos Sketch para ayudar a los usuarios a lograr fácilmente una compleja edición de imágenes. Tanto si se trata de un simple ajuste como de una compleja transformación creativa, Fr...
hace 7 meses
03.1K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.

Introducción general TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle su ordenador a través de la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar...
hace 7 meses
02.9K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: uso ilimitado de AI IDEs mediante herramientas de automatización (por ejemplo, Cursor y Windsurf)

Descripción general AI Auto Free es una potente herramienta de automatización diseñada para ayudar a los usuarios a hacer un uso ilimitado de los Entornos de Desarrollo Integrado (IDE) basados en IA, como Cursor y Windsurf. El proyecto ofrece soporte multiplataforma e incluye múltiples funciones de lenguaje...
hace 7 meses
02.7K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: un marco para la colaboración multiinteligente en clústeres

Quantum Swarm es un marco de inteligencia artificial de código abierto centrado en el desarrollo y la investigación de inteligencia poblacional AI. El proyecto es mantenido por el equipo de Quarm AI en GitHub y tiene como objetivo proporcionar una plataforma flexible y eficiente para construir y probar sistemas multiinteligencia.Quan...
hace 7 meses
03.2K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: una herramienta de evaluación visual para optimizar los sistemas de generación de mejoras de la recuperación

Introducción completa XRAG (eXamining the Core) es un marco de evaluación comparativa diseñado para evaluar los componentes subyacentes de los sistemas avanzados de generación de aumento de la recuperación (RAG). Mediante el perfilado y análisis de cada módulo central, XRAG proporciona información sobre cómo afectan las distintas configuraciones y componentes a los sistemas RAG....
hace 7 meses
02.9K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan: embellece artículos Markdown con un solo clic, se adapta al formato de múltiples plataformas multimedia propias (cliente local de código abierto)

Introducción general WenYan es una herramienta diseñada para la composición tipográfica y el embellecimiento de artículos Markdown, que permite convertir artículos Markdown editados en un formato adecuado para WeChat, Zhihu, Today's headlines y otras plataformas. Los usuarios pueden copiar el artículo directamente con un clic...
hace 7 meses
02.2K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: Herramienta de resumen de cronologías de noticias para mejorar la recuperación de noticias y la eficacia en la generación de cronologías

Introducción general CHRONOS es una herramienta de resumen cronológico de noticias desarrollada por el equipo de PNL de Alibaba. CHRONOS no solo es capaz de gestionar tareas de resumen cronológico de dominio abierto, sino que también es eficiente y escalable....
hace 7 meses
02.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: Controla el movimiento de los objetos en el vídeo, añadiendo o restando cualquier objeto en movimiento en el vídeo.

Introducción general Go-with-the-Flow es un proyecto de código abierto desarrollado por el equipo de investigación de Netflix Eyeline Studios para controlar los patrones de movimiento de los modelos de difusión de vídeo mediante la distorsión del ruido. El proyecto permite al usuario determinar cómo la cámara de la escena y...
hace 7 meses
02.5K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de generación de poses para hacer bailar las fotos de Missy

Introducción general X-Dyna es un proyecto de código abierto desarrollado por ByteDance para generar animaciones dinámicas de retratos utilizando técnicas de difusión de muestra cero. El proyecto utiliza expresiones faciales y movimientos corporales en vídeo de unidad para animar imágenes de retratos individuales, generando efectos de movimiento realistas y conscientes del contexto.X-D...
hace 7 meses
02.7K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): generación de activos 3D de alta resolución, múltiples flujos de trabajo de generación de materiales 3D

Introducción Tencent Hunyuan3D (Hunyuan3D 2.0) es un avanzado sistema de composición 3D a gran escala de Tencent diseñado para generar activos 3D texturizados de alta resolución. El sistema consta de dos componentes principales: Hunyuan3D-DiT, un modelo de generación de formas a gran escala, y Hunyuan3D-DiT, un...
hace 7 meses
03.6K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Creación de un sistema inteligente de preguntas y respuestas sobre documentos y creación sencilla de una base de conocimientos web privada

Introducción completa RAG Web UI es un sistema de diálogo inteligente basado en la tecnología RAG (Retrieval Augmented Generation). Ayuda a empresas y particulares a crear sistemas inteligentes de preguntas y respuestas basados en su propia base de conocimientos. Combinando la recuperación de documentos y grandes modelos lingüísticos, RAG Web UI proporciona...
hace 7 meses
02.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicación de escritorio de Intelligentsia para controlar ordenadores mediante lenguaje natural

Introducción general UI-TARS Desktop es una aplicación de agente de interfaz gráfica basada en UI-TARS (Visual Language Model) desarrollada por ByteDance. La aplicación permite a los usuarios controlar los ordenadores a través del lenguaje natural para una interacción humano-ordenador más intuitiva y eficiente.UI-TAR...
hace 7 meses
03.1K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix: empaquetado de la base de código en un archivo de texto para la recuperación de modelos de gran tamaño.

Introducción general Repomix (antes conocido como Repopack) es una herramienta de código abierto diseñada para empaquetar todo un código base en un único archivo compatible con IA. Esta herramienta permite a los desarrolladores poner fácilmente su código base a disposición de grandes modelos lingüísticos (como Claude, Chat...
hace 7 meses
03.3K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: lectura de archivos de texto de repositorios git y fragmentación rápida de modelos de gran tamaño

Introducción general Yek es una herramienta rápida basada en Rust para leer archivos de texto de repositorios o directorios, trocearlos y serializarlos para su uso en grandes modelos lingüísticos (LLM). La herramienta utiliza la regla .gitignore por defecto para omitir archivos innecesarios, y utiliza...
hace 7 meses
03K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: inteligencias polivalentes que revisan, validan y formatean los resultados para obtener resultados de alta calidad.

Introducción exhaustiva Kheish es un agente multirol de código abierto diseñado para tareas de modelado de grandes lenguajes (LLM) que requieren una colaboración estructurada paso a paso.Kheish es más que un simple coordinador, es un agente inteligente por derecho propio, que solicita módulos bajo demanda, integra...
hace 7 meses
02.8K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: una versátil herramienta de creación de contenidos de IA para generar historias cortas, guiones de diálogos, voces en off y gráficos.

Descripción general AI ContentCraft es una versátil herramienta de creación de contenidos que integra generación de texto, síntesis de voz, generación de imágenes y mucho más. Ayuda a los creadores a generar rápidamente historias, guiones de podcasts y contenidos de audio y vídeo complementarios. La herramienta admite conversiones a varios idiomas y puede...
hace 7 meses
03K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: creación de grafos de conocimiento y motores de búsqueda personales de ejecución local

Introducción general Unigraph es un grafo de conocimiento de propósito general y motor de búsqueda personal diseñado para proporcionar a los usuarios un espacio de trabajo integrado que les ayude a gestionar y buscar una amplia variedad de datos en su vida personal. Con Unigraph, los usuarios pueden integrar datos de distintas fuentes en un...
hace 7 meses
02.7K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Una interfaz fácil de usar para ComfyUI para agilizar el flujo de trabajo

Introducción general ComfyUI-disty-Flow es un nodo personalizado que proporciona una interfaz de usuario amigable para ComfyUI. Está pensado para simplificar la ejecución de flujos de trabajo proporcionando una interfaz de usuario alternativa a la creación de flujos de trabajo.ComfyUI-disty...
hace 7 meses
03K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: una herramienta de pruebas automatizadas con IA que utiliza el lenguaje natural para realizar pruebas de principio a fin

Introducción general Shortest es un marco de pruebas de extremo a extremo en lenguaje natural basado en IA desarrollado por el equipo Anti-Work. Se basa en Playwright y admite la integración con GitHub y la autenticación de dos factores (2FA)....
hace 7 meses
03.3K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: un complemento de código abierto que impulsa las pruebas de automatización del navegador con IA

Introducción general Midscene.js es una herramienta de automatización del navegador impulsada por IA que controla páginas web, realiza aserciones y extrae datos a través de comandos de lenguaje natural. Es compatible con extensiones de Chrome, SDK de JavaScript y scripts YAML, lo que simplifica la medición de la IU....
hace 7 meses
03.4K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Analizador de vídeo: analiza el contenido de los vídeos y genera descripciones detalladas.

Comprehensive Introduction Video Analyzer es una completa herramienta de análisis de vídeo que combina técnicas de visión por ordenador, transcripción de audio y procesamiento del lenguaje natural para generar descripciones detalladas del contenido del vídeo. La herramienta transcribe el contenido de audio extrayendo fotogramas clave del vídeo....
hace 6 meses
04.2K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: una herramienta de código abierto para ajustar y entrenar modelos lingüísticos de gran tamaño

Introducción Unsloth es un proyecto de código abierto diseñado para proporcionar herramientas eficientes para el ajuste fino y la formación de grandes modelos lingüísticos (LLM). El proyecto soporta una variedad de modelos bien conocidos, incluyendo Llama, Mistral, Phi, y Gemma.Unsloth...
hace 6 meses
03K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de preguntas y respuestas con base de conocimientos de inteligencia artificial para un servicio de atención al cliente inteligente y una base de conocimientos interna.

Introducción general MaxKB (Max Knowledge Base) es un sistema de preguntas y respuestas de base de conocimientos de código abierto basado en grandes modelos lingüísticos y RAG (Retrieval Augmented Generation). El sistema es ampliamente utilizado en el servicio al cliente inteligente, base de conocimiento interno de la empresa, la investigación académica y la educación y otros escenarios.MaxKB...
hace 7 meses
03.6K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: un marco de escritura para generar ensayos largos de alta calidad, buscando conocimientos externos y reflexionando sobre ellos para construir paso a paso un árbol de conocimientos.

Introducción OmniThink es un innovador marco de escritura automática diseñado para generar ensayos largos de alta calidad imitando la expansión iterativa y la reflexión de los procesos cognitivos humanos. OmniThink se centra en ampliar los límites del conocimiento y generar información rica y profunda....
hace 7 meses
02.6K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes en tiempo real de OpenAI: una aplicación multiinteligente de interacción cuerpo-voz (ejemplo de OpenAI)

Introducción General OpenAI Realtime Agents es un proyecto de código abierto que tiene como objetivo mostrar cómo la API en tiempo real de OpenAI se puede utilizar para construir aplicaciones de voz corporal multi-inteligente. Proporciona un modelo de cuerpo inteligente de alto nivel (tomado de OpenAI Swarm) que permite...
hace 7 meses
03.5K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: reproducción de imágenes de retratos con luz natural (inédito)

Descripción general SynthLight es una herramienta de reiluminación de retratos basada en un modelo de difusión. Aprende a volver a renderizar imágenes faciales sintéticas para conseguir ajustes de efectos de iluminación en fotos de retratos reales. La herramienta utiliza un motor de renderizado físico para generar conjuntos de datos que simulan transformaciones de la iluminación en diferentes condiciones de luz...
hace 7 meses
03.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversión de imágenes a Markdown, modelo visual OCR de alta precisión

Introducción general Zerox es un proyecto de código abierto diseñado para convertir PDF, DOCX, imágenes y otros documentos a formato Markdown a través de modelos visuales. El proyecto ha sido desarrollado por el equipo getomni-ai y proporciona una solución OCR (Reconocimiento Óptico de Caracteres) sencilla y eficiente.
hace 7 meses
03.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Descripción general Charla es una aplicación de chat basada en endpoints diseñada para entablar diálogos con modelos lingüísticos nativos. La aplicación se integra con el backend Ollama, admite diálogos contextuales y guarda las sesiones de chat como archivos Markdown. Los usuarios pueden...
hace 7 meses
02.9K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: Marco de Generación Mejorada de Recuperación Simplificada, Índice de Grafos de Entidades Recupera Bloques de Texto Relevantes

Una introducción exhaustiva MiniRAG es un marco de trabajo de Generación Aumentada de Recuperación (RAG) extremadamente sencillo que pretende permitir un buen rendimiento de la RAG incluso para modelos pequeños mediante la indexación de grafos heterogéneos y la recuperación mejorada por topología ligera. Ha sido desarrollado por el Laboratorio de Ciencia de Datos de la Universidad de Hong Kong (HKUDS) para ...
hace 7 meses
03.4K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: un gran modelo multimodal de comprensión regional de imágenes y vídeos para mejorar el análisis del contenido visual

Introducción exhaustiva Omni-RGPT es un modelo de lenguaje multimodal de gran tamaño diseñado para permitir la comprensión a nivel de región de imágenes y vídeos. Mediante la introducción de la técnica Token Mark, Omni-RGPT es capaz de resaltar la región objetivo en el espacio de características visuales e indicar la región objetivo mediante pistas de región (por ejemplo, recuadros o...
hace 7 meses
02.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: un asistente de diálogo de voz de código abierto y baja latencia para la conversación y la comunicación naturales

Introducción Bailing (Bailing) es un asistente de diálogo por voz de código abierto diseñado para entablar un diálogo natural con los usuarios a través del habla. El proyecto combina tecnologías de reconocimiento del habla (ASR), detección de la actividad de la voz (VAD), modelado amplio del lenguaje (LLM) y síntesis del habla (TTS) para lograr...
hace 7 meses
03.3K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI: versión de código abierto de una herramienta de clonación humana digital y generación de vídeos cortos con IA

Introducción completa Metaverse AI (versión de código abierto) es un proyecto alojado en GitHub, desarrollado por el equipo libn-net. Puede clonar imágenes y voces humanas digitales mediante tecnología de IA para generar vídeos cortos, y también admite doblaje y subtitulación. Esta herramienta proporciona...
hace 5 meses
01.7K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: una herramienta de chat para recuperar conocimientos a partir de datos de Wikipedia

Introducción general WikiChat es un chatbot experimental desarrollado en la Universidad de Stanford que pretende mejorar la factualidad de los grandes modelos lingüísticos recuperando datos de Wikipedia. Los grandes modelos lingüísticos (como ChatGPT y GPT-4) tienden a procesar información actualizada o temas menos populares cuando...
hace 7 meses
02.2K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: un marco eficiente para crear aplicaciones colaborativas multiinteligentes

Introducción general AIEvo es el marco multiagente de código abierto de Ant Group diseñado para crear aplicaciones multiagente de forma eficiente. El framework sigue estrictamente el grafo de tareas SOP para mejorar la tasa de éxito en la ejecución de tareas complejas, y garantiza una alta flexibilidad y escalabilidad mediante mecanismos de retroalimentación y monitorización.AIEvo ha sido producido dentro de Ant Group...
hace 7 meses
02.5K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: generación y evaluación automáticas de presentaciones PPT, documentos a PPT

Introducción general PPTAgent es un sistema innovador diseñado para generar automáticamente presentaciones a partir de documentos. El sistema se inspira en el enfoque humano de la creación de presentaciones, utilizando un proceso de dos pasos para garantizar la calidad del contenido y el impacto visual. Además, PPTAgent presenta PPTEval, un completo...
hace 7 meses
02.9K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: Creación de una interfaz de arrastrar y soltar nodos para aplicaciones LLM personalizadas

Introducción general FlowiseAI es una herramienta de código abierto y bajo código diseñada para ayudar a los desarrolladores a crear aplicaciones LLM (Large Language Model) personalizadas y agentes de IA. Con una sencilla interfaz de arrastrar y soltar, los usuarios pueden crear e iterar rápidamente aplicaciones LLM, haciendo más eficiente el proceso desde las pruebas hasta la producción....
hace 7 meses
03.1K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: herramienta de conversión de voz a texto en tiempo real para el reconocimiento del habla en streaming de baja latencia basada en Whisper.

Introducción general RealtimeSTT es una eficaz biblioteca de conversión de voz a texto en tiempo real de baja latencia con detección avanzada de la actividad del habla y activación de la palabra de despertador. Ha sido desarrollada por Kolja Beigel para dar soporte a aplicaciones que requieren una conversión de voz a texto...
hace 7 meses
03K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: implementación rápida de la deduplicación semántica de textos para mejorar la eficacia de la limpieza de datos

Introducción completa SemHash es una herramienta ligera y flexible para desduplicar conjuntos de datos por similitud semántica. Combina la rápida generación de incrustaciones de Model2Vec con la eficaz búsqueda de similitud RNA (vecino más cercano aproximado) de Vicinity.SemHa...
hace 7 meses
02.8K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: un marco de código abierto para construir aplicaciones modulares de GAR y probar rápidamente diversas estrategias de GAR.

Introducción general Cognita es un marco de código abierto desarrollado por TrueFoundry para simplificar el desarrollo de aplicaciones basadas en RAG (Retrieval-Augmented Generation). El framework proporciona un entorno estructurado, mod...
hace 7 meses
03K
BotSharp:基于.NET的多智能体AI应开发与管理平台

BotSharp: plataforma de desarrollo y gestión de inteligencia artificial basada en .NET

Introducción completa BotSharp es un proyecto de código abierto basado en .NET Core dedicado a proporcionar una herramienta completa de creación de plataformas de chatbot de IA. Utiliza programación C#, soporta el funcionamiento multiplataforma y tiene como objetivo simplificar la aplicación de algoritmos de aprendizaje automático, permitiendo a los desarrolladores de nivel empresarial...
hace 7 meses
02.9K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: un marco corporal inteligente para construir dispositivos inteligentes multimodales

Introducción general OmAgent es un marco de cuerpo inteligente multimodal desarrollado por Om AI Lab, con el objetivo de proporcionar potentes funciones impulsadas por IA para dispositivos inteligentes. Mediante la integración de modelos base multimodales de última generación y algoritmos de cuerpo inteligente, el proyecto permite a los desarrolladores crear dispositivos inteligentes eficientes en una variedad de...
hace 7 meses
02.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: un completo conjunto de herramientas para construir inteligencias IA basadas en LangGraph

Introducción El AI Agent Service Toolkit es un conjunto de herramientas completo basado en LangGraph, FastAPI y Streamlit, diseñado para ayudar a los desarrolladores a crear y ejecutar rápidamente servicios de agentes de IA. El conjunto de herramientas proporciona...
hace 7 meses
02.7K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: construcción de módulos de memoria de IA humanizada para guardar y actualizar información sobre interacciones con humanos.

Introducción general Memora es un agente diseñado para replicar los recuerdos humanos en cada IA personalizada. Ayuda a las IAs a recordar detalles de interacciones pasadas, emociones y experiencias compartidas al igual que lo hacen los humanos a través de características como memorias con marca de tiempo, marcadores de emoción y memorias multimodales.Memora soporta multi-tenancy y es capaz de manejar...
hace 7 meses
03K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Microagente: inteligencia artificial de programación que genera código automáticamente y lo prueba y corrige.

Introducción general Micro-Agent es un asistente de codificación de IA de código abierto desarrollado por Builder.io, diseñado para proporcionar a los desarrolladores la capacidad de generar y probar código automáticamente. Genera casos de prueba mediante la comprensión de descripciones en lenguaje natural e itera el código hasta que todas las pruebas pasan, reduciendo...
hace 7 meses
03.2K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: flujos de trabajo corporales inteligentes basados en lenguaje natural para la automatización de escritorios y navegadores

Introducción general Eko es un marco JavaScript de nivel de producción diseñado para construir flujos de trabajo de agentes inteligentes eficientes mediante descripciones en lenguaje natural. Está diseñado para permitir a los desarrolladores automatizar tareas cotidianas utilizando tecnologías de IA sin necesidad de programac...
hace 5 meses
02.7K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: una interfaz de gestión para la interacción persona-ordenador con inteligencias IA

Introducción general Agent Inbox es un proyecto de código abierto desarrollado por el equipo LangChain para proporcionar una nueva experiencia de usuario para interactuar con inteligencias AI. El proyecto permite a los usuarios gestionar y optimizar las interacciones con múltiples inteligencias IA a través de una interfaz centralizada.Ag...
hace 7 meses
02.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: un asistente inteligente para las redes sociales que genera y gestiona automáticamente los contenidos de las mismas.

Introducción general Social Media Agent (Agente de Medios Sociales) es un proyecto de código abierto que gestiona la información de interacción mediante el nuevo Agent Inbox, diseñado para ayudar a los usuarios a automatizar la generación y gestión de contenidos de medios sociales. El proyecto está desarrollado por el equipo LangChain...
hace 7 meses
02.7K
Executive AI Assistant:AI行政助理,提醒阅读邮件并规划工作日程

Asistente ejecutivo AI: AI asistente ejecutivo, recordatorios para leer correos electrónicos y planificar horarios de trabajo.

Introducción general Executive AI Assistant (EAIA) es una herramienta de asistencia basada en IA diseñada para ayudar a los usuarios a automatizar y gestionar sus tareas diarias. Desarrollada por LangChain, la herramienta es capaz de gestionar correos electrónicos, programar, gestionar tareas y otras...
hace 7 meses
02.8K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: una herramienta automatizada de coloreado de líneas para colorear rápidamente dibujos anime de líneas en blanco y negro.

Introducción exhaustiva MangaNinjia es un proyecto de código abierto desarrollado por Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), centrado en el procesamiento automatizado del coloreado de dibujos lineales. Esta herramienta consigue un ajuste preciso del color de las imágenes de referencia mediante técnicas de aprendizaje profundo, mejorando enormemente...
hace 7 meses
02.6K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: Generar audiolibros, convertir libros electrónicos en audiolibros con Kokoro

Introducción general Audiblez es un proyecto de código abierto diseñado para convertir libros electrónicos (por ejemplo, en formato .epub) en audiolibros (por ejemplo, en formato .m4b). El proyecto utiliza la tecnología de síntesis de voz de alta calidad de Kokoro para soportar múltiples idiomas y múltiples voces. Los usuarios pueden...
hace 7 meses
03.4K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Búsqueda o1: Capacitar a los modelos de inferencia para la búsqueda activa, permitiendo a los grandes modelos buscar conocimiento externo mientras piensan.

Introducción general Search-o1 es un proyecto de código abierto cuyo objetivo es mejorar el rendimiento de los modelos de razonamiento a gran escala (LRM) mediante la integración de mecanismos de búsqueda avanzada. La idea central es resolver el problema del déficit de conocimiento que se produce en el proceso de razonamiento mediante la búsqueda dinámica y la integración del conocimiento. El proyecto está patrocinado por sunn...
hace 7 meses
02.4K
Llama 3.2 Reasoning WebGPU:在浏览器中运行LLama-3.2

WebGPU de razonamiento de Llama 3.2: ejecución de Llama-3.2 en un navegador

Introducción general Transformers.js es una biblioteca JavaScript proporcionada por Hugging Face diseñada para ejecutar modelos de aprendizaje automático de última generación directamente en el navegador, sin soporte de servidor. La librería funciona conjuntamente con la plataforma Hugging Fa...
hace 7 meses
02.2K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: Genere y publique automáticamente vídeos cortos de YouTube y contenido de Twitter

Introducción General MoneyPrinter V2 es un proyecto de código abierto desarrollado por FujiwaraChoki para ayudar a los usuarios a ganar dinero en línea a través de la automatización. El proyecto integra principalmente la automatización de Twitter, la generación de vídeos cortos de YouTube y el camping de afiliados....
hace 7 meses
03.5K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: una aplicación de traducción de voz en tiempo real para Android, ¡gratis y sin conexión!

Introducción general RTranslator es una aplicación de traducción en tiempo real, prácticamente gratuita y de código abierto diseñada para dispositivos Android. Los usuarios pueden mantener su teléfono en el bolsillo mediante la conexión de un auricular Bluetooth y mantener una conversación con otros como si estuvieran hablando su propio idioma.RTransla...
hace 7 meses
03.2K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

Gemini Next Chat: ¡Despliegue gratis su aplicación privada multimodal Gemini con un solo clic!

Introducción general Gemini Next Chat es un proyecto de código abierto diseñado para ayudar a los usuarios a desplegar fácilmente aplicaciones Gemini privadas. El proyecto soporta los modelos multimodales Gemini 1.5 y Gemini 2.0 , los usuarios pueden desplegar con un click en Vercel...
hace 7 meses
02.4K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: Generación de código de automatización del navegador para convertir acciones del ratón en scripts Selenium Python mediante IA

Introducción general AutoMouser es una extensión de Chrome que rastrea de forma inteligente las interacciones del usuario y genera automáticamente código de prueba Selenium utilizando los modelos GPT de OpenAI. Para ello, registra las acciones del navegador del usuario y las convierte...
hace 7 meses
02.8K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: generación de consultas SQL precisas a partir de texto mediante técnicas RAG

Introducción exhaustiva Vanna es un marco Python de código abierto con licencia del MIT centrado en la generación de consultas SQL mediante técnicas RAG (Retrieval Augmented Generation). Los usuarios pueden entrenar modelos RAG, aplicarlos a sus propios datos, y luego hacer preguntas, y Vanna devolverá los s...
hace 7 meses
02.7K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: un marco unificado para implementar la reparación de rostros en vídeo, reparar vídeos en blanco y negro, retratos borrosos y antiguos

Introducción exhaustiva SVFR (Stable Video Face Restoration) es un marco unificado para la restauración de rostros en vídeo que admite tareas de restauración básica de rostros (BFR), coloreado, reparación y su combinación. El marco utiliza priors generativos y cinemáticos unificando...
hace 7 meses
03.6K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: sistema digital interactivo en tiempo real de código abierto que permite el diálogo síncrono por audio y vídeo.

Introducción completa LiveTalking es un sistema humano digital interactivo en tiempo real de código abierto , se ha comprometido a la construcción de alta calidad humana digital solución en vivo . El proyecto utiliza el protocolo de código abierto Apache 2.0 , integrado con una serie de tecnologías de vanguardia , incluyendo ER-NeRF renderizado , audio en tiempo real y procesamiento de streaming de vídeo ...
hace 7 meses
03.9K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Introducción general Aider es una potente herramienta de código abierto que ayuda a los desarrolladores a escribir, editar y refactorizar código a través del diálogo en lenguaje natural. Como herramienta interactiva de programación por pares de IA, Aider es compatible con muchos de los principales lenguajes de programación y puede integrarse perfectamente en Git....
hace 4 meses
03K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: herramienta de edición de vídeo sonoro 3D con profundidad de campo para retratos hablados

Introducción general JoyGen es un innovador marco de generación de vídeo en dos fases para rostros parlantes, centrado en resolver el problema de la generación de expresiones faciales basada en audio. Desarrollado por un equipo de Jingdong Technology, utiliza técnicas avanzadas de reconstrucción 3D y métodos de extracción de características de audio para capturar con precisión las características de identidad del hablante y la expresión...
hace 7 meses
02.8K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: software de eliminación de marcas de agua de vídeo sin pérdidas y subtítulos difíciles con tecnología AI (cliente de eliminación de marcas de agua de vídeo 7G+)

Introducción completa Video Subtitle Remover (Video-subtitle-remover, o VSR para abreviar) es un software de procesamiento de vídeo basado en la tecnología de IA, que está especialmente diseñado para eliminar subtítulos duros y marcas de agua de texto de los vídeos. La herramienta utiliza una variedad de modelos de algoritmos de IA (STTN, L...
hace 7 meses
03.5K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Descarga rápidamente WeChat Video No. de vídeo, soporta múltiples formatos y plataformas

Introducción completa WeChat Video No. Downloader es un proyecto de código abierto diseñado para ayudar a los usuarios a descargar rápidamente el contenido de vídeo de los números de vídeo WeChat. La herramienta es compatible con una gran variedad de formatos de vídeo y plataformas, y los usuarios pueden utilizarla fácilmente en sistemas Windows y macOS. El proyecto está desarrollado por ltaoo y alojado en...
hace 7 meses
02.7K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: inteligencias interactivas automatizadas en redes sociales que buscan, dan a me gusta y dejan mensajes automáticamente.

Introducción general Riona-AI-Agent es una innovadora herramienta de automatización impulsada por IA diseñada específicamente para gestionar y optimizar las operaciones de las principales plataformas de medios sociales. El proyecto utiliza modelos avanzados de IA para plataformas como Instagram, Twitter y GitHub con el fin de proporcionar...
hace 7 meses
08.5K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: análisis sintáctico de documentos de formato complejo y extracción de datos multimodales en metadatos y texto

Introducción completa NV Ingest (NVIDIA Ingest) es un conjunto de microservicios de acceso temprano diseñados para analizar cientos de miles de PDF complejos y desordenados sin estructurar y otros documentos empresariales. Puede convertir estos documentos en metadatos y texto para incrustarlos en...
hace 7 meses
03K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: un marco de código abierto para ejecutar inteligencias IA para navegar por la web, permitiendo a la IA manipular automáticamente las páginas web.

Introducción general Browser Use Web UI es un innovador proyecto de código abierto centrado en proporcionar a los agentes de IA capacidades de interacción con el navegador como herramienta de interfaz gráfica. El proyecto está construido sobre el núcleo del framework browser-use, construido con Gradio ...
hace 2 meses
04.4K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA y LangChain lanzan una guía avanzada para redactar informes estructurados de análisis que permite generar informes técnicos basados en IA.

Introducción general Este es un proyecto de generación de informes estructurados desarrollado conjuntamente por LangChain y NVIDIA, presentado en un tutorial de cuaderno Jupyter en GitHub. El proyecto utiliza técnicas avanzadas de IA, concretamente Llama-3.3-7...
hace 4 meses
02.4K
BrownChat:开源实时语音聊天的AI助手

BrownChat: asistente de IA para chat de voz en tiempo real de código abierto

Introducción general BrownChat es una aplicación de chat de audio en tiempo real basada en la tecnología LLM (Large Language Modelling). Desarrollado por el usuario de GitHub sugarforever, el proyecto pretende mejorar la experiencia de comunicación del usuario mediante tecnología avanzada de procesamiento del lenguaje natural.B...
hace 7 meses
02.4K
Lecca:无代码构建AI智能体与AI工作流构建平台

Lecca: Creación de plataformas de inteligencia artificial y flujo de trabajo de inteligencia artificial sin código

Introducción exhaustiva Lecca es una potente plataforma de IA que permite a los usuarios configurar y desplegar grandes modelos lingüísticos (LLM) con múltiples herramientas y flujos de trabajo. Los usuarios pueden construir, personalizar y automatizar fácilmente sus agentes de IA.Lecca ofrece una amplia selección de proveedores de IA y modelos...
hace 5 meses
02.5K