Proyecto AI de código abierto

Total 1020 artículos
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: un asistente de IA para la generación de descripciones de texto Flujos de trabajo ComfyUI

Introducción general ComfyUI-Copilot es un nodo personalizado impulsado por IA diseñado para el marco ComfyUI, con el objetivo de mejorar la eficiencia de la depuración y el despliegue de algoritmos de IA a través de la interacción del lenguaje natural. Está desarrollado por el equipo AIDC-AI (Alibaba) y derivado de GitHu...
hace 1 año
085.8K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive: grabación en directo no supervisada y autocorte, herramienta de carga para la estación B

Introducción bilive es una herramienta diseñada para la grabación en directo de estaciones B, que proporciona una grabación en directo extremadamente rápida, corte automático, renderización de ventanas emergentes y generación de subtítulos. La herramienta es compatible con máquinas de configuración ultrabaja, soporta grabación desatendida 7x24 horas, identifica y renderiza automáticamente pop-ups y subtítulos, trocea y...
hace 1 año
085.7K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): plataforma de código abierto para crear y gestionar grafos de conocimiento, con soporte nativo para aplicaciones RAG.

Introducción Knowledge Graph Studio (KGS) es una plataforma de código abierto diseñada para simplificar el proceso de creación y gestión de grafos de conocimiento nativos de RAG. La plataforma ofrece resolución de entidades basada en reglas, construcción modular de grafos,...
hace 1 año
084.5K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统

OpenPilot: sistema de conducción autónoma de código abierto, hazte tu propio sistema de conducción inteligente para tu coche

Introducción general OpenPilot es un sistema de conducción autónoma de código abierto desarrollado por comma.ai para mejorar la experiencia de conducción y la seguridad de los vehículos existentes con funciones avanzadas de asistencia al conductor. Desde su primer lanzamiento en 2016, OpenPilot ha dado soporte a más de 2...
hace 1 año
084.4K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: una herramienta de inteligencia artificial que ayuda a leer y analizar trabajos académicos

Introducción general Mad Professor (Grumpy Professor Reads Papers) es una herramienta académica de IA de código abierto diseñada para que investigadores y estudiantes simplifiquen la lectura y el análisis de documentos académicos. Integra procesamiento PDF, traducción IA, recuperación RAG, preguntas IA...
hace 12 meses
084.1K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Convierta rápidamente los repositorios de código de Github en texto apto para la comprensión del LLM

Introducción general GitIngest es una herramienta de código abierto diseñada para transformar los repositorios de código de GitHub en texto adecuado para las sugerencias de Large Language Model (LLM). Con una sencilla operación, los usuarios pueden extraer y formatear el contenido de cualquier repositorio de GitHub para adaptarlo al LLM...
hace 1 año
083.8K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Introducción general Aider es una potente herramienta de código abierto que ayuda a los desarrolladores a escribir, editar y refactorizar código a través del diálogo en lenguaje natural. Como herramienta interactiva de programación por pares de IA, Aider es compatible con muchos de los principales lenguajes de programación y puede integrarse perfectamente en Git....
hace 1 año
083.8K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de inteligencia artificial.

Introducción general Mem0 (pronunciado "mem-zero") es un proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de IA. Recuerda las preferencias del usuario, se adapta a las necesidades individuales y mejora con el tiempo, por lo que es ideal para chatbots asistidos por el cliente, asistentes de IA y sistemas autónomos....
hace 2 años
083.7K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: un cliente de diálogo inteligente de escritorio basado en la API de Dify, que proporciona capacidades de diálogo AI de nivel empresarial.

Introducción general Dify-WebUI es una moderna aplicación de diálogo inteligente de escritorio basada en la API de Dify, diseñada para proporcionar a las empresas potentes capacidades de diálogo AI. La aplicación es compatible con una variedad de colores de temas preestablecidos para satisfacer las necesidades individuales de las empresas, y tiene una función de gestión de base de conocimientos para apoyar...
hace 1 año
083.6K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: framework backend basado en SpringBoot para chat y dibujo con inteligencia artificial

Introducción completa RuoYi AI es un proyecto back-end basado en el marco ruoyi-plus , centrándose en la integración de chat AI y funciones de pintura . Es completamente de código abierto y gratuito , utilizando Java17 y SpringBoot 3.X pila de tecnología , backend de gestión ...
hace 1 año
083.4K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: modelado lingüístico multimodal MNN para Android

Introducción exhaustiva MNN (Mobile Neural Network) es un marco de aprendizaje profundo eficiente y ligero desarrollado por Alibaba y optimizado para dispositivos móviles.MNN no solo es capaz de realizar inferencias rápidas en dispositivos móviles, sino que también admite tareas multimodales, incluida la generación de texto....
hace 1 año
083K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: AI Generated PPT, Generación de presentaciones

Introducción completa AiPPT es una herramienta de generación de PPT basada en tecnología de inteligencia artificial, diseñada para ayudar a los usuarios a crear rápidamente presentaciones profesionales. Genera automáticamente diapositivas ricas en contenido y bellamente diseñadas introduciendo temas, cargando archivos o proporcionando URL, etc. Es compatible con gráficos nativos, animaciones y...
hace 1 año
083K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: creación de multiinteligentes de ejecución autónoma, un marco de desarrollo de organismos inteligentes de IA de código abierto totalmente funcional

Introducción general Eliza es un marco avanzado de desarrollo de múltiples cuerpos inteligentes (Multi-Agente) , se compromete a simplificar la construcción y el despliegue del proceso de cuerpo inteligente autónomo (Agente Autónomo) . Soporta el despliegue de múltiples cuerpos inteligentes con diferentes configuraciones de roles , puede lograr ...
hace 1 año
082.5K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: generación y evaluación automáticas de presentaciones PPT, documentos a PPT

Introducción general PPTAgent es un sistema innovador diseñado para generar automáticamente presentaciones a partir de documentos. El sistema se inspira en el enfoque humano de la creación de presentaciones, utilizando un proceso de dos pasos para garantizar la calidad del contenido y el impacto visual. Además, PPTAgent presenta PPTEval, un completo...
hace 1 año
082.4K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: Herramienta especial para convertir archivos PPTX a Markdown

Introducción general PPTX2MD es una herramienta de código abierto diseñada para convertir archivos PPTX de PowerPoint al formato Markdown. Desarrollada por el usuario de GitHub ssine, la herramienta permite conservar los encabezados, las listas, el formato del texto (por ejemplo, negrita, cursiva, colores y super...
hace 1 año
082.3K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio: versión con interfaz fácil de usar del sistema multiagente AutoGen

Descripción general AutoGen Studio 2.0 es una interfaz de usuario impulsada por AutoGen diseñada para simplificar el proceso de creación y gestión de soluciones multiagente. La plataforma permite a los usuarios definir y modificar de forma declarativa los agentes y sus flujos de trabajo a través de una interfaz intuitiva....
hace 1 año
082.2K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: bot de WeChat para inserción de noticias, diálogo con inteligencia artificial y gestión de grupos de chat

Introducción completa NGCBot es un mecanismo HOOK basado en el desarrollo de WeChat robot proyecto de código abierto , creado por el desarrollador ngc660sec (Yunshan/eXM) y alojado en GitHub Después de dos años de iteración , la versión actual de V2.3 , la función de la inicial simple ...
hace 1 año
082.2K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: servicios MCP para controlar software CAD mediante comandos de lenguaje natural

Introducción General CAD-MCP es un proyecto de código abierto que permite a los usuarios controlar el software CAD a través de comandos de lenguaje natural para las operaciones de dibujo. Combina el procesamiento del lenguaje natural y la tecnología de automatización CAD , de modo que los usuarios no necesitan operar manualmente la interfaz CAD , basta con introducir comandos de texto simples que...
hace 12 meses
082.1K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: un marco de colaboración multiinteligencia para la creación de equipos de desarrollo de software de IA para la programación en lenguaje natural

Introducción exhaustiva MetaGPT es un innovador marco de trabajo para organismos multiinteligencia diseñado para simular el funcionamiento de una empresa de software de IA completa. Creado por geekan (Alexander Wu), el objetivo del proyecto es combinar modelos GPT con diferentes roles en una entidad colaborativa....
hace 1 año
082K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: cargue una imagen y migre las funciones de retrato para generar diferentes estilos de imágenes

Introducción completa InstantID es una tecnología avanzada centrada en la generación de imágenes con estilos o poses personalizados en cuestión de segundos, al tiempo que garantiza un alto nivel de fidelidad utilizando una única imagen de identificación de referencia. La tecnología utiliza una solución basada en un modelo de difusión mediante la integración de imágenes faciales, mapas de puntos de referencia...
hace 2 años
081.9K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: grandes modelos multimodales de código abierto para el tratamiento de imágenes, vídeos y textos

Introducción integral InternVL es un proyecto de big model multimodal de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai (OpenGVLab) y alojado en GitHub. Integra capacidades de procesamiento visual y lingüístico para apoyar la comprensión integral y la generación de imágenes, vídeos y textos.En...
hace 1 año
081.9K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser: API automatizada de navegación web para crear inteligencia y aplicaciones que controlen el funcionamiento del navegador.

Introducción general Steel Browser es una API de navegador de código abierto diseñada para agentes y aplicaciones de IA. Proporciona una instancia de navegador completa que permite a los usuarios automatizar operaciones web sin preocuparse por la infraestructura.Steel Browser soporta...
hace 1 año
081.8K
Orama:高性能全文本和向量搜索引擎

Orama: un motor de búsqueda vectorial y de libros a texto completo de alto rendimiento

Introducción general Orama es un motor de búsqueda de código abierto y alto rendimiento , escrito íntegramente en TypeScript , que soporta búsqueda de texto completo , búsqueda vectorial y búsqueda híbrida.Orama está diseñado para funcionar en cualquier entorno de ejecución JavaScript , proporcionando ...
hace 1 año
081.8K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: un modelo de lenguaje visual experto para la comprensión multimodal avanzada

Introducción exhaustiva DeepSeek-VL2 es una serie de modelos avanzados de lenguaje visual Mixture-of-Experts (MoE) que mejoran significativamente el rendimiento de su predecesor, DeepSeek-VL. Los modelos son útiles en preguntas y respuestas visuales, reconocimiento óptico de caracteres,...
hace 1 año
081.3K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): control mágico de la iluminación de la imagen, controla la luz y la sombra de la imagen y el fondo

Introducción general IC-Light es un proyecto para el control de la iluminación de imágenes que pretende manipular los efectos lumínicos de las imágenes mediante modelos avanzados de IA. Desarrollado por Lvmin Zhang et al, el proyecto ofrece dos modelos principales: un modelo de reiluminación condicional al texto y un modelo condicional al fondo. Los usuarios pueden pasar...
hace 1 año
081.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: herramienta de clonación de voz multilingüe y sin muestras basada en xtts_v2 para Windows.

Descripción general Clone Voice es una herramienta de clonación de sonido de código abierto que proporciona una interfaz basada en web que permite a los usuarios clonar voces utilizando cualquier sonido o grabación de voz personal. La herramienta es fácil de usar, incluso sin una GPU NVIDIA, y se puede utilizar con una aplicación precompilada...
hace 2 años
080.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: herramienta de generación y depuración automática de código con soporte multilingüe

Introducción general AutoDev es un proyecto de código abierto desarrollado por el equipo de Unit Mesh y alojado en GitHub, cuyo objetivo es mejorar la eficiencia de programación de los desarrolladores mediante tecnología de inteligencia artificial. Es un potente asistente de codificación que soporta múltiples lenguajes de programación, incluyendo Ja...
hace 1 año
080.7K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboración multiagente para el asistente de explotación de dispositivos móviles

Introducción general MobileAgent es un potente asistente de operación de dispositivos móviles diseñado para mejorar la eficiencia y la automatización de la operación de dispositivos móviles a través de la colaboración multi-agente y módulos de percepción visual mejorada. Está desarrollado por el equipo de X-PLUG y es compatible con Android y ...
hace 1 año
080.5K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: una herramienta automatizada de I+D basada en datos que facilita los procesos de I+D basados en datos mediante tecnología de IA.

Introducción general RD-Agent es una herramienta de código abierto de Microsoft diseñada para automatizar y optimizar el proceso de investigación y desarrollo (I+D). La herramienta se centra en escenarios basados en datos para mejorar la eficacia del desarrollo de modelos y datos mediante técnicas de inteligencia artificial.RD-Agent integra la investigación...
hace 1 año
080.4K
Abogen:将多种文本格式转换为有声读物的工具

Abogen: una herramienta para convertir múltiples formatos de texto en audiolibros

Introducción general Abogen es una herramienta de código abierto diseñada para convertir rápidamente archivos ePub, PDF o de texto plano en audio de alta calidad. Utiliza el modelo Kokoro-82M para generar un habla natural y fluida, y admite la generación simultánea de subtítulos, lo que resulta idóneo para producir audiolibros....
hace 12 meses
080.3K
阿布量化交易系统:基于Python的开源量化交易平台

Abu quantitative trading system: plataforma de negociación cuantitativa de código abierto basada en Python

Introducción general Abu Quantitative Trading System es una plataforma de código abierto basada en Python. Fue creada por el usuario "bbfamily" para ayudar a los inversores a aplicar estrategias de negociación cuantitativa mediante código. El sistema soporta backtesting y trading de varios productos financieros como acciones, opciones, futuros y bitcoin. Es...
hace 1 año
080.2K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversión de imágenes a Markdown, modelo visual OCR de alta precisión

Introducción general Zerox es un proyecto de código abierto diseñado para convertir PDF, DOCX, imágenes y otros documentos a formato Markdown a través de modelos visuales. El proyecto ha sido desarrollado por el equipo getomni-ai y proporciona una solución OCR (Reconocimiento Óptico de Caracteres) sencilla y eficiente.
hace 1 año
079.8K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: herramienta gratuita de IA basada en el paquete Pollinations.

Introducción general FreeAI es una plataforma de aplicaciones de IA de código abierto basada en la API Pollinations.AI, que proporciona servicios gratuitos e ilimitados de asistentes de chat de IA, generación de imágenes y síntesis de voz. El proyecto fue iniciado por el desarrollador Azad-sl en G...
hace 1 año
079.8K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: una herramienta de código abierto para ajustar y entrenar modelos lingüísticos de gran tamaño

Introducción Unsloth es un proyecto de código abierto diseñado para proporcionar herramientas eficientes para el ajuste fino y la formación de grandes modelos lingüísticos (LLM). El proyecto soporta una variedad de modelos bien conocidos, incluyendo Llama, Mistral, Phi, y Gemma.Unsloth...
hace 1 año
079.8K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: modelo experimental de conversión de texto en voz, TTS implementado mediante un enfoque de modelado lingüístico puro.

Introducción general OuteTTS es un modelo experimental de conversión de texto en habla (TTS) que utiliza un enfoque de modelado lingüístico puro para generar habla de alta calidad. A diferencia de los sistemas TTS tradicionales, OuteTTS no requiere adaptadores externos ni arquitecturas complejas. El modelo se basa en la arquitectura LLaMa...
hace 1 año
079.5K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: una herramienta de código abierto para editar imágenes con instrucciones de lenguaje natural

Introducción general Step1X-Edit es un marco de edición de imágenes de código abierto desarrollado por el equipo Stepfun AI y alojado en GitHub. Combina un modelo de lenguaje multimodal de gran tamaño (Qwen-VL) y un transformador de difusión (DiT) para permitir a los usuarios crear imágenes a través de un...
hace 12 meses
079.2K
Klee:桌面本地运行AI大模型并管理私人知识库

Klee: ejecución local de macromodelos de IA en el escritorio y gestión de una base de conocimientos privada

Introducción general Klee es una aplicación de escritorio de código abierto diseñada para ayudar a los usuarios a ejecutar localmente grandes modelos lingüísticos (LLM) de código abierto con gestión privada y segura de bases de conocimiento y capacidades de toma de notas Markdown. Se basa en las tecnologías Ollama y LlamaIndex...
hace 1 año
079.2K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers: motor de rendimiento para la inferencia de grandes modelos: aceleración extrema, potenciación flexible

KTransformers: Un framework Python de alto rendimiento para romper el cuello de botella de la inferencia de grandes modelos. Es más que una simple herramienta de ejecución de modelos, es un conjunto de motores de optimización de rendimiento extremo y una plataforma flexible de potenciación de interfaces. KTransf...
hace 1 año
079.1K
AgenticSeek:完全本地运行的任务自动化AI助手

AgenticSeek: un asistente de IA para la automatización de tareas que se ejecuta de forma totalmente local

Introducción general AgenticSeek es un asistente de IA de código abierto que se ejecuta de forma completamente local y se basa en el modelo Deepseek R1. No requiere una API en la nube y no incurre en cientos de dólares en cuotas mensuales. Pretende ser un asistente inteligente similar a "Jarvis" en la película...
hace 1 año
079K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: herramienta de conversión de voz en subtítulos, cliente ligero con interfaces integradas para Cutscene, Racer y Must-Cut.

Introducción completa AsrTools es una herramienta inteligente de voz a texto con interfaces incorporadas de grandes jugadores como Cutscene, QuickScope y MustScope, que soporta procesamiento por lotes multihilo eficiente sin necesidad de GPU o configuraciones tediosas. Se basa en el desarrollo PyQt5, interfaz hermosa y fácil de usar, capaz de salida SRT y TXT palabras de formato ...
hace 2 años
079K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: un marco de código abierto TypeScript para construir rápidamente inteligencias de IA

Introducción general VoltAgent es un marco TypeScript de código abierto diseñado para que los desarrolladores construyan y orquesten rápidamente inteligencias de IA. Proporciona herramientas modulares y un modelo de desarrollo estandarizado que simplifica la interacción con grandes modelos de...
hace 12 meses
078.8K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: reconocimiento automático de voz independiente del orador que proporciona marcas de tiempo de gran precisión a nivel de palabra.

Introducción general BetterWhisperX es una versión optimizada del proyecto WhisperX centrada en proporcionar servicios de Reconocimiento Automático del Habla (ASR) eficientes y precisos. Como rama mejorada de WhisperX, el proyecto fue desarrollado por Federico ...
hace 1 año
078.6K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: una plataforma de código abierto para automatizar el cumplimiento de SOC 2, ISO 27001 y GDPR

Introducción general Comp AI es una plataforma de código abierto desarrollada por Comp AI, Inc. con sede en San Francisco, Estados Unidos. Ayuda a las organizaciones a completar rápidamente los requisitos de cumplimiento como SOC 2, ISO 27001 y GDPR a través de herramientas automatizadas, con el objetivo de varios...
hace 1 año
078.5K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: un marco de inteligencia colaborativa multirol para simplificar tareas complejas

Introducción exhaustiva CrewAI es un marco avanzado diseñado para orquestar la colaboración entre agentes de rol y de IA autónoma. Al facilitar la inteligencia colaborativa, CrewAI permite a los agentes trabajar juntos sin problemas para resolver tareas complejas. Tanto si está creando una plataforma de asistente inteligente, automatizando equipos de atención al cliente o...
hace 1 año
078.5K
Dia:生成超现实多人对话的文本转语音模型

Dia: un modelo texto-voz para generar diálogos multijugador hiperrealistas

Introducción general Dia es un modelo de texto a voz (TTS) de código abierto desarrollado por Nari Labs y centrado en la generación de audio de diálogo hiperrealista. Transforma guiones de texto en diálogos realistas de varios caracteres en un solo proceso, admite el control de emociones y entonación, e incluso genera representaciones no verbales....
hace 1 año
078.3K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: creación de herramientas inteligentes de automatización web para que las inteligencias artificiales manejen fácilmente los navegadores

Introducción exhaustiva Browser-Use es una innovadora herramienta de automatización web de código abierto diseñada específicamente para permitir que los modelos lingüísticos (LLM) interactúen de forma natural con los sitios web. Proporciona un marco potente y flexible que admite una amplia gama de modelos lingüísticos convencionales, como GPT-4, Claud...
hace 1 año
078.3K
Local Deep Research:本地运行的生成深度研究报告工具

Local Deep Research: una herramienta de gestión local para generar informes de investigación en profundidad.

Introducción general Local Deep Research es un asistente de investigación de IA de código abierto diseñado para ayudar a los usuarios a realizar investigaciones profundas y generar informes detallados para problemas complejos. Es compatible con la ejecución local, lo que permite a los usuarios completar las tareas de investigación sin depender de los servicios en la nube. La herramienta ...
hace 12 meses
078.1K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: un marco de flujo de trabajo de código abierto de IA que integra muchas palabras clave para gestionar eficazmente una variedad de transacciones.

Introducción general Fabric es un marco de IA de código abierto desarrollado por Daniel Miessler para simplificar y automatizar las tareas informáticas cotidianas y facilitar el uso de la inteligencia artificial. Ayuda a los usuarios de forma eficiente a través de un diseño modular y de palabras clave predefinidas (Patrones)...
hace 2 años
078K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: Plataforma de código abierto de modelización de grandes lenguajes financieros para análisis y predicción financiera

Introducción general FinGPT es una plataforma de modelización de gran lenguaje financiero de código abierto desarrollada por la AI4Finance Foundation, diseñada para que el sector financiero resuelva tareas financieras complejas e impulse la innovación en fintech.FinGPT utiliza técnicas de adaptación ligera y enfoques de aprendizaje de refuerzo....
hace 1 año
078K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: un marco basado en Qwen para aplicaciones de agentes inteligentes, que incluye llamadas a herramientas, intérpretes de código, RAG y extensiones de Chrome.

Introducción completa Qwen-Agent es un marco de aplicación de agente inteligente desarrollado sobre la base de Qwen 2.0 y superiores, con capacidades tales como seguimiento de comandos, uso de herramientas, planificación y memoria. El marco proporciona una variedad de aplicaciones de ejemplo como asistentes de navegador, intérpretes de código y asistentes personalizados....
hace 1 año
077.8K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: interfaz de chat para visualizar conversaciones basadas en árboles

Introducción general TreeGPT es una aplicación de chat de código abierto basada en Next.js, centrada en la visualización de conversaciones con grandes modelos lingüísticos (LLMs, por sus siglas en inglés, p. ej., GPTs) a través de estructuras de grafos en árbol (grafos acíclicos dirigidos, DAGs), sustituyendo a los métodos de chat lineales tradicionales para mejorar la velocidad y...
hace 1 año
077.8K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: un modelo de conversión de texto en habla de código abierto para la generación y clonación de habla de alta calidad

Introducción general Llasa-3B es un modelo de conversión de texto a voz (TTS) de código abierto desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong (HKUST Audio). El modelo se basa en la arquitectura Llama 3.2B, que ha sido cuidadosamente ajustada para proporcionar una generación de voz de alta calidad que no sólo soporta múltiples...
hace 1 año
077.8K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 1 año
077.5K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: Monitoriza las actividades de los usuarios de OpenWebUI, gestiona los límites de uso, soporta el despliegue con un solo clic.

Introducción General OpenWebUI-Monitor es un panel de control para monitorizar las actividades de los usuarios de OpenWebUI y gestionar las cuotas de uso. Te permite establecer eficientemente cuotas de usuario, ver datos de usuario e información visual en tiempo real, soporta despliegue con un clic, y facilita la gestión y monitorización de usuarios....
hace 1 año
077.2K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK de código abierto para pizarras de lienzo ilimitadas, AI para generar wireframes minimalistas y diagramas UML.

Descripción general tldraw es una herramienta de dibujo colaborativo gratuita e instantánea que proporciona un lienzo ilimitado donde los usuarios pueden dibujar gráficos rápidamente, escribir texto y colaborar al instante. Con una interfaz intuitiva y un rendimiento excelente, es adecuada para la colaboración en equipo y el trabajo remoto. Apoyado por la comunidad de código abierto, tldr...
hace 1 año
077.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

La IA lee libros: la IA lee libros en PDF página por página, extrae automáticamente los puntos clave del conocimiento y genera resúmenes.

Introducción completa AI-reads-books-page-by-page es un desarrollo basado en Python de la herramienta inteligente de análisis de libros PDF, que puede automatizar el análisis página por página de libros PDF, extraer los puntos clave de conocimiento, y después del intervalo de página especificado para generar etapa...
hace 1 año
077.2K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Agente TARS: una inteligencia de código abierto que utiliza la visión y los comandos para manejar ordenadores

El agente de introducción integral TARS es una inteligencia artificial multimodal de código abierto de ByteDance, con características básicas que ayudan a los usuarios a completar tareas informáticas complejas mediante la comprensión visual del contenido web y la combinación de operaciones de línea de comandos y del sistema de archivos. En lugar de requerir operaciones manuales como las herramientas tradicionales, puede auto...
hace 1 año
076.8K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente asistente inteligente de chat en grupo de WeChat para Windows

Introducción integral WeChatAI es un chat de grupo WeChat basado en Python y asistente inteligente personal, que soporta una variedad de grandes modelos de lenguaje (como DeepSeek, Gemini, Tongyi Thousand Questions), que puede lograr el diálogo inteligente, auto-respuesta y otras funciones. El proyecto utiliza ...
hace 1 año
076.8K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Sistema de inversión AI: sistema automatizado de toma de decisiones de inversión en acciones A, que utiliza un sistema de inteligencia múltiple para analizar los datos del mercado.

Introducción exhaustiva A_Share_investment_Agent es una ayuda para la toma de decisiones de inversión en acciones A basada en un sistema de inteligencias múltiples. El sistema está diseñado para analizar los datos del mercado, calcular el valor intrínseco de las acciones, analizar el sentimiento del mercado y los datos fundamentales a través de múltiples inteligencias colaborativas para...
hace 1 año
076.7K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: clon de código abierto del sistema de integración digital man, despliegue en un clic del cliente gratuito digital man.

Introducción completa AigcPanel es un sistema de producción humana digital AI de ventanilla única para todos los usuarios, desarrollado con la pila de tecnología electron+vue3+typescript, compatible con la implementación de un solo clic en Windows. El sistema está diseñado para ser fácil de usar como el núcleo, incluso...
hace 1 año
076.7K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...
hace 1 año
076.7K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: modelo de aprendizaje profundo para eliminar rápidamente el fondo de imágenes y vídeos

Introducción exhaustiva BEN2 (Background Erase Network 2) es un modelo de aprendizaje profundo desarrollado por Prama LLC específicamente diseñado para eliminar automáticamente el fondo de una imagen y generar una imagen en primer plano. El modelo utiliza un innovador algoritmo de Confiden...
hace 10 meses
076.7K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: modelo de generación de activos 3D desarrollado por Microsoft, compatible con múltiples formatos y de edición flexible.

Introducción general TRELLIS es un modelo de generación de activos 3D a gran escala desarrollado por Microsoft. Es capaz de recibir indicaciones de texto o imágenes y generar activos 3D de alta calidad en diversos formatos, como campos radiales, gaussianos 3D y mallas.
hace 1 año
076.6K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new: modificación de código abierto basada en Bolt.new, herramientas de desarrollo de pila completa basadas en IA.

Descripción general multi-model-bolt.new es una versión modificada de Bolt.new que permite el uso de modelos TogetherAI, soportando características como el despliegue, la respuesta móvil y la entrada de voz. Los usuarios pueden ser solicitados directamente en el navegador, ejecutar...
hace 1 año
076.6K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown editor: herramientas de diseño gráfico de WeChat sencillas y eficaces, una llave para pegar el artículo al número público de WeChat.

Introducción completa WeChat Markdown Editor (WeChat Markdown Editor) es una herramienta de diseño gráfico WeChat muy conciso diseñado para ayudar a los usuarios a crear fácilmente hermosas mensajes WeChat. El editor es compatible con todos los básicos Markdown ...
hace 1 año
076.5K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

No estructurados: preprocesamiento de documentos no estructurados de código abierto, herramientas de tratamiento de datos no estructurados

Introducción completa Unstructured-IO proporciona un conjunto de componentes de código abierto para el procesamiento y preprocesamiento de imágenes y documentos de texto como PDF, HTML, documentos de Word, etc. Su principal objetivo es simplificar y optimizar los flujos de trabajo de procesamiento de datos, especialmente para grandes modelos de lenguaje (LL...
hace 2 años
076.5K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: Herramienta de rastreo de comentarios de vídeo y contenidos de plataformas de medios multisociales

Introducción general MediaCrawler es una herramienta de rastreo de contenido de medios sociales diseñada para desarrolladores. Al proporcionar un rastreador de gran alcance, se puede agarrar rápidamente vídeos, imágenes, comentarios, gustos, retweets y otros datos de las plataformas sociales como Xiaohongshu,...
hace 2 años
076.4K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google lanza un protocolo abierto para la comunicación entre inteligencias artificiales

Introducción general A2A (Agent2Agent) es un protocolo de código abierto desarrollado por Google para permitir que las inteligencias artificiales desarrolladas por diferentes marcos o proveedores se comuniquen y colaboren entre sí. Proporciona un conjunto estandarizado de métodos para que las inteligencias descubran las capacidades de las demás, compartan tareas y completen el trabajo....
hace 1 año
076.4K