Proyecto AI de código abierto

Total 1020 artículos
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: un cliente Python que demuestra el proceso de ejecución de un organismo inteligente, proporcionando una interfaz gráfica de usuario intuitiva.

Introducción completa AgentClientDemo es un proyecto completo de Python que integra funcionalidad inteligente (Agente) y cliente (Cliente). El proyecto está basado en el framework PyQt y proporciona una interfaz gráfica de usuario (G...
hace 8 meses
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: herramienta de código abierto para detectar vulnerabilidades LLM y asegurar la IA generativa

Introducción completa NVIDIA Garak es una herramienta de código abierto diseñada específicamente para detectar vulnerabilidades en Large Language Models (LLMs). Comprueba el modelo en busca de múltiples debilidades como ilusiones, fugas de datos, inyección de pistas, generación de mensajes de error, generación de contenido dañino, etc. mediante sondeos estáticos, dinámicos y adaptativos....
hace 9 meses
02.7K
Coding Agent:基于Langgraph构建的简单编程助手

Agente de codificación: un sencillo asistente de programación basado en Langgraph

Introducción general Coding Agent es un asistente de programación inteligente desarrollado por AbhinavTheDev, diseñado para ayudar a los desarrolladores a mejorar su eficiencia en la programación. La herramienta utiliza tecnología de inteligencia artificial para generar código de forma automática, proporcionar sugerencias de programación y ayudar a los desarrolladores...
hace 7 meses
02.7K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: un marco eficiente para crear aplicaciones colaborativas multiinteligentes

Introducción general AIEvo es el marco multiagente de código abierto de Ant Group diseñado para crear aplicaciones multiagente de forma eficiente. El framework sigue estrictamente el grafo de tareas SOP para mejorar la tasa de éxito en la ejecución de tareas complejas, y garantiza una alta flexibilidad y escalabilidad mediante mecanismos de retroalimentación y monitorización.AIEvo ha sido producido dentro de Ant Group...
hace 7 meses
02.7K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: una herramienta automatizada de coloreado de líneas para colorear rápidamente dibujos anime de líneas en blanco y negro.

Introducción exhaustiva MangaNinjia es un proyecto de código abierto desarrollado por Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), centrado en el procesamiento automatizado del coloreado de dibujos lineales. Esta herramienta consigue un ajuste preciso del color de las imágenes de referencia mediante técnicas de aprendizaje profundo, mejorando enormemente...
hace 7 meses
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...
hace 6 meses
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...
hace 5 meses
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente asistente inteligente de chat en grupo de WeChat para Windows

Introducción integral WeChatAI es un chat de grupo WeChat basado en Python y asistente inteligente personal, que soporta una variedad de grandes modelos de lenguaje (como DeepSeek, Gemini, Tongyi Thousand Questions), que puede lograr el diálogo inteligente, auto-respuesta y otras funciones. El proyecto utiliza ...
hace 6 meses
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: un cliente de visualización de flujos de trabajo para modelos de IA basado en la orquestación de nodos

Introducción general NodeTool es una innovadora plataforma de creación de IA diseñada para proporcionar una interfaz sencilla e intuitiva para entusiastas de la IA, desarrolladores, científicos de datos y creativos. Tanto si eres un artista, desarrollador o principiante, NodeTool te ayuda a crear rápidamente prototipos creativos....
hace 8 meses
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: un conjunto de herramientas de código abierto para conectar inteligencias de IA al protocolo Solana.

Introducción general Solana Agent Kit es un kit de herramientas de código abierto diseñado para conectar sin problemas inteligencias AI al protocolo blockchain Solana. El kit permite tanto a los investigadores de IA como a los desarrolladores de criptomonedas utilizar cualquier cuerpo inteligente entrenado en modelos para realizar sobre...
hace 6 meses
02.7K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: carga de wireframes para generar código front-end basado en Llama4

Introducción general Napkins.dev es un proyecto libre de código abierto, la función principal es permitir a los usuarios subir capturas de pantalla de interfaz o wireframes para generar automáticamente código front-end ejecutable. Los usuarios sólo tienen que proporcionar un dibujo de diseño , la herramienta será a través del modelo Llama 4 ( por Juntos ...
hace 4 meses
02.7K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI Agents SDK: un marco de trabajo en Python para crear flujos de trabajo colaborativos multiinteligencia

Introducción general OpenAI Agents SDK es una herramienta de desarrollo ligera de OpenAI diseñada para construir flujos de trabajo multi-inteligentsia. Está basado en Python y es fácil de usar, permitiendo a los desarrolladores configurar Agentes, cortar tareas...
hace 5 meses
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown editor: herramientas de diseño gráfico de WeChat sencillas y eficaces, una llave para pegar el artículo al número público de WeChat.

Introducción completa WeChat Markdown Editor (WeChat Markdown Editor) es una herramienta de diseño gráfico WeChat muy conciso diseñado para ayudar a los usuarios a crear fácilmente hermosas mensajes WeChat. El editor es compatible con todos los básicos Markdown ...
hace 7 meses
02.7K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送

InsightExpress: generar informes de investigación basados en IA y enviarlos por correo electrónico

Descripción general InsightExpress es una aplicación basada en Next.js que genera informes de investigación impulsados por IA basados en temas suministrados por el usuario y los envía por correo electrónico a los usuarios. La aplicación aprovecha la IA de Langflow ...
hace 4 meses
02.7K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: motor de recuperación de datos no estructurados y consultas complejas

Introducción general dsRAG es un motor de recuperación de alto rendimiento diseñado para gestionar consultas complejas sobre datos no estructurados. Funciona especialmente bien con consultas complejas en texto denso, como informes financieros, documentos jurídicos y trabajos académicos. dsRAG emplea tres enfoques clave para mejorar el rendimiento: lenguaje...
hace 6 meses
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: recuperar contenidos y resumir conocimientos a partir de documentos masivos de múltiples fuentes

Introducción wdoc es un potente sistema RAG (Retrieval Augmentation Generation) diseñado para procesar y analizar grandes cantidades de documentos diversos. Es capaz de recuperar a partir de una amplia gama de tipos de documentos, incluidos PDF, páginas web, vídeos de YouTube, archivos de audio, etc. wdoc es especialmente adecuado para procesar...
hace 6 meses
02.7K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: rastrea y resume las noticias sobre inteligencia artificial en tiempo real y las publica automáticamente en WeChat.

Introducción general ai-trend-publish es un proyecto de código abierto alojado en GitHub, desarrollado por el equipo OpenAISpace, centrado en el seguimiento y la publicación de las últimas tendencias en inteligencia artificial en tiempo real. Esta herramienta está diseñada para ayudar a desarrolladores, aficionados a la tecnología...
hace 5 meses
02.7K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: Construcción de un marco para inteligencias multimodales con memoria, conocimiento y herramientas

Introducción general Agno es una biblioteca Python de código abierto desarrollada por el equipo agno-agi y alojada en GitHub, dedicada a facilitar a los desarrolladores la creación de inteligencias IA con memoria, conocimientos y herramientas. Es compatible con texto multimodal, imagen, audio y vídeo....
hace 5 meses
02.6K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: comparador de capacidades de programación LLM de código abierto, visión en tiempo real de los mejores modelos de generación de código

Introducción general CodeArena es una plataforma única diseñada para mostrar los mejores modelos de generación de código abierto (LLM) a través de enfrentamientos en tiempo real. Los usuarios pueden ver diferentes LLMs compitiendo en las mismas tareas de programación y ver los modelos con mejor rendimiento a través de tablas de clasificación en tiempo real. La plataforma utiliza Tog...
hace 8 meses
02.6K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道

Yutu: herramienta de gestión de línea de comandos de YouTube, acceso a la IA para automatizar completamente los canales de YouTube

Introducción general Yutu es una potente herramienta de línea de comandos de código abierto diseñada para usuarios de YouTube, alojada en GitHub y desarrollada por el equipo eat-pray-ai. Funciona a través de la terminal para lograr los vídeos de YouTube, listas de reproducción, frecuencia...
hace 5 meses
02.6K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: Herramienta de resumen de cronologías de noticias para mejorar la recuperación de noticias y la eficacia en la generación de cronologías

Introducción general CHRONOS es una herramienta de resumen cronológico de noticias desarrollada por el equipo de PNL de Alibaba. CHRONOS no solo es capaz de gestionar tareas de resumen cronológico de dominio abierto, sino que también es eficiente y escalable....
hace 7 meses
02.6K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: convertir artículos tecnológicos populares en podcasts de audio listos para escuchar

Introducción general Audibit es un proyecto de código abierto, la función principal es Hacker News, TechCrunch y otros artículos populares de tecnología convertidos automáticamente en podcasts de audio, para que los usuarios en el viaje, la aptitud, u ocupado al escuchar la información a través de la Web o móvil. El proyecto hace ...
hace 3 meses
02.6K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: servicios MCP para controlar software CAD mediante comandos de lenguaje natural

Introducción General CAD-MCP es un proyecto de código abierto que permite a los usuarios controlar el software CAD a través de comandos de lenguaje natural para las operaciones de dibujo. Combina el procesamiento del lenguaje natural y la tecnología de automatización CAD , de modo que los usuarios no necesitan operar manualmente la interfaz CAD , basta con introducir comandos de texto simples que...
hace 3 meses
02.6K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: grandes modelos multimodales de código abierto para el tratamiento de imágenes, vídeos y textos

Introducción integral InternVL es un proyecto de big model multimodal de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai (OpenGVLab) y alojado en GitHub. Integra capacidades de procesamiento visual y lingüístico para apoyar la comprensión integral y la generación de imágenes, vídeos y textos.En...
hace 4 meses
02.6K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreado de dibujos animados, sombreado automático de imágenes en blanco y negro para mejorar la coherencia y la calidad del color de las imágenes.

Introducción ColorFlow es una herramienta de autocoloreado de secuencias de imágenes desarrollada por el equipo ARC de Tencent para resolver el problema del autocoloreado de secuencias de imágenes en blanco y negro. La herramienta utiliza un proceso de sombreado mejorado para generar con precisión los colores de varios elementos a través de un conjunto de imágenes de referencia, incluidos los colores del pelo de los personajes y los servicios....
hace 8 meses
02.6K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: Habilita cualquier LLM para automatizar operaciones en Android y PC.

Introducción general ClickClickClick es un framework desarrollado por BandarLabs que pretende automatizar operaciones en Android y PC utilizando cualquier Large Language Model (LLM) local o remoto. El proyecto se encuentra actualmente en una fase altamente experimental y soporta una variedad de modelos como...
hace 8 meses
02.6K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: Experimenta un editor de código basado en IA, ¡haz de cada conversación un commit Git!

Introducción general Melty es un revolucionario editor de código de IA que combina conversaciones de chat con el control de versiones Git. Desarrollado por Charlie y Jackson de Replicate, esta herramienta pretende resolver los puntos débiles de las herramientas tradicionales de codificación de IA. Su mayor ...
hace 7 meses
02.6K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings: garabatos infantiles dibujados a mano convertidos en animación, herramienta automatizada de generación de animaciones de dibujos infantiles.

Introducción general AnimatedDrawings es un proyecto de código abierto desarrollado por Facebook Research para transformar dibujos infantiles en personajes animados mediante técnicas de automatización. El proyecto se basa en el artículo "A Method for A...
hace 8 meses
02.6K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Introducción general ChatFree es un proyecto de código abierto que pretende liberar las aplicaciones de IA de los usuarios de las limitaciones de los navegadores para que se ejecuten localmente. Creado utilizando la API GPT, Copilot está diseñado para soportar una amplia gama de software ofimático como Office, Word, WPS, etc. El proyecto fue desarrollado por ...
hace 8 meses
02.6K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: una herramienta sencilla para crear grandes conjuntos de datos de modelos afinados

Introducción exhaustiva Easy Dataset es una herramienta de código abierto diseñada específicamente para el ajuste fino de grandes modelos (LLM), alojada en GitHub. Ofrece una interfaz fácil de usar que permite a los usuarios cargar archivos, segmentar automáticamente el contenido, generar preguntas y respuestas y, en última...
hace 5 meses
02.6K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: una plataforma de agregación de comercialización que integra múltiples productos de IA

Introducción completa AIBot PRO es un cliente de agregación de AI basado en .NET 6 diseñado para proporcionar a los usuarios una plataforma conveniente para integrar múltiples productos de AI. El cliente admite el diálogo de conmutación sin sentido e integra ChatGPT, Gemini, Claude, Wenxin Yiyin...
hace 6 meses
02.6K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: generación de vídeos con control preciso de la postura humana, creación de bailarinas

Introducción general DisPose es un innovador proyecto de inteligencia artificial de código abierto centrado en la generación controlada de animación de imágenes de personajes. Desarrollado por un equipo de investigadores y de código abierto en GitHub, el proyecto utiliza técnicas avanzadas de aprendizaje profundo para lograr un control preciso de la animación de personajes mediante la descomposición de la información de pose esquelética.D...
hace 8 meses
02.6K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

Gemini Next Chat: ¡Despliegue gratis su aplicación privada multimodal Gemini con un solo clic!

Introducción general Gemini Next Chat es un proyecto de código abierto diseñado para ayudar a los usuarios a desplegar fácilmente aplicaciones Gemini privadas. El proyecto soporta los modelos multimodales Gemini 1.5 y Gemini 2.0 , los usuarios pueden desplegar con un click en Vercel...
hace 7 meses
02.6K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: un sistema de mejora de la memoria basado en la extensión de código Roo

Introducción completa RooFlow es una herramienta de programación asistida por IA de código abierto con la funcionalidad principal de preservar el código, las decisiones y el progreso de las tareas durante el desarrollo mediante el registro de proyectos. Se basa en la extensión Roo Code e integra cinco modos: arquitectura, codificación, pruebas, depuración y preguntas y respuestas. Estos modos inter...
hace 4 meses
02.6K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务

Memoria básica: un servicio MCP para construir grafos de conocimiento persistentes a partir de conversaciones de IA.

Introducción general Basic Memory es una herramienta para construir gráficos de conocimiento a través de conversaciones con asistentes de IA como Claude. Fue desarrollada por Basic Machines y su característica principal es guardar el contenido del diálogo como un archivo Markdown, guardar...
hace 5 meses
02.6K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: proyecto de código abierto de posicionamiento de vídeos por marcas de tiempo y preguntas y respuestas

Introducción general VideoMind es una herramienta de IA multimodal de código abierto centrada en la inferencia, las preguntas y respuestas y la generación de resúmenes para vídeos largos. Fue desarrollada por Ye Liu, de la Universidad Politécnica de Hong Kong, y un equipo del Show Lab de la Universidad Nacional de Singapur. La herramienta imita la comprensión humana del vídeo...
hace 2 meses
02.6K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: Convierte tus repositorios de GitHub en podcasts y escucha las actualizaciones de código en cualquier momento y lugar.

Introducción general GitPodcast es una herramienta innovadora diseñada para convertir los repositorios de GitHub en podcasts, permitiendo a los desarrolladores escuchar las actualizaciones de código en cualquier momento y lugar. Utilizando OpenAI y Azure Speech SDK, GitPodca...
hace 7 meses
02.6K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: Herramienta especial para convertir archivos PPTX a Markdown

Introducción general PPTX2MD es una herramienta de código abierto diseñada para convertir archivos PPTX de PowerPoint al formato Markdown. Desarrollada por el usuario de GitHub ssine, la herramienta permite conservar los encabezados, las listas, el formato del texto (por ejemplo, negrita, cursiva, colores y super...
hace 6 meses
02.6K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: generación automatizada de documentación AI para repositorios GitHub, GitLab

Introducción completa DeepWiki-Open es un proyecto de código abierto diseñado para generar automáticamente documentación estructurada para repositorios de código en GitHub, GitLab y Bitbucket. Utiliza tecnología de IA para analizar la estructura del código , el contenido de los archivos y las relaciones lógicas , la generación rápida...
hace 3 meses
02.6K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...
hace 3 meses
02.6K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

Uso de ordenadores abiertos E2B: ejecución segura de un sistema operativo de inteligencia artificial en el espacio aislado E2B

Introducción general E2B Open Computer Use es un proyecto de código abierto cuyo objetivo es proporcionar una experiencia segura de uso de ordenadores Linux basada en la nube a través de E2B Desktop Sandbox.E2B Sandbox proporciona un entorno gráfico de escritorio que los usuarios...
hace 7 meses
02.6K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: generación y traducción automática de subtítulos multilingües para vídeos con ayuda de la IA.

Introducción general AI no jimaku gumi (AI no subtitle group) es una potente herramienta de procesamiento de subtítulos de vídeo de línea de comandos centrada en permitir funciones automatizadas de extracción, transcripción y traducción de subtítulos de vídeo. La herramienta integra tecnologías avanzadas de inteligencia artificial, como...
hace 7 meses
02.6K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: Estructura de chat en grupo con modelos de gran tamaño: chatear con varios modelos lingüísticos de gran tamaño simultáneamente

Introducción general OpenAOE es un marco de chat de grupo de grandes modelos de código abierto, cuyo objetivo es resolver el problema de la falta de marcos de chat en el mercado actual con múltiples modelos respondiendo en paralelo. Con OpenAOE, los usuarios pueden hablar con múltiples Large Language Models (LLMs) al mismo tiempo y obtener una salida paralela. El marco soporta ...
hace 6 meses
02.6K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers: una biblioteca ligera para la observabilidad de la IA que rastrea los datos de las solicitudes de API compatibles con OpenAI.

Introducción general Observers es un SDK de Python de código abierto diseñado para proporcionar una observabilidad completa para las API de IA generativa. La biblioteca permite a los usuarios rastrear y registrar fácilmente interacciones con modelos de IA y almacenar estas observaciones en múltiples backends. Ya sea...
hace 8 meses
02.6K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT: modelización de los conocimientos jurídicos chinos, apoyo a los cuestionarios jurídicos y formación para los exámenes judiciales.

Introducción general LaWGPT es un proyecto de código abierto apoyado por el Grupo de Investigación de Aprendizaje Automático y Minería de Datos de la Universidad de Nanjing, que se dedica a construir un gran modelo lingüístico basado en el conocimiento jurídico chino. Se basa en modelos chinos genéricos (como Chinese-LLaMA y ChatGLM)...
hace 5 meses
02.6K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: el texto genera un vídeo en bucle sin interrupciones

Introducción general Mobius Diffusion es una innovadora herramienta en línea centrada en la generación de contenidos de vídeo en bucle a partir de texto. Se basa en modelos de difusión de vídeo preentrenados y no requiere entrenamiento por parte del usuario ni datos de anotación para empezar a trabajar rápidamente. La tecnología central del sitio es el ...
hace 5 meses
02.6K
Archon:自主构建与优化AI智能体的开发框架

Archon: un marco de desarrollo para construir y optimizar de forma autónoma inteligencias artificiales

Archon es el primer proyecto "Agenteer" del mundo creado por el desarrollador Cole Medin (nombre de usuario en GitHub coleam00), un marco de código abierto centrado en la creación, optimización e iteración autónoma de Inteligencia Artificial. Inteligencia Artificial. Es...
hace 5 meses
02.6K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: proyecto experimental para ejecutar un modelo lingüístico a gran escala en un archivo PDF

Introducción general llm.pdf es un proyecto de código abierto que permite a los usuarios ejecutar grandes modelos lingüísticos (LLM) directamente en archivos PDF. Desarrollado por EvanZhouDev y alojado en GitHub, este proyecto demuestra un enfoque innovador: al Em...
hace 3 meses
02.6K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

Plugin NoneBot DeepSeek: Diálogo inteligente para el servicio de atención al cliente basado en NoneBot y DeepSeek.

Introducción General El plugin DeepSeek de NoneBot es un plugin de NoneBot que integra el modelo DeepSeek y está diseñado para proporcionar diálogo inteligente y funcionalidad de preguntas y respuestas. Al acceder al modelo DeepSeek, los usuarios pueden utilizar el plugin NoneBot...
hace 6 meses
02.6K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: plataforma de observación y depuración de código abierto para aplicaciones LLM

Introducción general Langfuse es una plataforma de ingeniería LLM (Large Language Model) de código abierto. Ayuda a los desarrolladores a rastrear, depurar y optimizar aplicaciones LLM proporcionando herramientas para observar llamadas, gestionar palabras clave, ejecutar experimentos y evaluar resultados. La plataforma ha sido desarrollada por el equipo Langfuse...
hace 5 meses
02.6K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC: herramienta informática de código abierto para mejorar la función de microcrédito, apoyo al desarrollo secundario

Introducción completa SuperWeChatPC es una herramienta de mejora de WeChat de código abierto para ordenadores, cuyo núcleo es proporcionar comodidad a los usuarios y desarrolladores. Inicialmente resuelve el problema de que WeChat sólo se puede abrir solo, y más tarde añadió WeChatSDK, para que los desarrolladores puedan llamar a las funciones de WeChat, como el envío de mensajes....
hace 5 meses
02.6K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 6 meses
02.6K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: creador de flujos de trabajo de código abierto para agentes de IA

Introducción exhaustiva Sim Studio es una plataforma de código abierto para la creación de flujos de trabajo de agentes de IA que se centra en ayudar a los usuarios a diseñar, probar y desplegar rápidamente flujos de trabajo de modelos lingüísticos (LLM) a gran escala a través de una interfaz visual ligera e intuitiva. Los usuarios pueden crear flujos de trabajo complejos sin necesidad de programar...
hace 3 meses
02.6K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: una herramienta mejorada de código abierto para incrustar conocimientos externos en grandes modelos

KBLaM es un proyecto de código abierto desarrollado por Microsoft , el nombre completo es "Knowledge Base augmented Language Model" ( Modelo de Lenguaje Aumentado de Base de Conocimiento ). Es a través de la conversión de conocimiento externo en vectores e incrustado en un gran modelo de...
hace 5 meses
02.6K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: generación de vídeo basada en silicio para controlar el movimiento de objetos sólidos en imágenes

Introducción General DragAnything es un proyecto de código abierto que tiene como objetivo lograr el control de movimiento de objetos arbitrarios a través de la representación de entidades. El proyecto está desarrollado por el equipo Showlab y ha sido aceptado por ECCV 2024.DragAnything proporciona una forma de utilizar...
hace 6 meses
02.6K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: una herramienta eficaz de aprendizaje y previsión de predicciones meteorológicas mundiales a medio plazo basada en modelos de difusión

Introducción general GraphCast es una herramienta avanzada de previsión meteorológica desarrollada por Google DeepMind que pretende mejorar la precisión de las previsiones meteorológicas globales a medio plazo mediante técnicas de aprendizaje profundo. El proyecto proporciona una variedad de modelos preentrenados y código de muestra, que los usuarios pueden...
hace 8 meses
02.6K
VACE:视频创作和编辑的开源模型(未开放)

VACE: modelo de código abierto para la creación y edición de vídeo (no abierto)

Introducción VACE es un proyecto de código abierto desarrollado por Alitongyi Visual Intelligence Lab (ali-vilab), centrado en la creación y edición de vídeo. Se trata de una herramienta todo en uno que integra diversas funciones, como la generación de vídeos basados en referencias, la edición de contenidos de vídeo existentes, las modificaciones de localización y otras...
hace 5 meses
02.6K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot: un organismo inteligente para mejorar la eficacia del análisis de datos financieros y la investigación de inversiones

Introducción exhaustiva FinRobot es una plataforma de inteligencia de IA de código abierto desarrollada por AI4Finance Foundation y diseñada para el análisis financiero. No solo abarca los modelos lingüísticos tradicionales, sino que también incorpora diversas tecnologías de IA, con el objetivo de ofrecer una solución integral para el sector financiero.F...
hace 6 meses
02.6K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: plataforma de código abierto para el aprendizaje por refuerzo del razonamiento a gran escala

Introducción general Open-Reasoner-Zero es un proyecto de código abierto centrado en la investigación del aprendizaje por refuerzo (RL), desarrollado por el equipo Open-Reasoner-Zero en GitHub. Su objetivo es proporcionar un entrenamiento eficiente, escalable y fácil de usar...
hace 6 meses
02.6K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: un asistente de ingeniería de IA para crear rápidamente bases de código propias

Introducción completa Potpie AI es una plataforma de código abierto centrada en proporcionar a los desarrolladores asistentes de ingeniería de IA personalizados. Permite a los agentes de IA comprender en profundidad la estructura y la lógica del código y automatizar tareas como la depuración, las pruebas y la generación de código mediante la construcción de un grafo de conocimiento de la base de código. Los usuarios pueden...
hace 4 meses
02.6K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: una inteligencia visual para resolver múltiples tareas de detección visual de objetivos

Introducción general Vision Agent es un proyecto de código abierto desarrollado por LandingAI (Team Enda Wu) y alojado en GitHub, diseñado para ayudar a los usuarios a generar rápidamente código para resolver tareas de visión por ordenador. Utiliza un marco de agentes avanzado y modelos multimodales...
hace 5 meses
02.6K
Vexa:实时会议转录与智能知识提取工具

Vexa: una herramienta inteligente de transcripción de reuniones y extracción de conocimientos en tiempo real

Introducción completa Vexa es una plataforma de código abierto para la transcripción de reuniones en tiempo real y la gestión del conocimiento diseñada para proporcionar servicios eficientes de grabación de reuniones y extracción inteligente del conocimiento para empresas y particulares. Se une automáticamente a plataformas como Google Meet, Zoom, etc. mediante robots de reuniones basados en API....
hace 4 meses
02.6K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: generación de recursos de animación de estructuras esqueléticas a partir de modelos 3D estáticos

Introducción general MagicArticulate es un marco de IA desarrollado por ByteDance en colaboración con la Universidad Tecnológica de Nanyang (NTU), que se centra en la rápida transformación de modelos 3D estáticos en activos digitales de animación. Lo hace mediante un Transformador autorregresivo avanzado y un modelo de difusión funcional, auto...
hace 6 meses
02.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: genere datos de entrenamiento de IA mediante la API gratuita de big models, generación de datos de entrenamiento de big models a coste 0.

Introducción completa SFT-data-builder es un proyecto de código abierto diseñado para generar datos de entrenamiento SFT de alta calidad utilizando la API gratuita Big Model combinada con datos de dominio privado de los usuarios. La herramienta admite múltiples formatos de modelos de IA y ofrece generación con un solo clic, generación por lotes, edición flexible y...
hace 9 meses
02.6K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: Genera modelos de código abierto de imagen a vídeo que admiten el control de la lente y el control de la amplitud de movimiento.

Introducción general Ruyi-Models es un proyecto de código abierto diseñado para generar vídeos de alta calidad a partir de imágenes. Desarrollado por el equipo IamCreateAI, el proyecto soporta la generación de vídeo cinemático a 768 de resolución, 24 fotogramas por segundo, 120 fotogramas en 5 segundos...
hace 8 meses
02.6K
Swarms:多智能体编排框架,企业级生产工具

Swarms: marco de orquestación multiinteligencia, herramienta de producción empresarial

Introducción general Swarms es un marco de orquestación multiagente listo para la producción de nivel empresarial diseñado para impulsar la productividad empresarial mediante la gestión eficiente de agentes y el procesamiento de tareas. Con soporte para múltiples modelos, múltiples sistemas de memoria y creación de agentes personalizados, el marco proporciona un diseño modular y capacidades de registro integrales para garantizar que el sistema...
hace 8 meses
02.6K
LineAvatars:生成 Notion 风格线条头像的免费工具

LineAvatars: herramienta gratuita para generar avatares de líneas al estilo Notion

Descripción General LineAvatars es una herramienta online gratuita y fácil de usar diseñada para generar avatares de líneas al estilo Notion. Los usuarios pueden subir una foto o tomar una foto a través de la webcam y el sistema generará automáticamente un avatar de línea utilizando AI. Esta herramienta...
hace 6 meses
02.5K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: un marco de automatización de IA de código abierto que admite la colaboración multiinteligencia

Introducción general LangManus es un marco de automatización de IA de código abierto alojado en GitHub. Desarrollado por un grupo de antiguos compañeros en su tiempo libre, se trata de un proyecto de orientación académica con el objetivo de combinar modelos lingüísticos y herramientas especializadas para la búsqueda web, el rastreo de datos y la ejecución de código....
hace 5 meses
02.5K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: una herramienta eficaz de rastreo web para el preentrenamiento de LLM

Introducción exhaustiva Crawl4LLM es un proyecto de código abierto desarrollado conjuntamente por la Universidad de Tsinghua y la Universidad Carnegie Mellon, centrado en optimizar la eficiencia del rastreo web para el preentrenamiento de grandes modelos (LLM). Reduce significativamente el rastreo ineficaz mediante la selección inteligente de datos web de alta calidad, afirmando ser capaz de rastrear originalmente 1...
hace 6 meses
02.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: Controla el movimiento de los objetos en el vídeo, añadiendo o restando cualquier objeto en movimiento en el vídeo.

Introducción general Go-with-the-Flow es un proyecto de código abierto desarrollado por el equipo de investigación de Netflix Eyeline Studios para controlar los patrones de movimiento de los modelos de difusión de vídeo mediante la distorsión del ruido. El proyecto permite al usuario determinar cómo la cámara de la escena y...
hace 7 meses
02.5K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG: Herramienta de chat inteligente para apoyar las preguntas y respuestas sobre documentos PDF locales de múltiples fuentes

Introducción general LocalPdfChatRAG es un proyecto de código abierto que pretende implementar una funcionalidad de chat inteligente combinando documentos PDF locales con un modelo de Generación Aumentada de Recuperación (RAG). El proyecto permite a los usuarios cargar documentos PDF y hacer preguntas a través del lenguaje natural para llegar desde el documento...
hace 6 meses
02.5K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Búsqueda o1: Capacitar a los modelos de inferencia para la búsqueda activa, permitiendo a los grandes modelos buscar conocimiento externo mientras piensan.

Introducción general Search-o1 es un proyecto de código abierto cuyo objetivo es mejorar el rendimiento de los modelos de razonamiento a gran escala (LRM) mediante la integración de mecanismos de búsqueda avanzada. La idea central es resolver el problema del déficit de conocimiento que se produce en el proceso de razonamiento mediante la búsqueda dinámica y la integración del conocimiento. El proyecto está patrocinado por sunn...
hace 7 meses
02.5K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill: extracción por lotes de información estructurada de documentos y análisis automatizado

Introducción general Rowfill es una plataforma de procesamiento de documentos de código abierto diseñada para trabajadores del conocimiento. Utiliza técnicas avanzadas de inteligencia artificial para extraer, analizar y procesar datos de documentos complejos, imágenes y PDFs.Rowfill soporta Native Large Language Model (LLM) y Ope...
hace 6 meses
02.5K
PR Agent:自动化拉取请求分析工具

PR Agent: herramienta automatizada de análisis de pull requests

Introducción general PR-Agent es una herramienta de código abierto desarrollada por Qodo para automatizar el procesamiento de pull requests (solicitudes de extracción) mediante tecnología de IA. La herramienta es capaz de proporcionar retroalimentación automatizada, sugerencias y análisis para ayudar a los desarrolladores a realizar revisiones de código de manera más eficiente....
hace 7 meses
02.5K