Proyecto AI de código abierto

Total 1020 artículos
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: un cliente de código abierto para traducir en tiempo real el contenido del chat de un juego

Introducción general DeepRant es una herramienta de traducción de código abierto para jugadores, diseñada para resolver el problema de las barreras lingüísticas en los servidores internacionales. Permite la traducción instantánea del texto del juego mediante atajos de teclado, admite que varios idiomas se traduzcan entre sí y permite a los jugadores entender y responder rápidamente a los mensajes del chat sin salir del juego....
hace 7 meses
023.1K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: un proyecto de código abierto para entrenar a la IA a realizar acciones web con demostraciones humanas

Introducción general Optexity es un proyecto de código abierto en GitHub, desarrollado por el equipo de Optexity. Su núcleo es utilizar datos de demostración humana para entrenar a la IA a completar tareas informáticas, especialmente operaciones de páginas web. El proyecto contiene tres bibliotecas de código: Compute...
hace 7 meses
023.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: herramienta de IA para extraer prendas de vestir de una persona como imagen de visualización de prendas en mosaico.

Introducción general TryOffAnyone es una innovadora herramienta de procesamiento de imágenes AI diseñada para resolver los desafíos de la exhibición de ropa en el sector del comercio electrónico. Es capaz de convertir de forma inteligente fotos de personas reales vistiendo ropa en imágenes de efecto de pantalla plana, esta tecnología se basa en la última...
hace 9 meses
023.1K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: Extensión del navegador para gestionar y utilizar avisos rápidamente

General Quick Prompt es una extensión de navegador de código abierto que se centra en la gestión de palabras de aviso (Prompt) y en la introducción rápida de datos. Los usuarios pueden crear, organizar y almacenar bibliotecas de Prompts e insertar rápidamente contenido preestablecido Prompt en el cuadro de entrada de cualquier página web. Esta herramienta es especialmente ...
hace 5 meses
023.1K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Descripción general Charla es una aplicación de chat basada en endpoints diseñada para entablar diálogos con modelos lingüísticos nativos. La aplicación se integra con el backend Ollama, admite diálogos contextuales y guarda las sesiones de chat como archivos Markdown. Los usuarios pueden...
hace 9 meses
023.1K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: Controla el movimiento de los objetos en el vídeo, añadiendo o restando cualquier objeto en movimiento en el vídeo.

Introducción general Go-with-the-Flow es un proyecto de código abierto desarrollado por el equipo de investigación de Netflix Eyeline Studios para controlar los patrones de movimiento de los modelos de difusión de vídeo mediante la distorsión del ruido. El proyecto permite al usuario determinar cómo la cámara de la escena y...
hace 9 meses
023.1K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Laboratorio de agentes: asistente automatizado de codificación y redacción de estudios para investigadores

Introducción completa Agent Laboratory es un flujo de trabajo de investigación autónomo de extremo a extremo diseñado para ayudar a los investigadores a hacer realidad sus ideas de investigación. El sistema se compone de agentes dedicados controlados por modelos lingüísticos a gran escala que dan soporte a todo el flujo de trabajo de investigación, desde la realización de...
hace 7 meses
023.1K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: un marco corporal inteligente para construir dispositivos inteligentes multimodales

Introducción general OmAgent es un marco de cuerpo inteligente multimodal desarrollado por Om AI Lab, con el objetivo de proporcionar potentes funciones impulsadas por IA para dispositivos inteligentes. Mediante la integración de modelos base multimodales de última generación y algoritmos de cuerpo inteligente, el proyecto permite a los desarrolladores crear dispositivos inteligentes eficientes en una variedad de...
hace 9 meses
023.1K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: convertir ebooks epub en audiolibros m4b

Introducción general Autiobooks es una herramienta de código abierto diseñada para ayudar a los usuarios a convertir rápidamente libros electrónicos en formato .epub a audiolibros en formato .m4b. Utiliza tecnología de síntesis de voz de alta calidad proporcionada por Kokoro para generar un audio natural y fluido. Esta herramienta fue desarrollada por...
hace 7 meses
023.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: Genera vídeos detallados y coherentes, ideales para crear vídeos publicitarios con personajes y objetos detallados.

Introducción exhaustiva Goku es un modelo federado de generación de imágenes y vídeos basado en técnicas de transformación de flujos y diseñado para alcanzar un rendimiento de nivel industrial. Integra técnicas avanzadas de generación visual de alta calidad, como la recopilación de datos detallados, el diseño de modelos y la formulación de transformaciones de flujo.
hace 8 meses
023.1K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: convierta PDF en podcasts de herramientas de código abierto

Introducción general Open NotebookLM es un proyecto de código abierto diseñado para convertir cualquier documento PDF en un podcast. La herramienta utiliza modelos de código abierto Large Language Model (LLM) y Text-to-Speech (TTS) para procesar contenidos PDF y generar diálogos naturales adecuados para podcasts de audio....
hace 9 meses
023.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: una plataforma integrada para conectar diferentes marcos de inteligencia artificial y colaborar en tiempo real

Introducción general Mahilo es una plataforma de integración multi-inteligencia de código abierto, publicada en GitHub por el desarrollador Jayesh Sharma, diseñada para ayudar a los usuarios a conectar inteligencias de IA de diferentes marcos para apoyar la comunicación en tiempo real, la interacción persona-ordenador y la colaboración inteligente. La ...
hace 8 meses
023.1K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: Conjunto de herramientas de desarrollo de modelos de IA nativos de Windows, integración de modelos de extremo a extremo en aplicaciones Windows

Introducción general AI Dev Gallery es una aplicación de herramientas de desarrollo de IA de Microsoft (actualmente en vista previa pública) diseñada para desarrolladores de Windows. Proporciona una plataforma completa para ayudar a los desarrolladores a integrar fácilmente las funciones de IA en sus aplicaciones Windo...
hace 10 meses
023K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate: una herramienta nativa que combina IA y RPA para automatizar tareas informáticas

Introducción completa autoMate es una herramienta de automatización local desarrollada por yuruotong1 de código abierto en GitHub, con AI + RPA (Inteligencia Artificial + Automatización Robótica de Procesos) como su característica principal. Combina la comprensión inteligente de modelos lingüísticos a gran escala con RPA....
hace 7 meses
023K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: un transformador autorregresivo de una etapa para la generación automática de canciones

Introducción SongGen es un modelo autorregresivo de Transformación de una sola etapa, de código abierto, diseñado para tareas de generación de texto a canción. El modelo es capaz de generar canciones que contienen voces y pistas de acompañamiento de entrada de texto.SongGen proporciona un control de grano fino sobre una amplia gama de atributos musicales ...
hace 8 meses
023K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: proyecto de código abierto de generación eficiente de vídeo que pretende generar un vídeo de un minuto en menos de un minuto.

Introducción exhaustiva Magic 1-For-1 es un modelo eficiente de generación de vídeo diseñado para optimizar el uso de memoria y reducir la latencia de inferencia. El modelo descompone la tarea de generación de texto a vídeo en dos subtareas: generación de texto a imagen y generación de imagen a vídeo, lo que permite un entrenamiento y una destilación más eficientes....
hace 8 meses
023K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: Automatización de navegadores, implementación de código abierto de OpenAI Operator

Introducción general AI Web Operator es una herramienta de código abierto AI navegador operador diseñado para simplificar la experiencia del usuario en el navegador mediante la integración de múltiples tecnologías de IA y SDKs. La herramienta se basa en Browserbase y Vercel....
hace 9 meses
023K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: Formación de modelos 0,5B en dispositivos comunes a bajo coste

Introducción general X-R1 es un marco de aprendizaje por refuerzo de código abierto en GitHub por el equipo dhcode-cpp, con el objetivo de proporcionar a los desarrolladores una herramienta eficiente y de bajo coste para el entrenamiento de modelos basados en el aprendizaje por refuerzo de extremo a extremo. El proyecto cuenta con el apoyo de DeepSeek...
hace 7 meses
023K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: una plataforma de agregación de comercialización que integra múltiples productos de IA

Introducción completa AIBot PRO es un cliente de agregación de AI basado en .NET 6 diseñado para proporcionar a los usuarios una plataforma conveniente para integrar múltiples productos de AI. El cliente admite el diálogo de conmutación sin sentido e integra ChatGPT, Gemini, Claude, Wenxin Yiyin...
hace 8 meses
023K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC: herramienta informática de código abierto para mejorar la función de microcrédito, apoyo al desarrollo secundario

Introducción completa SuperWeChatPC es una herramienta de mejora de WeChat de código abierto para ordenadores, cuyo núcleo es proporcionar comodidad a los usuarios y desarrolladores. Inicialmente resuelve el problema de que WeChat sólo se puede abrir solo, y más tarde añadió WeChatSDK, para que los desarrolladores puedan llamar a las funciones de WeChat, como el envío de mensajes....
hace 7 meses
023K
OneLine:生成热点事件时间轴的AI工具

OneLine: una herramienta de IA para generar cronologías de acontecimientos candentes

Introducción general OneLine es una herramienta de código abierto para generar cronologías de eventos alojada en GitHub y desarrollada por el usuario chengtx809. Genera rápidamente una línea de tiempo de eventos por palabras clave introducidas por el usuario, mostrando la hora, título, descripción y personas relacionadas del evento....
hace 6 meses
023K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic: marco unificado de generación de música, canciones y audio de código abierto de Ali.

Introducción general InspireMusic es un conjunto de herramientas de código abierto basado en PyTorch centrado en la generación de música, canciones y audio. Proporciona un marco unificado para generar audio de alta calidad con controles para pistas de texto, estructura musical y estilo musical.Inspire...
hace 7 meses
023K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: Plataforma de código abierto para entrevistas de voz con inteligencia artificial que genera preguntas de entrevista personalizadas y realiza análisis inteligentes

Introducción general FoloUp es una plataforma de código abierto diseñada para ofrecer a las empresas soluciones de entrevistas de voz basadas en IA. Con FoloUp, las empresas pueden generar rápidamente preguntas de entrevista personalizadas para descripciones de puestos de trabajo y realizar entrevistas conversacionales naturales con IA. La plataforma también proporciona un análisis detallado de las entrevistas...
hace 7 meses
023K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: una interfaz gráfica web para interactuar con todos los modelos y API de OpenAI.

Introducción general Ortlin es una interfaz gráfica de usuario basada en web diseñada para ayudar a cualquier persona, usuarios técnicos y no técnicos por igual, a interactuar fácilmente con las API de OpenAI y los modelos subyacentes. Es completamente gratuita y de código abierto, lo que permite a los usuarios aprovechar las ventajas de OpenAI sin complicaciones...
hace 12 meses
023K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT: un proyecto de código abierto para crear y ejecutar inteligencias artificiales automatizadas

Introducción general AgentGPT es un proyecto de código abierto desarrollado por el equipo Reworkd y alojado en GitHub, diseñado para permitir a los usuarios crear, configurar y desplegar de forma autónoma inteligencias AI a través de un navegador. Los usuarios simplemente establecen un objetivo, y AgentGPT puede...
hace 7 meses
023K
Browse AI:无代码提取和监控结构化数据

Explorar la IA: extraer y supervisar datos estructurados sin código

Presentación de Browse Browse AI es un software de automatización web sin codificación basado en la nube diseñado para ayudar a los usuarios a extraer y supervisar datos de cualquier sitio web sin necesidad de programación. Puede entrenar a un bot para que realice tareas de extracción, supervisión y automatización de datos con solo...
hace 1 año
023K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: herramienta multilingüe de conversión de voz a texto más pequeña y rápida que Whisper-Large v3

Introducción completa PengChengStarling (PengCheng Labs) es una herramienta multilingüe de reconocimiento automático del habla (ASR) capaz de convertir el habla en distintos idiomas en el texto correspondiente. Este conjunto de herramientas se ha desarrollado a partir del proyecto icefall y proporciona un proceso completo de reconocimiento del habla...
hace 9 meses
022.9K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: un marco para la colaboración multiinteligente en clústeres

Quantum Swarm es un marco de inteligencia artificial de código abierto centrado en el desarrollo y la investigación de inteligencia poblacional AI. El proyecto es mantenido por el equipo de Quarm AI en GitHub y tiene como objetivo proporcionar una plataforma flexible y eficiente para construir y probar sistemas multiinteligencia.Quan...
hace 9 meses
022.9K
简单易用的开源AI写作助手

Asistente de escritura con inteligencia artificial de código abierto y fácil de usar

Introducción general AI Writing Assistant es un asistente de escritura AI de código abierto basado en Next.js, alojado en GitHub, diseñado para ayudar a escritores, creadores de contenido y profesionales de la redacción a mejorar la eficiencia y la calidad de su escritura a través de la tecnología de inteligencia artificial. La herramienta permite a los usuarios detallar...
hace 7 meses
022.9K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: a framework for automated large language model evaluation, comparing the quality of output of different large model cue words (en inglés)

Introducción completa DeepEval es un marco de evaluación LLM de código abierto fácil de usar para evaluar y probar grandes sistemas de modelado del lenguaje. Es similar a Pytest, pero se centra en las pruebas unitarias de los resultados LLM. DeepEval combina los últimos resultados de la investigación...
hace 8 meses
022.9K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: ajuste de modelos lingüísticos mediante grafos de conocimiento para generar datos sintéticos

Introducción general GraphGen es un marco de código abierto desarrollado por OpenScienceLab, un laboratorio de IA de Shanghái, alojado en GitHub, que se centra en optimizar el ajuste fino supervisado de grandes modelos lingüísticos (LLM) guiando la generación de datos sintéticos a través de grafos de conocimiento. Se desarrolló a partir de ...
hace 5 meses
022.9K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: una herramienta eficaz de rastreo web para el preentrenamiento de LLM

Introducción exhaustiva Crawl4LLM es un proyecto de código abierto desarrollado conjuntamente por la Universidad de Tsinghua y la Universidad Carnegie Mellon, centrado en optimizar la eficiencia del rastreo web para el preentrenamiento de grandes modelos (LLM). Reduce significativamente el rastreo ineficaz mediante la selección inteligente de datos web de alta calidad, afirmando ser capaz de rastrear originalmente 1...
hace 8 meses
022.9K
AI Logo:AI快速生成定制化品牌Logo

Logotipo AI: la IA genera rápidamente logotipos de marca personalizados

Introducción general AI Logo es un proyecto de aplicación de IA de código abierto con el objetivo de ayudar a los usuarios a generar rápidamente logotipos de marca personalizados mediante inteligencia artificial. Combina potentes técnicas de IA como Stable Diffusion y DeepAI para permitir a los usuarios introducir...
hace 7 meses
022.9K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: integra fácilmente múltiples modelos de IA y crea aplicaciones multimodales basadas en Gradio

Introducción general ai-gradio es un conjunto de herramientas Python de código abierto diseñado para ayudar a los desarrolladores a integrar y utilizar fácilmente múltiples modelos de IA. Construido sobre Gradio, el proyecto proporciona una interfaz unificada para soportar múltiples modelos y servicios de IA. Ya sea texto, voz o vídeo...
hace 8 meses
022.9K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: generación de entradas de blog a partir de contenidos de voz basados en LangGraph, blogs de redacción automatizada

Introducción general Robo Blogger es una innovadora herramienta de creación de blogs diseñada para simplificar el proceso de generación de contenidos mediante la tecnología de voz a texto. Los usuarios pueden grabar ideas a través de cualquier aplicación de voz a texto, y Robo Blogger convierte esas ideas en contenido de blog estructurado....
hace 10 meses
022.9K
DSPy Examples:展示DSPy功能的实用示例

Ejemplos DSPy: Ejemplos prácticos que demuestran la funcionalidad de DSPy

Introducción general La base de código de ejemplos DSPy es una base de código GitHub mantenida por el equipo de IA de Langtrace que muestra una variedad de programas de IA de ejemplo construidos con DSPy. La base de código está diseñada para demostrar las muchas características de DSPy a través de ejemplos del mundo real para ayudar a los...
hace 8 meses
022.9K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: un creador de portadas en línea diseñado para generar portadas personalizadas para blogs, vídeos cortos, redes sociales y mucho más.

Introducción general Mini-Cover es una herramienta de generación de portadas en línea de código abierto diseñada para generar portadas personalizadas para plataformas como blogs, vídeos cortos y redes sociales. Desarrollada por JLinMr, la herramienta pretende ofrecer una solución sencilla y eficaz para ayudar a los usuarios a generar rápidamente portadas que se ajusten a sus necesidades....
hace 10 meses
022.9K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: una herramienta eficaz de aprendizaje y previsión de predicciones meteorológicas mundiales a medio plazo basada en modelos de difusión

Introducción general GraphCast es una herramienta avanzada de previsión meteorológica desarrollada por Google DeepMind que pretende mejorar la precisión de las previsiones meteorológicas globales a medio plazo mediante técnicas de aprendizaje profundo. El proyecto proporciona una variedad de modelos preentrenados y código de muestra, que los usuarios pueden...
hace 10 meses
022.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: un nuevo marco de orquestación de agentes impulsado por LLM y EKG (conocimiento del sector)

Introducción general muAgent es un innovador marco multiinteligentsia desarrollado por Ant Group. El marco ayuda a los usuarios a ejecutar diversos procedimientos operativos estándar (SOP) complejos bajo orientación humana mediante arrastrar y soltar en lienzo y escritura de texto simple, en colaboración con multiintelligentsia, llamadas a funciones, intérpretes de código y otras tecnologías....
hace 11 meses
022.8K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: un marco de código abierto para optimizar los proyectos de avisos con el fin de mejorar el rendimiento de las tareas.

Introducción completa PromptWizard es un marco de código abierto desarrollado por Microsoft que utiliza un mecanismo autoevolutivo que permite al modelo generar, evaluar y mejorar las palabras clave y generar ejemplos por sí mismo, mejorando la calidad del resultado mediante una retroalimentación continua. Puede optimizar de forma autónoma las palabras clave, generar y seleccionar ejemplos adecuados y...
hace 10 meses
022.8K
Trackers:用于视频对象跟踪的开源工具库

Trackers: biblioteca de herramientas de código abierto para el seguimiento de objetos en vídeo

Introducción general Trackers es una biblioteca de herramientas Python de código abierto centrada en el seguimiento multiobjeto en vídeo. Integra varios algoritmos de seguimiento líderes, como SORT y DeepSORT, y permite a los usuarios combinar diferentes modelos de detección de objetos (como YOLO...
hace 5 meses
022.8K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Modelo de transferencia de maquillaje jerárquico autosupervisado, maquillaje virtual, migración del maquillaje a nuevos retratos.

Introducción exhaustiva SHMT (Self-supervised Hierarchical Makeup Transfer) es un proyecto de migración de maquillaje jerárquico autosupervisado basado en un modelo de difusión latente, cuyo objetivo es lograr una alta calidad de los efectos de maquillaje mediante métodos de aprendizaje no supervisados....
hace 9 meses
022.8K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atómicos: un marco para construir inteligencias de IA modulares y ligeras

Introducción general Atomic Agents es un framework extremadamente ligero y modular diseñado en torno al concepto de atomicidad para construir pipelines y aplicaciones de IA con agentes. El marco proporciona un conjunto de herramientas y agentes que pueden combinarse para crear potentes aplicaciones. Se basa en Instruc...
hace 10 meses
022.8K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: sistema de procesamiento de documentos PDF y preguntas y respuestas basado en FastAPI

Introducción general FastAPI DocGPT es un sistema de cuestionarios sobre documentos basado en FastAPI que permite a los usuarios cargar archivos PDF y realizar cuestionarios basados en el contenido de los documentos. El sistema utiliza la tecnología de incrustación de OpenAI para incrustar el contenido del documento en una base de datos vectorial Q...
hace 11 meses
022.8K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker mejorado para generar personas digitales utilizando vídeo de retratos

Descripción general SadTalker-Video-Lip-Sync es una herramienta de síntesis labial de vídeo basada en la implementación de SadTalkers. El proyecto genera formas labiales a través de la generación por voz y utiliza la mejora configurable de la región facial para mejorar la claridad de las formas labiales generadas....
hace 8 meses
022.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: creación de grafos de conocimiento y motores de búsqueda personales de ejecución local

Introducción general Unigraph es un grafo de conocimiento de propósito general y motor de búsqueda personal diseñado para proporcionar a los usuarios un espacio de trabajo integrado que les ayude a gestionar y buscar una amplia variedad de datos en su vida personal. Con Unigraph, los usuarios pueden integrar datos de distintas fuentes en un...
hace 9 meses
022.8K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: generación y traducción automática de subtítulos multilingües para vídeos con ayuda de la IA.

Introducción general AI no jimaku gumi (AI no subtitle group) es una potente herramienta de procesamiento de subtítulos de vídeo de línea de comandos centrada en permitir funciones automatizadas de extracción, transcripción y traducción de subtítulos de vídeo. La herramienta integra tecnologías avanzadas de inteligencia artificial, como...
hace 9 meses
022.8K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI: proyecto de código abierto de navegación por herramientas ligeras de IA

Introducción completa Tap4 AI WebUI es un proyecto de sitio web de navegación de herramientas de IA de código abierto, diseñado para ayudar a los usuarios a construir fácilmente su propio catálogo de herramientas de IA. El proyecto utiliza Next.js y la pila de tecnología Supabase , soporte para la optimización SEO multi-idioma para proporcionar AI...
hace 12 meses
022.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI Agents SDK: un marco de trabajo en Python para crear flujos de trabajo colaborativos multiinteligencia

Introducción general OpenAI Agents SDK es una herramienta de desarrollo ligera de OpenAI diseñada para construir flujos de trabajo multi-inteligentsia. Está basado en Python y es fácil de usar, permitiendo a los desarrolladores configurar Agentes, cortar tareas...
hace 7 meses
022.8K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: configuración flexible de las herramientas nativas de diálogo y tratamiento de documentos de IA

Introducción general H2O GPT es un proyecto de código abierto cuyo objetivo es proporcionar capacidades privatizadas de chat y procesamiento de documentos. El proyecto se basa en la licencia Apache 2.0 y admite diversos modelos de GPT, como LLaMa2, Mistral, Falcon y otros. Uso ...
hace 10 meses
022.8K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.

Introducción general TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle su ordenador a través de la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar...
hace 9 meses
022.8K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: un gran modelo médico de apoyo al análisis de imágenes médicas y a las preguntas y respuestas diagnósticas

Introducción exhaustiva HealthGPT es un modelo avanzado de gran lenguaje visual médico que pretende lograr capacidades unificadas de comprensión y generación visual médica mediante la adaptación de conocimientos heterogéneos. El objetivo del proyecto es integrar la comprensión visual médica y las capacidades de generación en un marco autorregresivo unificado que mejore significativamente la...
hace 8 meses
022.8K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: Base de conocimientos + LLM Mentor inteligente de revisión de código para GitHub

Introducción completa CR-Mentor es una herramienta inteligente de revisión de código que combina una base de conocimientos profesional con la potencia de Large Language Modelling (LLM). No sólo admite la revisión de código para todos los lenguajes de programación, sino que también personaliza criterios de revisión exclusivos y áreas de enfoque para los equipos basándose en las mejores prácticas acumuladas en la base de conocimientos. A través de...
hace 11 meses
022.8K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: una versión de código abierto del modelo OpenAI o1 basado en Qwen2-7B-Instruye el ajuste fino para explorar modelos de inferencia abiertos para resolver problemas complejos.

Introducción Marco-o1 es un modelo de razonamiento abierto desarrollado por Alibaba International Digital Commerce Group (AIDC-AI) para resolver problemas complejos del mundo real. El modelo combina el ajuste fino de Chain of Thought (CoT), Monte Carlo Tree Search (MCTS) y estrategias de razonamiento innovadoras....
hace 10 meses
022.8K
Plandex:支持超长上下文的开源AI编码助手

Plandex: un asistente de código abierto para la codificación de IA con soporte para contextos ultralargos

Introducción General Plandex es un código abierto de extremo a extremo AI codificación asistente diseñado para proyectos de software grandes y complejos. Puede planificar y ejecutar tareas de múltiples pasos, manejar contextos de hasta 2 millones de fichas y soportar más de 30 lenguajes de programación.Plandex ofrece...
hace 6 meses
022.8K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: herramientas de código abierto para la ampliación y el suavizado de imágenes de cualquier tamaño

Introducción general Thera es una herramienta de superresolución de imágenes de código abierto desarrollada por un equipo de la ETH de Zúrich y la Universidad de Zúrich. Puede ampliar imágenes de baja resolución a escalas arbitrarias, como 2x, 3,14x o incluso múltiplos no enteros, y poner...
hace 6 meses
022.7K
StickerBaker:用AI制作个性贴纸图片

StickerBaker: Crea pegatinas personalizadas con IA

Descripción general stickerbaker es un creador de pegatinas de código abierto que utiliza tecnología de inteligencia artificial para crear una gran variedad de pegatinas interesantes. Tanto si quieres una simple pegatina de un gato como si quieres hacer una serie de pegatinas diversas, stickerbaker puede satisfacer tus necesidades....
hace 1 año
022.7K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: herramienta de conversión de texto a voz multilingüe (compatible con más de 7000 idiomas), rápida y controlable.

Introducción general IMS Toucan es un avanzado kit de herramientas de conversión de texto a voz (TTS) desarrollado por el Instituto de Procesamiento del Lenguaje Natural (IMS) de la Universidad de Stuttgart (Alemania). El kit de herramientas es compatible con más de 7000 idiomas y es rápido, controlable y requiere pocos recursos informáticos.IMS...
hace 8 meses
022.7K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

ScrapeGraphAI: Una palabra rápida para el rastreo web, sin necesidad de escribir reglas herramienta inteligente de extracción de contenido web.

Introducción completa ScrapeGraphAI es una innovadora biblioteca de raspado web Python que combina inteligentemente Large Language Modelling (LLM) y Direct Graph Logic para crear tuberías de raspado para sitios web y documentos locales. Lo que hace única a esta herramienta es su perfecto nivel de simplicidad y potencia...
hace 9 meses
022.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: Creación de mini-inteligencias LLM con "estructura de grafo dirigido" en 100 líneas de código

Introducción general miniLLMFlow es un marco de desarrollo minimalista de Large Language Model (LLM) que contiene sólo 100 líneas de código central, demostrando la filosofía de diseño de "mantenerlo simple". El marco está diseñado específicamente para permitir a los asistentes de IA (por ejemplo, ChatGPT, Claude, etc.)...
hace 9 meses
022.7K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: una herramienta de generación y edición de fotos que conserva los rasgos faciales

Introducción general InfiniteYou es un proyecto de código abierto desarrollado por el equipo de ByteDance Intelligent Creation. Se basa en la tecnología de Transformadores de Difusión (DiTs), utilizando el modelo FLUX.1-dev, la función principal es permitir a los usuarios subir una foto e introducir una descripción de texto, generando...
hace 7 meses
022.7K
Pyramid Flow:快手推出的开源版

Pyramid Flow: una versión de código abierto de "Kringle" lanzada por Racer, basada en SD3 y que funciona en GPU de menos de 8 GB (versión de despliegue con un solo clic).

Introducción exhaustiva Pyramid Flow es un eficaz método autorregresivo de generación de vídeo basado en la técnica Flow Matching. El método consigue una mayor eficiencia computacional en la generación y descompresión de contenidos de vídeo interpolando entre diferentes resoluciones y niveles de ruido....
hace 11 meses
022.7K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: una herramienta de código abierto para detectar posibles riesgos de seguridad en los sistemas de IA

Introducción completa AI-Infra-Guard es una herramienta de evaluación de la seguridad de la infraestructura de IA de código abierto desarrollada por el equipo de seguridad híbrida de Tencent, Zhuqiao Labs, que está diseñada para ayudar a los usuarios a descubrir y detectar rápidamente posibles riesgos de seguridad en los sistemas de IA. La herramienta es compatible con más de 30 marcos y componentes de IA para...
hace 8 meses
022.7K
Novel:模仿Notion AI的开源写作编辑器

Novel: un editor de escritura de código abierto que imita a Notion AI

Introducción integral Este es un proyecto de código abierto desarrollado por Steven Tey llamado Novel, es un editor de texto WYSIWYG estilo Noción , integrado AI función de autocompletado que puede ayudar a los usuarios a mejorar la eficiencia de la entrada de texto . El proyecto proporciona documentación detallada e instrucciones de instalación ...
hace 1 año
022.7K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Swarm: un proyecto pedagógico experimental para el aprendizaje de sistemas corporales ligeros multiinteligentes (ejemplo de OpenAI)

Introducción general Swarm es un marco educativo experimental desarrollado por OpenAI para explorar interfaces ligeras, controladas y fáciles de probar para sistemas multiagente. El marco se utiliza principalmente para demostrar traspasos y patrones rutinarios entre agentes, ayudando a los desarrolladores a comprender e implementar la coordinación y ejecución de sistemas multiagente....
hace 9 meses
022.7K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: extrae cualquier dato no estructurado de documentos/multimedia y lo analiza para convertirlo en datos estructurados.

Introducción general OmniParse es una potente plataforma de análisis y optimización de datos diseñada para transformar cualquier dato no estructurado en datos estructurados y procesables, optimizada para el marco GenAI (Generative Artificial Intelligence). Tanto si trabaja con documentos, tablas, imágenes, vídeos, archivos de audio o...
hace 11 meses
022.7K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: Integración de múltiples fuentes de datos en un único archivo de texto

Introducción completa OneFileLLM es una herramienta de línea de comandos de código abierto diseñada para consolidar múltiples fuentes de datos en un único archivo de texto para facilitar la entrada en grandes modelos lingüísticos (LLM). Permite procesar repositorios de GitHub, artículos de ArXiv, transcripciones de vídeos de YouTube,...
hace 6 meses
022.7K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: un conjunto de herramientas para construir rápidamente interfaces de chat de IA con soporte para la integración de modelos y la gestión del flujo de datos.

Introducción Ant Design X es un conjunto de herramientas de código abierto de Ant Group, diseñado para ayudar a los desarrolladores a crear rápidamente interfaces de diálogo basadas en IA. Proporciona un amplio conjunto de componentes y plantillas, soporta la integración de modelos compatibles con los estándares OpenAI, y es adecuado para una variedad de aplicaciones tales como servicio al cliente inteligente, asistentes de IA, y otros...
hace 11 meses
022.6K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: base de conocimientos conversacional basada en GraphRAG/herramienta de búsqueda profunda en la web con diálogos que pueden integrarse en otros sitios web.

Introducción general AutoFlow es una herramienta de código abierto desarrollada por PingCAP para construir bases de conocimiento basadas en grafos con almacenamiento vectorial sin servidor TiDB. Integra los frameworks LlamaIndex y DSPy para soportar búsquedas complejas de diálogos y grafos de conocimiento....
hace 9 meses
022.6K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: una herramienta de código abierto para completar todo el proceso de investigación científica con agentes inteligentes

Introducción general AgentLaboratory es una herramienta de código abierto alojada en GitHub y desarrollada por Samuel Schmidgall. Utiliza agentes inteligentes impulsados por Large Language Models (LLMs) para ayudar a los investigadores con todo el proceso de...
hace 7 meses
022.6K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: una herramienta de chat para recuperar conocimientos a partir de datos de Wikipedia

Introducción general WikiChat es un chatbot experimental desarrollado en la Universidad de Stanford que pretende mejorar la factualidad de los grandes modelos lingüísticos recuperando datos de Wikipedia. Los grandes modelos lingüísticos (como ChatGPT y GPT-4) tienden a procesar información actualizada o temas menos populares cuando...
hace 9 meses
022.6K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Academic: Mejor artículo académico de Arxiv Traducción, corrección de errores e interpretación de códigos

Introducción general GPT Academic es una plataforma interactiva para grandes modelos lingüísticos optimizada para la investigación académica, que proporciona herramientas para interfaces interactivas pragmáticas con grandes modelos lingüísticos como GPT/GLM, optimizadas específicamente para la experiencia de traducción, lectura, pulido y redacción de documentos. Utiliza un diseño modular...
hace 11 meses
022.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: un marco de trabajo en Python para crear flujos de trabajo controlados y transparentes del Cuerpo de Inteligencia Artificial

Introducción general ControlFlow es un framework Python desarrollado por PrefectHQ centrado en la construcción y gestión de flujos de trabajo de IA. Proporciona un marco estructurado y orientado al desarrollador para definir flujos de trabajo y delegar tareas a la generación de Large Language Model (LLM)....
hace 10 meses
022.6K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: generar investigación sobre IA a partir del contenido de las búsquedas web

Introducción general Open Deep Research es una herramienta de código abierto de generación de informes de investigación impulsada por IA como alternativa de código abierto a las capacidades de investigación profunda de Google Gemini. El proyecto está desarrollado en TypeScript y basado en Next.js 1...
hace 7 meses
022.6K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI Portrait Master versión china: Herramienta de palabras clave para optimizar la generación de retratos

Introducción General ComfyUI Portrait Master versión China es una herramienta de generación de palabras clave para retratos diseñada para creadores de imágenes AI. La herramienta ayuda a los usuarios a generar retratos de alta calidad mediante la optimización de las palabras clave. Los usuarios pueden elegir diferentes lentes según la demanda...
hace 1 año
022.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: un asistente inteligente para las redes sociales que genera y gestiona automáticamente los contenidos de las mismas.

Introducción general Social Media Agent (Agente de Medios Sociales) es un proyecto de código abierto que gestiona la información de interacción mediante el nuevo Agent Inbox, diseñado para ayudar a los usuarios a automatizar la generación y gestión de contenidos de medios sociales. El proyecto está desarrollado por el equipo LangChain...
hace 9 meses
022.6K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...
hace 8 meses
022.6K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: una biblioteca Python de código abierto para que los científicos de datos realicen análisis de datos y aplicaciones de IA eficientes

Introducción general Taipy es una potente biblioteca de Python desarrollada por Avaiga diseñada para que los científicos de datos y los ingenieros de aprendizaje automático creen y desplieguen rápidamente aplicaciones web basadas en datos.Taipy...
hace 10 meses
022.6K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: generación de activos digitales modelados en 3D de alta resolución a partir de una sola imagen

Introducción general TripoSG es un proyecto de código abierto desarrollado por el equipo de investigación VAST AI para generar modelos 3D de alta calidad a partir de una sola imagen. El proyecto utiliza tecnología de convertidor rectificador-flujo a gran escala, combinada con entrenamiento híbrido supervisado y conjuntos de datos de alta calidad, para permitir que los modelos 3D generados tengan...
hace 7 meses
022.6K