Proyecto AI de código abierto

Total 1020 artículos
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: revolucionaria tecnología de generación de imágenes de altísima resolución con gran riqueza de detalles

Introducción general UltraPixel es una tecnología avanzada de generación de imágenes de ultra alta resolución diseñada para crear imágenes de altísima calidad y ricas en detalles. Fue desarrollada por el usuario de GitHub catcathh y presentada en NeurIPS 2024.U...
hace 10 meses
02.8K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher: herramienta automatizada de investigación en profundidad para redactar informes de investigación completos.

Introducción general OpenDeepResearcher es una herramienta de investigación profunda automatizada de código abierto diseñada para mejorar la eficiencia de la investigación mediante técnicas de inteligencia artificial. El proyecto está desarrollado por mshumer y alojado en GitHub.OpenDeepResear...
hace 4 meses
02.8K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atómicos: un marco para construir inteligencias de IA modulares y ligeras

Introducción general Atomic Agents es un framework extremadamente ligero y modular diseñado en torno al concepto de atomicidad para construir pipelines y aplicaciones de IA con agentes. El marco proporciona un conjunto de herramientas y agentes que pueden combinarse para crear potentes aplicaciones. Se basa en Instruc...
hace 8 meses
02.8K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: cargue una imagen y migre las funciones de retrato para generar diferentes estilos de imágenes

Introducción completa InstantID es una tecnología avanzada centrada en la generación de imágenes con estilos o poses personalizados en cuestión de segundos, al tiempo que garantiza un alto nivel de fidelidad utilizando una única imagen de identificación de referencia. La tecnología utiliza una solución basada en un modelo de difusión mediante la integración de imágenes faciales, mapas de puntos de referencia...
hace 12 meses
02.8K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: una interfaz de gestión para la interacción persona-ordenador con inteligencias IA

Introducción general Agent Inbox es un proyecto de código abierto desarrollado por el equipo LangChain para proporcionar una nueva experiencia de usuario para interactuar con inteligencias AI. El proyecto permite a los usuarios gestionar y optimizar las interacciones con múltiples inteligencias IA a través de una interfaz centralizada.Ag...
hace 7 meses
02.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: una herramienta para convertir contenidos web en canales RSS mediante IA

Introducción general AI RSS es una herramienta innovadora para convertir contenidos web en fuentes RSS mediante tecnología de IA. Consta de dos partes principales: un complemento del navegador y un servidor. El complemento del navegador permite a los usuarios seleccionar listas de páginas web y generar archivos de descripción de datos estructurados (SDD)...
hace 7 meses
02.8K
Ovis:视觉与文本对齐模型,精准反推图像提示词

Ovis: un modelo de alineación visual y textual para la retropropagación precisa de palabras clave de imágenes

Introducción general Ovis (Open VISion) es un modelo de lenguaje multimodal (MLLM) de código abierto desarrollado por el equipo AIDC-AI del Grupo de Comercio Digital Internacional de Alibaba y alojado en GitHub.El modelo utiliza una innovadora técnica de alineación de estructura...
hace 5 meses
02.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: un nuevo marco de orquestación de agentes impulsado por LLM y EKG (conocimiento del sector)

Introducción general muAgent es un innovador marco multiinteligentsia desarrollado por Ant Group. El marco ayuda a los usuarios a ejecutar diversos procedimientos operativos estándar (SOP) complejos bajo orientación humana mediante arrastrar y soltar en lienzo y escritura de texto simple, en colaboración con multiintelligentsia, llamadas a funciones, intérpretes de código y otras tecnologías....
hace 9 meses
02.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: extrae los datos del cuerpo de una URL HTML, salida texto plano/markdown

Introducción general magic-html es una biblioteca de Python diseñada para simplificar el proceso de extracción del contenido de la región del cuerpo a partir de HTML. Tanto si se trata de estructuras HTML complejas como de páginas web sencillas, esta biblioteca pretende proporcionar una interfaz cómoda y eficiente a los usuarios. Soporta la extracción multimodal...
hace 11 meses
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: una herramienta de código abierto para la extracción y exploración eficientes de datos estructurados

Introducción exhaustiva Knowledge Table (Tabla de conocimientos) es un proyecto de código abierto diseñado para simplificar el proceso de extracción y exploración de datos estructurados a partir de documentos no estructurados. Los usuarios pueden crear representaciones estructuradas del conocimiento, como tablas y gráficos, mediante una interfaz de consulta en lenguaje natural. La herramienta permite personalizar la extracción ...
hace 10 meses
02.8K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: una herramienta de código abierto para generar retratos hablados realistas

Introducción general FantasyTalking es un proyecto de código abierto desarrollado por el equipo Fantasy-AMAP, centrado en la generación de realismo hablando videos retrato a través de la unidad de audio. El proyecto se basa en el modelo avanzado de difusión de vídeo Wan2.1 , combinado con el codificador de audio Wa...
hace 3 meses
02.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general mac assistant es un proyecto de cuerpo de inteligencia AI diseñado para macOS, con el objetivo de simplificar las operaciones del usuario mediante la combinación de software nativo y funciones web. Actualmente, el proyecto es compatible con las API OpenAI y GEMINI, y tiene previsto ...
hace 6 meses
02.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: Complemento del navegador para que ChatGPT funcione en otras páginas web

Introducción general ChatGPT Box es una extensión de navegador de código abierto diseñada para integrar profundamente ChatGPT en el navegador de un usuario. Desarrollada por josStorer, la herramienta soporta múltiples idiomas y proporciona una variedad de características tales como llamar a pares de chat en cualquier página...
hace 4 meses
02.8K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: herramienta de escaneo de vulnerabilidades LLM de código abierto que proporciona pruebas fuzz y técnicas de ataque exhaustivas.

Introducción general Agentic Security es una herramienta de escaneo de vulnerabilidades LLM (Large Language Model) de código abierto diseñada para proporcionar a los desarrolladores y profesionales de la seguridad pruebas fuzz completas y técnicas de ataque. La herramienta admite conjuntos de reglas personalizadas o ataques basados en agentes y es capaz de integrar LLM AP...
hace 6 meses
02.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: herramienta de generación y depuración automática de código con soporte multilingüe

Introducción general AutoDev es un proyecto de código abierto desarrollado por el equipo de Unit Mesh y alojado en GitHub, cuyo objetivo es mejorar la eficiencia de programación de los desarrolladores mediante tecnología de inteligencia artificial. Es un potente asistente de codificación que soporta múltiples lenguajes de programación, incluyendo Ja...
hace 6 meses
02.8K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: una estrategia genérica de fragmentación semántica basada en Llama-70B

Introducción general zChunk es una novedosa estrategia de chunking desarrollada por ZeroEntropy que pretende ofrecer una solución para el chunking semántico genérico. La estrategia se basa en el modelo Llama-70B, que optimiza el proceso de chunking de los documentos solicitando la generación de trozos, lo que garantiza que la recuperación de información se mantenga en un alto...
hace 6 meses
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: Sistema de automatización de correo electrónico con IA localizada para la generación rápida de respuestas a borradores de correo electrónico (Gmail)

Introducción general LAMBDA (Local Auto MailBox Draft Assistant) es un sistema de automatización de correo electrónico con IA localizada diseñado para aprender del estilo de correo electrónico de un usuario y generar un borrador para cada correo no leído en la bandeja de entrada de Gmail....
hace 8 meses
02.8K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: herramienta de integración del protocolo de contexto de modelo (MCP) para aplicaciones de IA

Introducción general Klavis AI es una plataforma de código abierto centrada en simplificar el uso y la integración del Protocolo de Contexto de Modelo (MCP), un estándar abierto que permite a las aplicaciones de IA conectarse dinámicamente con herramientas y fuentes de datos externas.Klavis AI proporciona a Slack...
hace 3 meses
02.8K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D con audio de personas digitales interactivas en tiempo real, que funcionan a 30 fps en la CPU.

Introducción general LiteAvatar es una herramienta de código abierto desarrollada por el equipo HumanAIGC (parte de Ali) que se centra en generar animaciones faciales a partir de avatares 2D controlados por audio en tiempo real. Funciona a 30 fotogramas por segundo (fps) dependiendo únicamente de la CPU, y está especialmente indicada para...
hace 6 meses
02.8K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: flujos de trabajo corporales inteligentes basados en lenguaje natural para la automatización de escritorios y navegadores

Introducción general Eko es un marco JavaScript de nivel de producción diseñado para construir flujos de trabajo de agentes inteligentes eficientes mediante descripciones en lenguaje natural. Está diseñado para permitir a los desarrolladores automatizar tareas cotidianas utilizando tecnologías de IA sin necesidad de programac...
hace 5 meses
02.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: un organismo inteligente para el análisis de radiografías de tórax mediante macromodelos multimodales

Introducción completa MedRAX es una inteligencia artificial de última generación diseñada para el análisis de radiografías de tórax (CXR). Integra herramientas de análisis CXR de última generación y grandes modelos de lenguaje multimodal para procesar dinámicamente consultas médicas complejas sin formación adicional.MedRAX, a través de su diseño modular...
hace 5 meses
02.8K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: marco de código abierto para la inferencia y planificación de la conducción autónoma de Xiaomi

Introducción Orion es un proyecto de código abierto desarrollado por Xiaomi Labs, centrado en la tecnología de conducción autónoma de extremo a extremo (E2E). Resuelve el problema del insuficiente razonamiento causal en escenarios complejos por parte de los métodos tradicionales de conducción autónoma mediante modelos de lenguaje visual (VLM) y planificadores generativos.Orion integra largas...
hace 4 meses
02.8K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extracción y categorización de documentos en datos estructurados para optimizar el proceso de tratamiento de documentos.

Introducción exhaustiva ExtractThinker es una herramienta flexible de inteligencia de documentos que extrae y clasifica datos estructurados de documentos utilizando modelos de grandes lenguajes (LLM), proporcionando un flujo de trabajo de procesamiento de documentos sin fisuras similar a ORM. Es compatible con diversos cargadores de documentos, como Tess...
hace 7 meses
02.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: despliegue sin servidor de un sitio de diálogo multimodal Gemini

Introducción General Gemini Playground es un proyecto de código abierto diseñado para ayudar a los usuarios a implementar rápidamente un sitio de diálogo multimodal . El proyecto es desarrollado por el camarón de rastreo técnico , apoyar el uso de Gemini API Key en 10 segundos para completar el despliegue . Si el usuario es ...
hace 6 meses
02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: una herramienta para simplificar el proceso de ajuste de modelos de los principales lenguajes visuales de código abierto

Introducción Maestro es una herramienta desarrollada por Roboflow para simplificar y acelerar el proceso de ajuste fino de modelos multimodales, de modo que todo el mundo pueda entrenar sus propios macromodelos visuales. Proporciona recetas ya preparadas para el ajuste fino de modelos de lenguaje visual (VLM) populares como F...
hace 6 meses
02.7K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: Chatbots personalizados para la integración rápida de múltiples fuentes de datos

Introducción general OpenChat es una consola de chatbot fácil de usar diseñada para simplificar el uso de modelos lingüísticos extensos (LLM). Mediante un proceso de configuración en dos pasos, OpenChat permite a los usuarios crear y gestionar fácilmente varios chatbots personalizados. La plataforma es compatible con G...
hace 7 meses
02.7K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: convertir ebooks epub en audiolibros m4b

Introducción general Autiobooks es una herramienta de código abierto diseñada para ayudar a los usuarios a convertir rápidamente libros electrónicos en formato .epub a audiolibros en formato .m4b. Utiliza tecnología de síntesis de voz de alta calidad proporcionada por Kokoro para generar un audio natural y fluido. Esta herramienta fue desarrollada por...
hace 5 meses
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: Wisdom Spectrum lanzó un potente modelo de generación de textos ultralargos, que permite generar más de 10.000 palabras en una sola conversación.

Introducción LongWriter es una potente herramienta de generación de textos largos desarrollada por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM). La herramienta se basa en el avanzado Long Context Language Model (LLM) y es capaz de generar textos largos de más de 10.000 palabras.LongWriter...
hace 8 meses
02.7K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI: Sistema de gestión de interfaz de reenvío de modelos de IA de alto valor, el sitio web oficial ofrece cuota API gratuita diaria.

Introducción general VoAPI es un nuevo sistema de gestión y distribución de interfaces de modelos de IA de alto perfil y alto rendimiento, que se utiliza principalmente para la gestión interna y los canales de distribución personales o empresariales. Desarrollado sobre la base de NewAPI, el sistema proporciona módulos funcionales ricos e interfaz de usuario optimizada, con el objetivo de mejorar...
hace 9 meses
02.7K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Creación de un sistema inteligente de preguntas y respuestas sobre documentos y creación sencilla de una base de conocimientos web privada

Introducción completa RAG Web UI es un sistema de diálogo inteligente basado en la tecnología RAG (Retrieval Augmented Generation). Ayuda a empresas y particulares a crear sistemas inteligentes de preguntas y respuestas basados en su propia base de conocimientos. Combinando la recuperación de documentos y grandes modelos lingüísticos, RAG Web UI proporciona...
hace 7 meses
02.7K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: generación de consultas SQL precisas a partir de texto mediante técnicas RAG

Introducción exhaustiva Vanna es un marco Python de código abierto con licencia del MIT centrado en la generación de consultas SQL mediante técnicas RAG (Retrieval Augmented Generation). Los usuarios pueden entrenar modelos RAG, aplicarlos a sus propios datos, y luego hacer preguntas, y Vanna devolverá los s...
hace 7 meses
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: un entorno de programación visual de código abierto para probar y evaluar la eficacia de grandes sugerencias de modelos lingüísticos

Introducción general ChainForge es un entorno de programación visual de código abierto diseñado para probar y evaluar la eficacia de grandes modelos de lenguaje (LLM). Proporciona un entorno de ingeniería de señales de flujo de datos a través del cual los usuarios pueden explorar y analizar rápidamente la calidad de las diferentes señales en la respuesta LLM....
hace 8 meses
02.7K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: un modelo de código abierto para el reconocimiento multilingüe de voz de alta precisión

Introducción general FireRedASR es un modelo de reconocimiento del habla desarrollado y de código abierto por el equipo de Little Red Book FireRed, centrado en proporcionar soluciones de reconocimiento automático del habla (ASR) de alta precisión y compatibles con varios idiomas. El proyecto está alojado en GitHub para desarrolladores e investigadores, y ofrece...
hace 5 meses
02.7K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: una herramienta para gestionar la colaboración multiinteligencia mediante inteligencias supervisoras

Introducción general LangGraph Supervisor es una librería Python basada en el framework LangGraph, diseñada para crear y gestionar sistemas de cuerpos multi-inteligentes. La librería coordina el trabajo de múltiples agentes especializados a través de un agente supervisor central, asegurando que los flujos de comunicación y las tareas se dividen...
hace 6 meses
02.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: una herramienta virtual de alta fidelidad para mejorar la autenticidad de los detalles de la ropa

Introducción exhaustiva FitDiT es un sistema de ajuste virtual de alta fidelidad basado en transformadores de difusión (Diffusion Transformers). Desarrollado por Tencent AI Lab, el proyecto pretende abordar las limitaciones de los sistemas tradicionales de ajuste virtual a la hora de mostrar los detalles de las prendas.FitD...
hace 7 meses
02.7K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: proyecto de código abierto para la búsqueda por inferencia profunda mediante conocimiento local

Introducción exhaustiva Deep Searcher es una potente herramienta que combina grandes modelos lingüísticos (LLM) y bases de datos vectoriales diseñada para buscar, evaluar y razonar a partir de datos privados, proporcionando respuestas muy precisas e informes exhaustivos. Es adecuado para la gestión del conocimiento empresarial...
hace 6 meses
02.7K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: motor de código abierto para la implantación de FLUX en entornos de baja densidad, Wan 2.1

Introducción general DiffSynth-Engine es un proyecto de código abierto lanzado por ModelScope, alojado en GitHub.Se basa en la tecnología de modelado de difusión, se centra en la generación eficiente de imágenes y vídeos, y es adecuado para que los desarrolladores desplieguen modelos de IA en entornos de producción....
hace 5 meses
02.7K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragmentos: versiones de código abierto de aplicaciones como Claude Artifacts de Anthropic, Vercel v0 o GPT Engineer.

Introducción general Fragments by E2B es un proyecto de código abierto que proporciona una plantilla basada en Next.js para construir aplicaciones generadas íntegramente por IA. Desarrollado por E2B, el proyecto pretende simplificar y acelerar el proceso de desarrollo de aplicaciones de IA. Integra una variedad de ...
hace 9 meses
02.7K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: Interfaz de chat web sencilla con modelos de IA multiplataforma integrados (sin implantación)

Introducción general OrionChat es una interfaz de chat de IA basada en web que proporciona a los usuarios una plataforma unificada para interactuar con múltiples modelos de IA de corriente principal. El proyecto es compatible con una amplia gama de modelos de IA, incluidos Ollama (que se ejecuta localmente), OpenAI GPT, Google Gemi...
hace 8 meses
02.7K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6G de memoria gráfica de bajo crecimiento rápido de vídeo largo proyecto de código abierto

Introducción general FramePack es una herramienta de generación de vídeo de código abierto centrada en hacer más prácticas las técnicas de difusión de vídeo. Desvincula la carga de trabajo de generación de la longitud del vídeo comprimiendo los fotogramas de entrada a una longitud fija mediante una red neuronal única de predicción del siguiente fotograma. Esto significa que, incluso cuando se generan vídeos largos, los requisitos de memoria de vídeo...
hace 3 meses
02.7K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: herramienta de IA para extraer prendas de vestir de una persona como imagen de visualización de prendas en mosaico.

Introducción general TryOffAnyone es una innovadora herramienta de procesamiento de imágenes AI diseñada para resolver los desafíos de la exhibición de ropa en el sector del comercio electrónico. Es capaz de convertir de forma inteligente fotos de personas reales vistiendo ropa en imágenes de efecto de pantalla plana, esta tecnología se basa en la última...
hace 7 meses
02.7K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: Plataforma de código abierto de modelización de grandes lenguajes financieros para análisis y predicción financiera

Introducción general FinGPT es una plataforma de modelización de gran lenguaje financiero de código abierto desarrollada por la AI4Finance Foundation, diseñada para que el sector financiero resuelva tareas financieras complejas e impulse la innovación en fintech.FinGPT utiliza técnicas de adaptación ligera y enfoques de aprendizaje de refuerzo....
hace 7 meses
02.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: una herramienta multimodal de aprendizaje por refuerzo para explorar el razonamiento visual

Introducción general MM-EUREKA es un proyecto de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai, la Universidad Jiao Tong de Shanghai y otras partes. Amplía las capacidades de razonamiento textual a escenarios multimodales mediante técnicas de aprendizaje por refuerzo basadas en reglas para ayudar a los modelos a procesar información de imágenes y texto. El núcleo de esta herramienta...
hace 5 meses
02.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: una plantilla Next.js para crear aplicaciones de IA con diálogo de voz en tiempo real

Introducción completa OpenAI Realtime API Next.js es un proyecto de código abierto basado en el framework Next.js , diseñado para ayudar a los desarrolladores a crear rápidamente aplicaciones de IA de voz en tiempo real . El proyecto integra la API en tiempo real de OpenAI y la tecnología WebRTC....
hace 7 meses
02.7K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Descripción general Quadratic es una herramienta de hoja de cálculo inteligente de código abierto que combina características de IA, código y conectividad de datos diseñadas para proporcionar a los usuarios potentes capacidades de procesamiento y análisis de datos. Al soportar lenguajes de programación como Python, SQL y Rust, Quadratic...
hace 6 meses
02.7K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate: traducción de documentos a texto completo: traduce rápidamente documentos PDF/MD ingleses a documentos chinos.

Introducción completa Doc2XAPITranslate es una potente herramienta de traducción de documentos de texto completo diseñada para traducir rápidamente documentos PDF o Markdown en inglés a documentos chinos. La herramienta es compatible con una variedad de traductores, incluyendo DeepSeek, OpenAI, O...
hace 6 meses
02.7K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: una herramienta de IA para ofrecer tutorías personalizadas, un proyecto de tutor personal de IA de código abierto basado en Llama 3.1

Introducción general Llama Tutor es un proyecto de tutor personal de IA de código abierto basado en Llama 3.1, diseñado para proporcionar a los usuarios una experiencia de aprendizaje personalizada. Mediante la integración de múltiples pilas tecnológicas como Together AI, Next.js y T...
hace 9 meses
02.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: sistema de diálogo inteligente para personas digitales que combina grandes modelos lingüísticos y modelos visuales para nuevas experiencias interactivas.

Introducción general Linly-Talker es un innovador sistema digital de diálogo humano que combina grandes modelos lingüísticos (LLM) con modelos visuales para crear un enfoque novedoso de la interacción persona-ordenador. El sistema integra diversas tecnologías como Whisper, Linly, Micros...
hace 6 meses
02.7K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, una plataforma para construir modelos base de IA del mundo físico.

Introducción completa NVIDIA Cosmos es una plataforma de modelado basada en mundos para desarrolladores, diseñada específicamente para ayudar a los desarrolladores de IA de física a crear sus sistemas de IA de física mejor y más rápido. La plataforma ofrece una amplia gama de modelos preentrenados, incluidos modelos de difusión y autorregresivos...
hace 7 meses
02.7K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: una clave para generar audiolibros con calidad de sonido natural, compatible con PDF, epub, docx y otros formatos.

Introducción completa QuickPiperAudiobook es un proyecto de código abierto diseñado para convertir una variedad de formatos de texto (por ejemplo, epub, mobi, txt, PDF, HTML, etc) en audiolibros de sonido natural a través de un simple comando. La herramienta utiliza Pi...
hace 10 meses
02.7K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: una herramienta segura y fiable para probar aplicaciones LLM

Introducción completa promptfoo es una herramienta de línea de comandos de código abierto y la biblioteca dedicada a la evaluación y la prueba de red-teaming Large Language Model (LLM) aplicaciones. Proporciona a los desarrolladores un conjunto completo de herramientas para la construcción de prompts fiables, modelos, y la generación basada en la recuperación (RAGs) con auto...
hace 6 meses
02.7K
Docs:开源的协作笔记和文档管理工具

Docs: herramientas de código abierto para la gestión colaborativa de notas y documentos

Introducción general Docs es una plataforma colaborativa de código abierto para la toma de notas y la gestión de documentos desarrollada por el equipo de suitenumerique. Está construida usando tecnologías Django y React con el objetivo de proporcionar una herramienta fácil de usar para ayudar a los usuarios a tomar notas, gestionar...
hace 5 meses
02.7K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: una plataforma de IA para generar activos digitales modelados en 3D de alta resolución

Introducción general Neural4D es una innovadora plataforma basada en IA que se centra en ayudar a los usuarios a generar rápidamente modelos y animaciones 3D de alta calidad con la simple introducción de texto o imágenes. Desarrollada por DreamTech, se basa en la tecnología líder mundial de generación de modelos 3D de gran tamaño de extremo a extremo....
hace 6 meses
02.7K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: Cursor de código abierto para el diseño front-end, diseñar y publicar código en aplicaciones React.

Introducción general Onlook es una herramienta de diseño de código abierto construida para diseñadores y desarrolladores que permite a los usuarios diseñar directamente en una aplicación React en ejecución y convertir los cambios de diseño en código. La herramienta proporciona una experiencia de edición visual intuitiva similar a Figma o Webf...
hace 6 meses
02.7K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: proyecto de código abierto de generación eficiente de vídeo que pretende generar un vídeo de un minuto en menos de un minuto.

Introducción exhaustiva Magic 1-For-1 es un modelo eficiente de generación de vídeo diseñado para optimizar el uso de memoria y reducir la latencia de inferencia. El modelo descompone la tarea de generación de texto a vídeo en dos subtareas: generación de texto a imagen y generación de imagen a vídeo, lo que permite un entrenamiento y una destilación más eficientes....
hace 6 meses
02.7K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: un plugin de WordPress AI Assistant para el diálogo, la generación de entradas y la traducción

Introducción completa WordPress AI Assistant Plugin (wp-ai-chat) es un plugin de WordPress de código abierto diseñado para proporcionar a los usuarios una variedad de características de AI, incluyendo el diálogo AI, la generación de artículos, resumen de artículos, traducción de artículos y lectura de contenidos. El plugin soporta el acoplamiento de múltiples ...
hace 6 meses
02.7K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI: control preciso de la posición de los elementos de la imagen, interfaz gráfica intuitiva basada en ComfyUI

Introducción general GLIGEN GUI es una interfaz gráfica intuitiva basada en ComfyUI, diseñada para simplificar el uso del modelo GLIGEN, un novedoso modelo texto-imagen que permite especificar con precisión la posición de los objetos en una imagen. Con GLIGE...
hace 11 meses
02.7K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: ¡la forma más rápida de ejecutar y ajustar LLM localmente!

Introducción general LlamaEdge es un proyecto de código abierto diseñado para simplificar el proceso de ejecución y puesta a punto de grandes modelos lingüísticos (LLM) en dispositivos locales o edge. El proyecto es compatible con la familia de modelos Llama2 y proporciona servicios API compatibles con OpenAI que permiten a los usuarios crear y ejecutar fácilmente...
hace 7 meses
02.7K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: un creador de portadas en línea diseñado para generar portadas personalizadas para blogs, vídeos cortos, redes sociales y mucho más.

Introducción general Mini-Cover es una herramienta de generación de portadas en línea de código abierto diseñada para generar portadas personalizadas para plataformas como blogs, vídeos cortos y redes sociales. Desarrollada por JLinMr, la herramienta pretende ofrecer una solución sencilla y eficaz para ayudar a los usuarios a generar rápidamente portadas que se ajusten a sus necesidades....
hace 8 meses
02.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: aplicación de código abierto de NotebookLM basada en Deepseek-V3 y PlayHT TTS

Introducción General Open Source NotebookLM es un innovador proyecto de inteligencia artificial que combina las capacidades de comprensión del lenguaje de Deepseek-V3 con la tecnología de síntesis de voz de PlayHT, con el objetivo de crear un sistema inteligente de diálogo para tomar notas. El proyecto fue desarrollado por Build Fast c...
hace 7 meses
02.7K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: los documentos PDF se traducirán a herramientas bilingües de código abierto

Introducción general BabelDOC es una herramienta de código abierto diseñada para traducir documentos PDF a un formato bilingüe. Está desarrollado por el equipo funstory-ai , alojado en GitHub , sirviendo principalmente a la necesidad de tratar con usuarios de documentos en lenguas extranjeras , como investigadores...
hace 2 meses
02.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: Genere dibujos lineales y bocetos de alta calidad, retropropagación de palabras clave de imágenes, instalación de paquetes con un solo clic.

Introducción general Sketch-Gen es una herramienta de dibujo lineal y generación de bocetos basada en tecnología de IA y diseñada para ayudar a artistas y diseñadores a generar rápidamente dibujos lineales y bocetos de alta calidad. Derivada del proyecto Paints-UNDO, la herramienta utiliza modelos avanzados de aprendizaje automático que pueden...
hace 8 meses
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: modelo multimodal de código abierto para la comprensión de vídeos y rondas múltiples de diálogo

Introducción CogVLM2 es un modelo multimodal de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), basado en la arquitectura Llama3-8B, y cuyo objetivo es proporcionar un rendimiento comparable o incluso mejor que GPT-4V. El modelo permite la comprensión de imágenes, el diálogo...
hace 6 meses
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: un cliente Python que demuestra el proceso de ejecución de un organismo inteligente, proporcionando una interfaz gráfica de usuario intuitiva.

Introducción completa AgentClientDemo es un proyecto completo de Python que integra funcionalidad inteligente (Agente) y cliente (Cliente). El proyecto está basado en el framework PyQt y proporciona una interfaz gráfica de usuario (G...
hace 8 meses
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: herramienta de código abierto para detectar vulnerabilidades LLM y asegurar la IA generativa

Introducción completa NVIDIA Garak es una herramienta de código abierto diseñada específicamente para detectar vulnerabilidades en Large Language Models (LLMs). Comprueba el modelo en busca de múltiples debilidades como ilusiones, fugas de datos, inyección de pistas, generación de mensajes de error, generación de contenido dañino, etc. mediante sondeos estáticos, dinámicos y adaptativos....
hace 9 meses
02.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: un modelo de comprensión multimodal de extremo a extremo que soporta la comprensión y el análisis multimodal de texto, imagen y audio.

Introducción exhaustiva Infini-Megrez es una solución de inteligencia de borde desarrollada por la cúpula central incuestionable (Infinigence AI), cuyo objetivo es lograr una comprensión y un análisis multimodales eficientes mediante el codiseño de hardware y software. El núcleo del proyecto es el modelo Megrez-3B, que soporta grafos...
hace 7 meses
02.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: un marco de escritura para generar ensayos largos de alta calidad, buscando conocimientos externos y reflexionando sobre ellos para construir paso a paso un árbol de conocimientos.

Introducción OmniThink es un innovador marco de escritura automática diseñado para generar ensayos largos de alta calidad imitando la expansión iterativa y la reflexión de los procesos cognitivos humanos. OmniThink se centra en ampliar los límites del conocimiento y generar información rica y profunda....
hace 7 meses
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: un modelo de vídeo de Vincennes que admite la entrada multilingüe y la generación de vídeos largos

Introducción completa Step-Video-T2V es un modelo avanzado de conversión de texto a vídeo de StepFun AI (StepFun Star). El modelo tiene 3.000 millones de parámetros y es capaz de generar vídeos de hasta 204 fps. Con un Auto-Encoder Variable (VAE) profundamente comprimido, el modelo...
hace 6 meses
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model: Vídeo de referencia del mapa de retratos estáticos Vídeo de generación de movimiento de retratos

Introducción general Thin-Plate-Spline-Motion-Model es un innovador proyecto de generación de animación de imágenes presentado en CVPR 2022. El proyecto se basa en la teoría de las transformadas spline de placa delgada y es capaz de lograr movimiento de alta calidad a partir de imágenes fijas basadas en la conducción de vídeo....
hace 7 meses
02.7K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Sistema de inversión AI: sistema automatizado de toma de decisiones de inversión en acciones A, que utiliza un sistema de inteligencia múltiple para analizar los datos del mercado.

Introducción exhaustiva A_Share_investment_Agent es una ayuda para la toma de decisiones de inversión en acciones A basada en un sistema de inteligencias múltiples. El sistema está diseñado para analizar los datos del mercado, calcular el valor intrínseco de las acciones, analizar el sentimiento del mercado y los datos fundamentales a través de múltiples inteligencias colaborativas para...
hace 7 meses
02.7K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: herramienta de desarrollo de código abierto de Shangtang para crear aplicaciones corporales multiinteligentes

Introducción exhaustiva LazyLLM es una herramienta de código abierto desarrollada por el equipo LazyAGI, centrada en simplificar el proceso de desarrollo de aplicaciones de grandes modelos de inteligencia múltiple. Ayuda a los desarrolladores a construir rápidamente aplicaciones complejas de IA a través de la implementación con un solo clic y mecanismos de puerta de enlace ligeros, ahorrando la tediosa configuración de ingeniería....
hace 6 meses
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...
hace 6 meses
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...
hace 5 meses
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente asistente inteligente de chat en grupo de WeChat para Windows

Introducción integral WeChatAI es un chat de grupo WeChat basado en Python y asistente inteligente personal, que soporta una variedad de grandes modelos de lenguaje (como DeepSeek, Gemini, Tongyi Thousand Questions), que puede lograr el diálogo inteligente, auto-respuesta y otras funciones. El proyecto utiliza ...
hace 6 meses
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: un cliente de visualización de flujos de trabajo para modelos de IA basado en la orquestación de nodos

Introducción general NodeTool es una innovadora plataforma de creación de IA diseñada para proporcionar una interfaz sencilla e intuitiva para entusiastas de la IA, desarrolladores, científicos de datos y creativos. Tanto si eres un artista, desarrollador o principiante, NodeTool te ayuda a crear rápidamente prototipos creativos....
hace 8 meses
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: un conjunto de herramientas de código abierto para conectar inteligencias de IA al protocolo Solana.

Introducción general Solana Agent Kit es un kit de herramientas de código abierto diseñado para conectar sin problemas inteligencias AI al protocolo blockchain Solana. El kit permite tanto a los investigadores de IA como a los desarrolladores de criptomonedas utilizar cualquier cuerpo inteligente entrenado en modelos para realizar sobre...
hace 6 meses
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown editor: herramientas de diseño gráfico de WeChat sencillas y eficaces, una llave para pegar el artículo al número público de WeChat.

Introducción completa WeChat Markdown Editor (WeChat Markdown Editor) es una herramienta de diseño gráfico WeChat muy conciso diseñado para ayudar a los usuarios a crear fácilmente hermosas mensajes WeChat. El editor es compatible con todos los básicos Markdown ...
hace 7 meses
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: recuperar contenidos y resumir conocimientos a partir de documentos masivos de múltiples fuentes

Introducción wdoc es un potente sistema RAG (Retrieval Augmentation Generation) diseñado para procesar y analizar grandes cantidades de documentos diversos. Es capaz de recuperar a partir de una amplia gama de tipos de documentos, incluidos PDF, páginas web, vídeos de YouTube, archivos de audio, etc. wdoc es especialmente adecuado para procesar...
hace 6 meses
02.7K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: investigación web y redacción de informes utilizando LLM nativo, profundizando automáticamente en temas especificados por el usuario y generando resúmenes.

Introducción general Research Rabbit es un asistente nativo de investigación y resumen web basado en LLM (Large Language Model). Después de que el usuario proporcione un tema de investigación, Research Rabbit genera una consulta de búsqueda, obtiene resultados web relevantes y resume estos resultados....
hace 4 meses
02.7K