Proyecto AI de código abierto

Total 1020 artículos
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, una plataforma para construir modelos base de IA del mundo físico.

Introducción completa NVIDIA Cosmos es una plataforma de modelado basada en mundos para desarrolladores, diseñada específicamente para ayudar a los desarrolladores de IA de física a crear sus sistemas de IA de física mejor y más rápido. La plataforma ofrece una amplia gama de modelos preentrenados, incluidos modelos de difusión y autorregresivos...
hace 1 año
061.4K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: herramienta de renderizado para generar vídeos multivista a partir de un único vídeo

Introducción general ReCamMaster es una herramienta de procesamiento de vídeo de código abierto, cuya función principal es generar nuevas vistas de cámara a partir de un único vídeo. Los usuarios pueden especificar la pista de la cámara y volver a renderizar el vídeo para obtener una imagen dinámica con diferentes ángulos. Está desarrollado por un equipo de la Universidad de Zhejiang y Racer Technology, basado en...
hace 1 año
061.4K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: generación de recursos de animación de estructuras esqueléticas a partir de modelos 3D estáticos

Introducción general MagicArticulate es un marco de IA desarrollado por ByteDance en colaboración con la Universidad Tecnológica de Nanyang (NTU), que se centra en la rápida transformación de modelos 3D estáticos en activos digitales de animación. Lo hace mediante un Transformador autorregresivo avanzado y un modelo de difusión funcional, auto...
hace 1 año
061.3K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: proyecto de código abierto para la búsqueda por inferencia profunda mediante conocimiento local

Introducción exhaustiva Deep Searcher es una potente herramienta que combina grandes modelos lingüísticos (LLM) y bases de datos vectoriales diseñada para buscar, evaluar y razonar a partir de datos privados, proporcionando respuestas muy precisas e informes exhaustivos. Es adecuado para la gestión del conocimiento empresarial...
hace 1 año
061.3K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

Claude Engineer: un asistente de diálogo corporal inteligente que genera y gestiona de forma autónoma herramientas de IA utilizando el modelo Claude.

Introducción general Claude Engineer es una interfaz interactiva de línea de comandos (CLI) desarrollada por Doriandarko que utiliza el modelo Claude-3.5-Sonnet de Anthropic para ayudar en las tareas de desarrollo de software...
hace 1 año
061.3K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Asistente de programación Vim nativo basado en LLM, programación inteligente segura sin conexión

Introducción General VimLM es un plugin de Vim que proporciona un asistente de código impulsado por el LLM nativo (Large Language Model). Interactuando con el modelo LLM nativo a través de los comandos de Vim, obtiene automáticamente el contexto del código y ayuda a los usuarios a editar código en Vim.VimLM está inspirado en...
hace 1 año
061.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Búsqueda o1: Capacitar a los modelos de inferencia para la búsqueda activa, permitiendo a los grandes modelos buscar conocimiento externo mientras piensan.

Introducción general Search-o1 es un proyecto de código abierto cuyo objetivo es mejorar el rendimiento de los modelos de razonamiento a gran escala (LRM) mediante la integración de mecanismos de búsqueda avanzada. La idea central es resolver el problema del déficit de conocimiento que se produce en el proceso de razonamiento mediante la búsqueda dinámica y la integración del conocimiento. El proyecto está patrocinado por sunn...
hace 1 año
061.3K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: ajuste de modelos lingüísticos mediante grafos de conocimiento para generar datos sintéticos

Introducción general GraphGen es un marco de código abierto desarrollado por OpenScienceLab, un laboratorio de IA de Shanghái, alojado en GitHub, que se centra en optimizar el ajuste fino supervisado de grandes modelos lingüísticos (LLM) guiando la generación de datos sintéticos a través de grafos de conocimiento. Se desarrolló a partir de ...
hace 11 meses
061.2K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extracción y categorización de documentos en datos estructurados para optimizar el proceso de tratamiento de documentos.

Introducción exhaustiva ExtractThinker es una herramienta flexible de inteligencia de documentos que extrae y clasifica datos estructurados de documentos utilizando modelos de grandes lenguajes (LLM), proporcionando un flujo de trabajo de procesamiento de documentos sin fisuras similar a ORM. Es compatible con diversos cargadores de documentos, como Tess...
hace 1 año
061.2K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: una herramienta de código abierto para convertir el lenguaje natural en consultas SQL

Introducción completa OpenSearch-SQL es un proyecto de código abierto , es una poderosa herramienta Texto-a-SQL que puede transformar las descripciones en lenguaje natural del usuario en sentencias de consulta SQL , para ayudar a las personas que no están familiarizadas con la base de datos para acceder fácilmente a los datos . Este proyecto fue desarrollado por O...
hace 1 año
061.2K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Herramienta de supervisión de la degradación del servicio ChatGPT: Detección de degradaciones del servicio ChatGPT

Introducción completa La herramienta de monitorización de la degradación del servicio ChatGPT es un proyecto de código abierto diseñado para ayudar a los usuarios a detectar si su servicio ChatGPT se ha degradado debido a IPs de alto riesgo. La herramienta analiza los valores de dificultad de Proof of Work (PoW) para determinar si los usuarios...
hace 1 año
061.2K
Plandex:支持超长上下文的开源AI编码助手

Plandex: un asistente de código abierto para la codificación de IA con soporte para contextos ultralargos

Introducción General Plandex es un código abierto de extremo a extremo AI codificación asistente diseñado para proyectos de software grandes y complejos. Puede planificar y ejecutar tareas de múltiples pasos, manejar contextos de hasta 2 millones de fichas y soportar más de 30 lenguajes de programación.Plandex ofrece...
hace 12 meses
061.2K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: Chatbots personalizados para la integración rápida de múltiples fuentes de datos

Introducción general OpenChat es una consola de chatbot fácil de usar diseñada para simplificar el uso de modelos lingüísticos extensos (LLM). Mediante un proceso de configuración en dos pasos, OpenChat permite a los usuarios crear y gestionar fácilmente varios chatbots personalizados. La plataforma es compatible con G...
hace 1 año
061.1K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Herramienta paramétrica de generación de aumentos de recuperación para mejorar el rendimiento de los sistemas de preguntas y respuestas.

Introducción exhaustiva PRAG (Parametric Retrieval-Augmented Generation) es una innovadora herramienta de generación aumentada por recuperación que pretende mejorar la generación de conocimiento externo incrustándolo directamente en el espacio de parámetros de un Large Language Model (LLM)....
hace 1 año
061K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: herramientas de código abierto para la ampliación y el suavizado de imágenes de cualquier tamaño

Introducción general Thera es una herramienta de superresolución de imágenes de código abierto desarrollada por un equipo de la ETH de Zúrich y la Universidad de Zúrich. Puede ampliar imágenes de baja resolución a escalas arbitrarias, como 2x, 3,14x o incluso múltiplos no enteros, y poner...
hace 1 año
061K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Descripción general Charla es una aplicación de chat basada en endpoints diseñada para entablar diálogos con modelos lingüísticos nativos. La aplicación se integra con el backend Ollama, admite diálogos contextuales y guarda las sesiones de chat como archivos Markdown. Los usuarios pueden...
hace 1 año
060.9K
Orchestra: Creación de equipos inteligentes de IA para un desarrollo colaborativo multiinteligencia más fácil y eficiente

Orchestra: Creación de equipos inteligentes de IA para un desarrollo colaborativo multiinteligencia más fácil y eficiente

Orchestra es un innovador framework ligero de Python que se centra en la construcción de sistemas colaborativos multi-inteligencia basados en el Large Language Model (LLM). Emplea un método único de organización de inteligencias para que múltiples inteligencias IA puedan trabajar en armonía como una orquesta sinfónica. Al modelar ...
hace 1 año
060.9K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: una herramienta de pruebas automatizadas con IA que utiliza el lenguaje natural para realizar pruebas de principio a fin

Introducción general Shortest es un marco de pruebas de extremo a extremo en lenguaje natural basado en IA desarrollado por el equipo Anti-Work. Se basa en Playwright y admite la integración con GitHub y la autenticación de dos factores (2FA)....
hace 1 año
060.9K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: una herramienta virtual de alta fidelidad para mejorar la autenticidad de los detalles de la ropa

Introducción exhaustiva FitDiT es un sistema de ajuste virtual de alta fidelidad basado en transformadores de difusión (Diffusion Transformers). Desarrollado por Tencent AI Lab, el proyecto pretende abordar las limitaciones de los sistemas tradicionales de ajuste virtual a la hora de mostrar los detalles de las prendas.FitD...
hace 1 año
060.9K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: una eficaz herramienta de generación de aumento de la recuperación (RAG) que admite múltiples bases de datos y modelos lingüísticos.

Introducción general RAGLite es un conjunto de herramientas Python para la Generación Aumentada de Recuperación (RAG) con soporte para bases de datos PostgreSQL o SQLite. Proporciona opciones de configuración flexibles que permiten a los usuarios elegir diferentes modelos de lenguaje y reordenadores....
hace 1 año
060.9K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: una herramienta para simplificar el proceso de ajuste de modelos de los principales lenguajes visuales de código abierto

Introducción Maestro es una herramienta desarrollada por Roboflow para simplificar y acelerar el proceso de ajuste fino de modelos multimodales, de modo que todo el mundo pueda entrenar sus propios macromodelos visuales. Proporciona recetas ya preparadas para el ajuste fino de modelos de lenguaje visual (VLM) populares como F...
hace 1 año
060.9K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: proyecto de código abierto de generación eficiente de vídeo que pretende generar un vídeo de un minuto en menos de un minuto.

Introducción exhaustiva Magic 1-For-1 es un modelo eficiente de generación de vídeo diseñado para optimizar el uso de memoria y reducir la latencia de inferencia. El modelo descompone la tarea de generación de texto a vídeo en dos subtareas: generación de texto a imagen y generación de imagen a vídeo, lo que permite un entrenamiento y una destilación más eficientes....
hace 1 año
060.9K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor: un conjunto de herramientas en contenedores para desplegar entornos de desarrollo LLM locales con un solo clic y gestionar y ejecutar fácilmente servicios de IA.

Introducción general Harbor es un revolucionario conjunto de herramientas LLM en contenedores centrado en simplificar el despliegue y la gestión de entornos de desarrollo de IA locales. Ofrece a los desarrolladores una interfaz de línea de comandos (CLI) limpia y una aplicación complementaria para lanzar y gestionar con un solo clic, incluyendo backends LLM, interfaces API,...
hace 1 año
060.8K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: un marco de código abierto para construir aplicaciones modulares de GAR y probar rápidamente diversas estrategias de GAR.

Introducción general Cognita es un marco de código abierto desarrollado por TrueFoundry para simplificar el desarrollo de aplicaciones basadas en RAG (Retrieval-Augmented Generation). El framework proporciona un entorno estructurado, mod...
hace 1 año
060.8K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: ingenieros de IA full-stack de código abierto que construyen e iteran rápidamente proyectos TypeScript completos.

Introducción general Srcbook es una plataforma de desarrollo de aplicaciones centrada en TypeScript diseñada para crear e iterar rápidamente aplicaciones web con asistentes de IA. Es compatible con el tiempo de ejecución nativo, proporciona una interfaz de bloc de notas interactivo y permite a los usuarios escribir y ejecutar código back-end.Srcbook está abierto...
hace 1 año
060.7K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: carga de wireframes para generar código front-end basado en Llama4

Introducción general Napkins.dev es un proyecto libre de código abierto, la función principal es permitir a los usuarios subir capturas de pantalla de interfaz o wireframes para generar automáticamente código front-end ejecutable. Los usuarios sólo tienen que proporcionar un dibujo de diseño , la herramienta será a través del modelo Llama 4 ( por Juntos ...
hace 1 año
060.7K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: un modelo de lenguaje visual ligero de código abierto para la retropropagación por lotes de palabras clave de imágenes

Introducción exhaustiva Moondream es un modelo de lenguaje visual ligero de código abierto diseñado para habilitar capacidades de descripción de imágenes mediante técnicas de aprendizaje profundo y visión por ordenador. El modelo es capaz de funcionar de manera eficiente en una variedad de plataformas, y es particularmente adecuado para dispositivos edge.Moondream utiliza técnicas avanzadas y...
hace 1 año
060.7K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: Una biblioteca de código abierto con soporte eficiente para operaciones matriciales FP8 (DeepSeek Open Source Week Day 3)

Introducción general DeepGEMM es una biblioteca FP8 GEMM (Generalised Matrix Multiplication) de código abierto desarrollada por el equipo DeepSeek, centrada en proporcionar un soporte eficiente de aritmética matricial. Está dirigida específicamente a la arquitectura NVIDIA Hopper para Tensor ...
hace 1 año
060.7K
Cloudflare Agents:在边缘网络上构建实时交互的智能体

Agentes Cloudflare: creación de inteligencias interactivas en tiempo real en redes periféricas

Introducción general Cloudflare Agents es un marco de desarrollo de código abierto de Cloudflare diseñado para ayudar a los desarrolladores a crear agentes de inteligencia artificial en la red global. Proporciona a los agentes la capacidad de persistir en el estado, comunicarse en tiempo real y ejecutarse de forma autónoma....
hace 1 año
060.6K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: una plataforma integrada para conectar diferentes marcos de inteligencia artificial y colaborar en tiempo real

Introducción general Mahilo es una plataforma de integración multi-inteligencia de código abierto, publicada en GitHub por el desarrollador Jayesh Sharma, diseñada para ayudar a los usuarios a conectar inteligencias de IA de diferentes marcos para apoyar la comunicación en tiempo real, la interacción persona-ordenador y la colaboración inteligente. La ...
hace 1 año
060.6K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: añade sonido sincronizado a un vídeo mudo

Introducción general FoleyCrafter es un proyecto de código abierto desarrollado por OpenMMLab para generar efectos de sonido vívidos y sincronizados para vídeos mudos. El proyecto utiliza técnicas avanzadas de inteligencia artificial para generar efectos de sonido semánticamente relevantes y sincronizados en el tiempo mediante el análisis del contenido del vídeo....
hace 1 año
060.6K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): marco de generación de gestos de cuerpo entero, marco de animación 3D para generar gestos de cuerpo entero a partir de audio.

Introducción exhaustiva PantoMatrix es un marco avanzado de generación de gestos de cuerpo completo capaz de generar movimientos humanos completos a partir de audio y gestos parciales, incluidos movimientos faciales, corporales parciales, de manos y de cuerpo completo. El marco utiliza los últimos conjuntos de datos multimodales y técnicas de aprendizaje profundo para proporcionar...
hace 1 año
060.6K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

tarjeta de luz: HTML5 herramienta generadora de tarjetas, crear hermosas tarjetas de contenido de herramientas simples

Descripción general lightcard es una herramienta de generación de tarjetas simple y elegante diseñada para ayudar a los usuarios a crear fácilmente hermosas tarjetas de contenido. La herramienta soporta contenido de texto personalizado, múltiples estilos de temas y códigos QR para hacer la creación más fácil y divertida. Los usuarios pueden editar el título, el cuerpo y el autor...
hace 1 año
060.6K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: aplicación portátil de diario vocal con inteligencia artificial y conversión de voz a texto.

Introducción general ALog es una aplicación de diario de voz basada en IA diseñada para ayudar a los usuarios a registrar su vida diaria por voz. Está desarrollada por duxins y de código abierto en GitHub. Los usuarios pueden grabar entradas de diario a través de la entrada de voz, y la aplicación convertirá automáticamente la voz en texto ...
hace 1 año
060.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: una herramienta de IA para ofrecer tutorías personalizadas, un proyecto de tutor personal de IA de código abierto basado en Llama 3.1

Introducción general Llama Tutor es un proyecto de tutor personal de IA de código abierto basado en Llama 3.1, diseñado para proporcionar a los usuarios una experiencia de aprendizaje personalizada. Mediante la integración de múltiples pilas tecnológicas como Together AI, Next.js y T...
hace 1 año
060.5K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: creación de una herramienta de colaboración en tareas multiinteligencia en una frase

Introducción general Cooragent es un marco de colaboración de agentes de IA de código abierto desarrollado por LeapLab en la Universidad de Tsinghua y alojado en GitHub. Permite a los usuarios crear agentes de IA inteligentes con una descripción de una frase y admite múltiples agentes para colaborar en tareas complejas. El marco proporciona dos...
hace 11 meses
060.5K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

Simba: un sistema de gestión del conocimiento para organizar documentos, perfectamente integrado en cualquier sistema GAR.

Introducción general Simba es un sistema portátil de gestión del conocimiento (KMS) diseñado para integrarse perfectamente con cualquier sistema de generación de aumento de la recuperación (RAG). Creado por el usuario de GitHub GitHamza0206, el proyecto proporciona una solución eficiente de gestión del conocimiento para una variedad de...
hace 1 año
060.5K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate: una herramienta nativa que combina IA y RPA para automatizar tareas informáticas

Introducción completa autoMate es una herramienta de automatización local desarrollada por yuruotong1 de código abierto en GitHub, con AI + RPA (Inteligencia Artificial + Automatización Robótica de Procesos) como su característica principal. Combina la comprensión inteligente de modelos lingüísticos a gran escala con RPA....
hace 1 año
060.4K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT: Garantice la privacidad de los datos hablando con varios documentos en dispositivos locales.

Introducción general LocalGPT es un proyecto de código abierto diseñado para permitir a los usuarios hablar con documentos en dispositivos locales, garantizando la privacidad de los datos. Mediante el uso de varios modelos de código abierto, LocalGPT puede procesar y comprender el contenido de los documentos sin subir los datos a la nube. El proyecto es compatible con diversos p...
hace 1 año
060.4K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: Interfaz de chat web sencilla con modelos de IA multiplataforma integrados (sin implantación)

Introducción general OrionChat es una interfaz de chat de IA basada en web que proporciona a los usuarios una plataforma unificada para interactuar con múltiples modelos de IA de corriente principal. El proyecto es compatible con una amplia gama de modelos de IA, incluidos Ollama (que se ejecuta localmente), OpenAI GPT, Google Gemi...
hace 1 año
060.3K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: convierta PDF en podcasts de herramientas de código abierto

Introducción general Open NotebookLM es un proyecto de código abierto diseñado para convertir cualquier documento PDF en un podcast. La herramienta utiliza modelos de código abierto Large Language Model (LLM) y Text-to-Speech (TTS) para procesar contenidos PDF y generar diálogos naturales adecuados para podcasts de audio....
hace 1 año
060.3K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: Wisdom Spectrum lanzó un potente modelo de generación de textos ultralargos, que permite generar más de 10.000 palabras en una sola conversación.

Introducción LongWriter es una potente herramienta de generación de textos largos desarrollada por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM). La herramienta se basa en el avanzado Long Context Language Model (LLM) y es capaz de generar textos largos de más de 10.000 palabras.LongWriter...
hace 1 año
060.3K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: un asistente de investigación profunda basado en IA que proporciona herramientas de investigación eficientes y capacidades de generación de informes.

Introducción general Deep Research es un asistente de investigación basado en IA diseñado para realizar investigación profunda iterativa combinando motores de búsqueda, rastreo web y grandes modelos de lenguaje. El proyecto fue lanzado por dzhng en GitHub con el objetivo de proporcionar un generador de investigación profunda fácil de usar....
hace 1 año
060.3K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: una herramienta de código abierto para completar todo el proceso de investigación científica con agentes inteligentes

Introducción general AgentLaboratory es una herramienta de código abierto alojada en GitHub y desarrollada por Samuel Schmidgall. Utiliza agentes inteligentes impulsados por Large Language Models (LLMs) para ayudar a los investigadores con todo el proceso de...
hace 1 año
060.2K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC: herramienta informática de código abierto para mejorar la función de microcrédito, apoyo al desarrollo secundario

Introducción completa SuperWeChatPC es una herramienta de mejora de WeChat de código abierto para ordenadores, cuyo núcleo es proporcionar comodidad a los usuarios y desarrolladores. Inicialmente resuelve el problema de que WeChat sólo se puede abrir solo, y más tarde añadió WeChatSDK, para que los desarrolladores puedan llamar a las funciones de WeChat, como el envío de mensajes....
hace 1 año
060.1K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: un marco de código abierto para ejecutar eficazmente tareas de IA y por lotes en cualquier nube

Introducción general SkyPilot es un marco de código abierto iniciado por el Sky Computing Lab de la Universidad de California, Berkeley, diseñado para ayudar a los usuarios a ejecutar eficientemente tareas de IA y procesamiento por lotes en cualquier infraestructura de nube. Es compatible con más de 14 servicios en la nube (incluidos ...
hace 1 año
060.1K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: herramienta multilingüe de conversión de voz a texto más pequeña y rápida que Whisper-Large v3

Introducción completa PengChengStarling (PengCheng Labs) es una herramienta multilingüe de reconocimiento automático del habla (ASR) capaz de convertir el habla en distintos idiomas en el texto correspondiente. Este conjunto de herramientas se ha desarrollado a partir del proyecto icefall y proporciona un proceso completo de reconocimiento del habla...
hace 1 año
060.1K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: Cursor de código abierto para el diseño front-end, diseñar y publicar código en aplicaciones React.

Introducción general Onlook es una herramienta de diseño de código abierto construida para diseñadores y desarrolladores que permite a los usuarios diseñar directamente en una aplicación React en ejecución y convertir los cambios de diseño en código. La herramienta proporciona una experiencia de edición visual intuitiva similar a Figma o Webf...
hace 1 año
060K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA y LangChain lanzan una guía avanzada para redactar informes estructurados de análisis que permite generar informes técnicos basados en IA.

Introducción general Este es un proyecto de generación de informes estructurados desarrollado conjuntamente por LangChain y NVIDIA, presentado en un tutorial de cuaderno Jupyter en GitHub. El proyecto utiliza técnicas avanzadas de IA, concretamente Llama-3.3-7...
hace 1 año
060K
LM Speed:快速测试大模型API性能

LM Speed: Pruebas rápidas de rendimiento de API de modelos grandes

Introducción general LM Speed es una herramienta diseñada específicamente para desarrolladores de IA, y también está disponible como servicio en línea en lmspeed.net Su función principal es probar y analizar el rendimiento de las API de modelos lingüísticos, ayudando a los usuarios a identificar rápidamente los cuellos de botella de velocidad y optimizar las estrategias de llamada. Esta...
hace 1 año
060K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: creación de inteligencias artificiales con memoria, conocimientos y herramientas

Introducción general PhiData es un marco de trabajo diseñado para desarrollar asistentes de IA inteligentes. Permite a los asistentes de IA entablar conversaciones a largo plazo, proporcionar un contexto empresarial preciso y realizar diversas operaciones mediante capacidades mejoradas de memoria, integración de conocimientos e invocación de herramientas.PhiData no solo mejora los asistentes de IA....
hace 1 año
060K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: herramienta de lectura de código fuente, que utiliza LLM para analizar el código, proporcionar explicaciones detalladas del código, soporte para una variedad de lenguajes de programación.

Introducción general askrepo es una herramienta de lectura de código fuente basada en LLM (Large Language Model). Puede leer el contenido de un archivo de texto gestionado por Git en un directorio especificado y enviarlo a la API Gemini de Google para proporcionar respuestas a preguntas basadas en preguntas especificadas....
hace 1 año
060K
CogView4:生成中英双语高清图片的开源文生图模型

CogView4: un modelo gráfico de código abierto para generar imágenes bilingües de alta definición en chino e inglés

Introducción general CogView4 es un modelo de conversión de texto a gráfico de código abierto desarrollado por el KEG Lab (THUDM) de la Universidad de Tsinghua, centrado en la conversión de descripciones de texto en imágenes de alta calidad. Admite la introducción de palabras de referencia bilingües, y es especialmente bueno en la comprensión de pistas chinas y la generación de imágenes con caracteres chinos, no...
hace 1 año
059.9K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: Conjunto de herramientas de desarrollo de modelos de IA nativos de Windows, integración de modelos de extremo a extremo en aplicaciones Windows

Introducción general AI Dev Gallery es una aplicación de herramientas de desarrollo de IA de Microsoft (actualmente en vista previa pública) diseñada para desarrolladores de Windows. Proporciona una plataforma completa para ayudar a los desarrolladores a integrar fácilmente las funciones de IA en sus aplicaciones Windo...
hace 1 año
059.9K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: Mejorando la Experiencia de Desarrollo de Cursor IDE, Haciendo de Cursor/Windsurf un Asistente de Programación Inteligente similar a Devin.

Introducción General Devin.cursorrules es un innovador proyecto de código abierto diseñado para convertir el asequible Cursor o Windsurf IDE (~$20) en un potente asistente de programación AI como Devin. El proyecto proporciona un conjunto de ...
hace 1 año
059.8K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: servicio de almacenamiento y recuperación de documentos basado en incrustación visual

Introducción general ColiVara es un servicio de almacenamiento y recuperación de documentos basado en la tecnología de incrustación visual. Elimina la necesidad de reconocimiento óptico de caracteres (OCR) o extracción de texto y evita los problemas de formularios rotos o imágenes perdidas.ColiVara admite más de 100 formatos de archivo, incluidos PDF...
hace 1 año
059.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: un cliente de visualización de flujos de trabajo para modelos de IA basado en la orquestación de nodos

Introducción general NodeTool es una innovadora plataforma de creación de IA diseñada para proporcionar una interfaz sencilla e intuitiva para entusiastas de la IA, desarrolladores, científicos de datos y creativos. Tanto si eres un artista, desarrollador o principiante, NodeTool te ayuda a crear rápidamente prototipos creativos....
hace 1 año
059.7K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: un marco de código abierto para optimizar los proyectos de avisos con el fin de mejorar el rendimiento de las tareas.

Introducción completa PromptWizard es un marco de código abierto desarrollado por Microsoft que utiliza un mecanismo autoevolutivo que permite al modelo generar, evaluar y mejorar las palabras clave y generar ejemplos por sí mismo, mejorando la calidad del resultado mediante una retroalimentación continua. Puede optimizar de forma autónoma las palabras clave, generar y seleccionar ejemplos adecuados y...
hace 1 año
059.7K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: una plataforma de desarrollo de bajo código para aplicaciones de IA generativa de nivel empresarial

Introducción BuffGPT es una plataforma de desarrollo de aplicaciones de IA de código abierto basada en el Large Language Model (LLM), que proporciona funciones listas para usar como el procesamiento de datos, la invocación de modelos, la recuperación RAG y la orquestación visual de flujos de trabajo para ayudar a los usuarios a construir y operar fácilmente aplicaciones de IA generativa. La plataforma admite...
hace 1 año
059.7K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker mejorado para generar personas digitales utilizando vídeo de retratos

Descripción general SadTalker-Video-Lip-Sync es una herramienta de síntesis labial de vídeo basada en la implementación de SadTalkers. El proyecto genera formas labiales a través de la generación por voz y utiliza la mejora configurable de la región facial para mejorar la claridad de las formas labiales generadas....
hace 1 año
059.7K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: compatibilidad con herramientas de generación de imágenes personalizadas mono y multisujeto (adecuadas para gráficos de comercio electrónico).

UNO es un marco de generación de imágenes de código abierto desarrollado por el equipo de creación inteligente ByteDance. Se basa en el modelo FLUX.1 y se centra en la generación de imágenes personalizadas de un único sujeto y de varios sujetos mediante un enfoque de generalización de "menos a más".UNO utiliza el transformador de difusión...
hace 12 meses
059.7K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk: Asistente inteligente de búsqueda de empleo, colocación automatizada de CV (sólo en inglés)

Introducción general Auto_Jobs_Applier_AIHawk es una herramienta para automatizar la búsqueda de empleo utilizando tecnología de inteligencia artificial. Ayuda a los usuarios a automatizar el envío de un gran número de CV en un corto periodo de tiempo y a personalizarlos según su información personal y sus intenciones de búsqueda de empleo. La herramienta está diseñada...
hace 1 año
059.6K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: una herramienta de gestión que combina la aprobación automatizada inteligente de procesos con auditorías humanas.

Introducción general LLManager es una herramienta de gestión de aprobación inteligente de código abierto, desarrollada en base al marco LangGraph de LangChain, centrada en la automatización del procesamiento de las solicitudes de aprobación al tiempo que optimiza la toma de decisiones con revisión humana. Lo hace a través de la búsqueda semántica, el aprendizaje...
hace 12 meses
059.6K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: el estilo de interfaz unificado de OpenAI llama a varios modelos grandes, cambio rápido de modelo y pruebas comparativas.

Introducción completa aisuite es una interfaz sencilla y unificada diseñada para permitir a los desarrolladores invocar fácilmente los servicios de múltiples proveedores de IA generativa. Con una interfaz similar a OpenAI, aisuite facilita la interacción con los LLM (Large Language Models) más populares....
hace 1 año
059.6K
自动解析PDF内容并提取文字与表格的开源服务

Analice automáticamente el contenido del PDF y extraiga el texto y las tablas de los servicios de código abierto

Introducción Completa Analiza automáticamente el diseño de documentos PDF, identifica texto, títulos, imágenes, tablas, fórmulas y otros elementos de la página, y determina su orden correcto. La herramienta es compatible con la funcionalidad OCR y puede convertir PDF escaneados en texto con capacidad de búsqueda. Se ejecuta en Docker y proporciona dos modelos...
hace 1 año
059.5K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: aplicación local de chat en tiempo real basada en Nuxt 3 y Ollama

Introducción general ChatOllama es un proyecto de aplicación de chat en línea de código abierto basado en un modelo lingüístico a gran escala (LLM), que admite numerosos modelos lingüísticos y la gestión de la base de conocimientos. Los usuarios pueden utilizar la plataforma para la gestión de modelos ( visualización de listas , descarga , eliminación ) , chatear con los modelos y otras funciones . El proyecto utiliza ...
hace 2 años
059.5K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: una herramienta para gestionar la colaboración multiinteligencia mediante inteligencias supervisoras

Introducción general LangGraph Supervisor es una librería Python basada en el framework LangGraph, diseñada para crear y gestionar sistemas de cuerpos multi-inteligentes. La librería coordina el trabajo de múltiples agentes especializados a través de un agente supervisor central, asegurando que los flujos de comunicación y las tareas se dividen...
hace 1 año
059.4K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架

PrimisAI Nexus: un marco ligero para construir sistemas de inteligencia múltiple de IA escalables y automatización de tareas

Introducción general PrimisAI Nexus es un marco ligero de código abierto Python alojado en GitHub y desarrollado por el equipo PrimisAI, con el objetivo de ayudar a los usuarios a construir y gestionar sistemas de cuerpos multi-inteligentes de IA escalables a través de Large Language Modelling (LLM), permitiendo...
hace 1 año
059.4K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni: un macromodelo multimodal para analizar emociones y acciones humanas en vídeo

Introducción general HumanOmni es un gran modelo multimodal de código abierto desarrollado por el equipo HumanMLLM y alojado en GitHub. Se centra en el análisis de vídeos humanos y puede procesar tanto la imagen como el sonido para ayudar a comprender las emociones, las acciones y el contenido de los diálogos. El proyecto utiliza 2...
hace 1 año
059.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: un asistente de chat con inteligencia artificial compatible con múltiples plataformas

Introducción general NextChat es un revolucionario servicio de chat con IA que permite a los usuarios implementar servicios de chat con los mejores modelos lingüísticos de su clase, como GPT-3, GPT-4, GPT-4.5 y Gemini Pro. Ofrece una elegante interfaz de usuario, funciones de colaboración, integraciones, plantillas y...
hace 1 año
059.3K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: generación de entradas de blog a partir de contenidos de voz basados en LangGraph, blogs de redacción automatizada

Introducción general Robo Blogger es una innovadora herramienta de creación de blogs diseñada para simplificar el proceso de generación de contenidos mediante la tecnología de voz a texto. Los usuarios pueden grabar ideas a través de cualquier aplicación de voz a texto, y Robo Blogger convierte esas ideas en contenido de blog estructurado....
hace 1 año
059.3K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: marco de agentes de vídeo inteligentes para realizar flujos de trabajo de búsqueda, edición y generación de vídeo con descripciones en lenguaje natural.

Introducción general Director es un marco de trabajo de código abierto diseñado para simplificar y optimizar las interacciones y los flujos de trabajo de vídeo mediante la creación de agentes de vídeo inteligentes. El marco se basa en la infraestructura de "vídeo como datos" de VideoDB y es capaz de gestionar tareas de vídeo complejas como la búsqueda, edición, compilación y generación de...
hace 1 año
059.2K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: una inteligencia visual para resolver múltiples tareas de detección visual de objetivos

Introducción general Vision Agent es un proyecto de código abierto desarrollado por LandingAI (Team Enda Wu) y alojado en GitHub, diseñado para ayudar a los usuarios a generar rápidamente código para resolver tareas de visión por ordenador. Utiliza un marco de agentes avanzado y modelos multimodales...
hace 1 año
059.2K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: proyecto experimental para ejecutar un modelo lingüístico a gran escala en un archivo PDF

Introducción general llm.pdf es un proyecto de código abierto que permite a los usuarios ejecutar grandes modelos lingüísticos (LLM) directamente en archivos PDF. Desarrollado por EvanZhouDev y alojado en GitHub, este proyecto demuestra un enfoque innovador: al Em...
hace 11 meses
059.2K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: Genera automáticamente documentos Markdown a partir de la estructura y el contenido del código.

Introducción general CodeWeaver es una herramienta de línea de comandos diseñada para entretejer bibliotecas de código en documentos Markdown únicos y fáciles de navegar. Genera una representación estructurada de la jerarquía de archivos de un proyecto escaneando recursivamente los directorios e incrustando el contenido de cada archivo en bloques de código. Esta herramienta...
hace 1 año
059.1K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Creación de un sistema inteligente de preguntas y respuestas sobre documentos y creación sencilla de una base de conocimientos web privada

Introducción completa RAG Web UI es un sistema de diálogo inteligente basado en la tecnología RAG (Retrieval Augmented Generation). Ayuda a empresas y particulares a crear sistemas inteligentes de preguntas y respuestas basados en su propia base de conocimientos. Combinando la recuperación de documentos y grandes modelos lingüísticos, RAG Web UI proporciona...
hace 1 año
059K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: plataforma inteligente de carrozado para la automatización de flujos de trabajo y la ejecución autónoma de tareas

Descripción general AutoGPT es una potente plataforma diseñada para ayudar a los usuarios a crear, desplegar y gestionar agentes de IA en ejecución continua y automatizar flujos de trabajo complejos. Desarrollada por Significant Gravitas, la plataforma ofrece una amplia gama de herramientas y funciones que permiten a los usuarios centrarse...
hace 1 año
059K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: Generación de código de automatización del navegador para convertir acciones del ratón en scripts Selenium Python mediante IA

Introducción general AutoMouser es una extensión de Chrome que rastrea de forma inteligente las interacciones del usuario y genera automáticamente código de prueba Selenium utilizando los modelos GPT de OpenAI. Para ello, registra las acciones del navegador del usuario y las convierte...
hace 1 año
059K