Proyecto AI de código abierto

Total 1020 artículos
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: Extracción de texto de imágenes mediante modelos visuales en Ollama

Introducción general Ollama OCR es un potente kit de herramientas de reconocimiento óptico de caracteres (OCR) que utiliza el modelo de lenguaje visual de última generación proporcionado por la plataforma Ollama para extraer texto de imágenes. El proyecto está disponible como paquete Python y proporciona una interfaz Strea...
hace 7 meses
04.4K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: una herramienta virtual de alta fidelidad para mejorar la autenticidad de los detalles de la ropa

Introducción exhaustiva FitDiT es un sistema de ajuste virtual de alta fidelidad basado en transformadores de difusión (Diffusion Transformers). Desarrollado por Tencent AI Lab, el proyecto pretende abordar las limitaciones de los sistemas tradicionales de ajuste virtual a la hora de mostrar los detalles de las prendas.FitD...
hace 7 meses
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model: Vídeo de referencia del mapa de retratos estáticos Vídeo de generación de movimiento de retratos

Introducción general Thin-Plate-Spline-Motion-Model es un innovador proyecto de generación de animación de imágenes presentado en CVPR 2022. El proyecto se basa en la teoría de las transformadas spline de placa delgada y es capaz de lograr movimiento de alta calidad a partir de imágenes fijas basadas en la conducción de vídeo....
hace 7 meses
02.7K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: personas digitales inteligentes e interactivas en tiempo real con soporte de despliegue multiplataforma con un solo clic

Introducción general DUIX (Dialogue User Interface System) es una plataforma digital de interacción humana potenciada por IA creada por Silicon Intelligence. Con capacidades de interacción humana digital de código abierto, los desarrolladores pueden integrar fácilmente modelos a gran escala, reconocimiento automático del habla (ASR...
hace 7 meses
03.7K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fay Digital Human Framework: integración de modelos lingüísticos y personajes digitales tridimensionales para dar soporte a diversos escenarios de aplicación.

Introducción general Fay es un marco de trabajo de código abierto para humanos digitales virtuales en 3D que integra modelos lingüísticos y personajes digitales para diversos escenarios de aplicación, como guías de compras virtuales, presentadores virtuales, asistentes, camareros, profesores y asistentes móviles basados en voz o texto.
hace 7 meses
03.1K
MOFA Video:运动场适配技术将静态图像转换为视频

Vídeo MOFA: la tecnología de adaptación del campo de movimiento convierte imágenes fijas en vídeo

Introducción general MOFA-Video es una herramienta de generación de animación de imágenes de última generación que utiliza técnicas generativas de adaptación de campos de movimiento para convertir imágenes estáticas en vídeos dinámicos. Se ha desarrollado en colaboración con la Universidad de Tokio y Tencent AI Lab, y se presentará en la Conferencia Europea de Visión por Computador de 2024 (E...
hace 7 meses
02.6K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: asistente AI de código abierto para la grabación de reuniones, grabación automática del contenido de las reuniones para generar resúmenes.

Introducción general Amurex es un asistente de reuniones con inteligencia artificial de código abierto desarrollado por The Personal AI Company, diseñado para mejorar la eficacia de las reuniones mediante funciones inteligentes.
hace 7 meses
03.4K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

Uso de ordenadores abiertos E2B: ejecución segura de un sistema operativo de inteligencia artificial en el espacio aislado E2B

Introducción general E2B Open Computer Use es un proyecto de código abierto cuyo objetivo es proporcionar una experiencia segura de uso de ordenadores Linux basada en la nube a través de E2B Desktop Sandbox.E2B Sandbox proporciona un entorno gráfico de escritorio que los usuarios...
hace 7 meses
02.5K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Laboratorio de agentes: asistente automatizado de codificación y redacción de estudios para investigadores

Introducción completa Agent Laboratory es un flujo de trabajo de investigación autónomo de extremo a extremo diseñado para ayudar a los investigadores a hacer realidad sus ideas de investigación. El sistema se compone de agentes dedicados controlados por modelos lingüísticos a gran escala que dan soporte a todo el flujo de trabajo de investigación, desde la realización de...
hace 4 meses
02.8K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: Asistente de Código Inteligente Contextualizado, Generación y Modificación de Código, Soporte Multi-IDE

Introducción general J.A.R.V.I.S. (Just A Rather Very Intelligent System) es un asistente de código inteligente diseñado para ayudar a los desarrolladores en la generación, modificación y discusión técnica de código utilizando múltiples modelos de lenguaje de última generación....
hace 7 meses
03.4K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Sistema de inversión AI: sistema automatizado de toma de decisiones de inversión en acciones A, que utiliza un sistema de inteligencia múltiple para analizar los datos del mercado.

Introducción exhaustiva A_Share_investment_Agent es una ayuda para la toma de decisiones de inversión en acciones A basada en un sistema de inteligencias múltiples. El sistema está diseñado para analizar los datos del mercado, calcular el valor intrínseco de las acciones, analizar el sentimiento del mercado y los datos fundamentales a través de múltiples inteligencias colaborativas para...
hace 7 meses
02.6K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

Company Researcher: Una herramienta de investigación de empresas, introduzca la dirección web de una empresa para obtener información de investigación detallada.

Descripción general Company Researcher (Investigador de empresas) es una herramienta gratuita y de código abierto diseñada para ayudar a los usuarios a obtener una visión rápida y completa de cualquier empresa. Basta con introducir la URL de la empresa y la herramienta recopilará información exhaustiva de la web, presentando información sobre la organización, sus productos...
hace 4 meses
02.2K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: Convierte tus repositorios de GitHub en podcasts y escucha las actualizaciones de código en cualquier momento y lugar.

Introducción general GitPodcast es una herramienta innovadora diseñada para convertir los repositorios de GitHub en podcasts, permitiendo a los desarrolladores escuchar las actualizaciones de código en cualquier momento y lugar. Utilizando OpenAI y Azure Speech SDK, GitPodca...
hace 7 meses
02.4K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: análisis y etiquetado automático de documentos mediante IA para el sistema de gestión documental paperless-ngx

Introducción general Paperless-AI es una innovadora herramienta de análisis de automatización de documentos diseñada específicamente para el sistema de gestión documental Paperless-ngx. Combina inteligentemente la API OpenAI con una variedad de modelos avanzados de IA como Ollama...
hace 7 meses
04.9K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, una plataforma para construir modelos base de IA del mundo físico.

Introducción completa NVIDIA Cosmos es una plataforma de modelado basada en mundos para desarrolladores, diseñada específicamente para ayudar a los desarrolladores de IA de física a crear sus sistemas de IA de física mejor y más rápido. La plataforma ofrece una amplia gama de modelos preentrenados, incluidos modelos de difusión y autorregresivos...
hace 7 meses
02.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: Creación de mini-inteligencias LLM con "estructura de grafo dirigido" en 100 líneas de código

Introducción general miniLLMFlow es un marco de desarrollo minimalista de Large Language Model (LLM) que contiene sólo 100 líneas de código central, demostrando la filosofía de diseño de "mantenerlo simple". El marco está diseñado específicamente para permitir a los asistentes de IA (por ejemplo, ChatGPT, Claude, etc.)...
hace 7 meses
02.8K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI Chatbot: Construye tu compañero de chat AI, diálogo de voz fácil e interacción inteligente.

Introducción Xiaozhi AI Chatbot es un proyecto de código abierto basado en la placa de desarrollo ESP32, diseñado para ayudar a los usuarios a construir su propio compañero de chat de IA. El proyecto fue desarrollado por Shrimp y se utiliza principalmente con fines didácticos para ayudar a más personas a iniciarse en el desarrollo de hardware de IA y entender cómo aplicar grandes modelos de lenguaje a...
hace 5 meses
03.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: una plantilla Next.js para crear aplicaciones de IA con diálogo de voz en tiempo real

Introducción completa OpenAI Realtime API Next.js es un proyecto de código abierto basado en el framework Next.js , diseñado para ayudar a los desarrolladores a crear rápidamente aplicaciones de IA de voz en tiempo real . El proyecto integra la API en tiempo real de OpenAI y la tecnología WebRTC....
hace 7 meses
02.6K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat: asistente de programación asistido por IA basado en la línea de comandos del terminal con el complemento VSCode.

Introducción general Auto-Coder.Chat es una herramienta de programación asistida por IA basada en terminal diseñada para mejorar la eficiencia de programación de los desarrolladores a través de medios inteligentes. La herramienta se puede utilizar con cualquier IDE para permitir la programación asistida por IA en herramientas de desarrollo.Auto...
hace 4 meses
02.7K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: Asistente conversacional de IA para análisis de datos con acceso directo a respuestas, consultas SQL e informes analíticos

Introducción general WrenAI es un asistente SQL AI de código abierto diseñado específicamente para ayudar a los equipos de datos, equipos de productos y equipos de negocios a obtener información de datos a través de conversaciones en lenguaje natural. Es capaz de convertir el lenguaje natural en consultas SQL, generar gráficos, hojas de cálculo e informes,...
hace 7 meses
03.4K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces: automatización de flujos de trabajo con IA, herramienta de programación de tareas para usuarios no técnicos, sustituto de Zapier de código abierto.

Introducción general Activepieces es una plataforma de flujo de trabajo de automatización todo en uno de código abierto centrada en proporcionar soluciones de automatización intuitivas y potentes para empresas y usuarios individuales. Desarrollada en TypeScript, la plataforma es extremadamente escalable y soporta más de 200 servicios integrados...
hace 7 meses
02.7K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Modelo de transferencia de maquillaje jerárquico autosupervisado, maquillaje virtual, migración del maquillaje a nuevos retratos.

Introducción exhaustiva SHMT (Self-supervised Hierarchical Makeup Transfer) es un proyecto de migración de maquillaje jerárquico autosupervisado basado en un modelo de difusión latente, cuyo objetivo es lograr una alta calidad de los efectos de maquillaje mediante métodos de aprendizaje no supervisados....
hace 7 meses
02.9K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: modelos lingüísticos multimodales de código abierto para la interacción visual y verbal en tiempo real

Introducción general VITA es un proyecto líder de modelado de grandes lenguajes multimodales interactivos de código abierto, pionero en la capacidad de lograr una verdadera interacción multimodal completa. El proyecto lanzó VITA-1.0 en agosto de 2024, siendo pionero en el primer gran modelo de lenguaje interactivo completamente modal de código abierto.2024...
hace 7 meses
03.1K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Buscador de tendencias: seguimiento de las tendencias en las redes sociales, los temas de moda y los nuevos artículos en tiempo real para la toma de decisiones de marketing.

Introducción general Trend Finder es una potente herramienta diseñada para ayudar a los usuarios a seguir en tiempo real las tendencias y los temas de moda en las redes sociales. Mediante la recopilación y el análisis de publicaciones de personas influyentes clave, Trend Finder es capaz de detectar nuevas tendencias o lanzamientos de productos a tiempo para enviar...
hace 7 meses
02.9K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: generación y traducción automática de subtítulos multilingües para vídeos con ayuda de la IA.

Introducción general AI no jimaku gumi (AI no subtitle group) es una potente herramienta de procesamiento de subtítulos de vídeo de línea de comandos centrada en permitir funciones automatizadas de extracción, transcripción y traducción de subtítulos de vídeo. La herramienta integra tecnologías avanzadas de inteligencia artificial, como...
hace 7 meses
02.5K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter: una herramienta de conversión de audio en tiempo real para la traducción del chino al inglés basada en el modelo multimodal Gemini.

TransRouter es una herramienta de traducción de voz en tiempo real basada en el modelo Gemini de Google, diseñada específicamente para la traducción de voz en tiempo real entre inglés y chino. La herramienta se integra perfectamente en software de videoconferencia como Zoom, proporcionando una potente herramienta para la traducción...
hace 7 meses
03.1K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: aplicación de código abierto de NotebookLM basada en Deepseek-V3 y PlayHT TTS

Introducción General Open Source NotebookLM es un innovador proyecto de inteligencia artificial que combina las capacidades de comprensión del lenguaje de Deepseek-V3 con la tecnología de síntesis de voz de PlayHT, con el objetivo de crear un sistema inteligente de diálogo para tomar notas. El proyecto fue desarrollado por Build Fast c...
hace 7 meses
02.7K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: generar investigación sobre IA a partir del contenido de las búsquedas web

Introducción general Open Deep Research es una herramienta de código abierto de generación de informes de investigación impulsada por IA como alternativa de código abierto a las capacidades de investigación profunda de Google Gemini. El proyecto está desarrollado en TypeScript y basado en Next.js 1...
hace 4 meses
02.8K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Vision is All You Need: Building an Intelligent Document Retrieval System Using Visual Language Models (Visión RAG)

Introducción Vision-is-all-you-need es un innovador proyecto de demostración del sistema visual RAG (Retrieval Augmented Generation) que abre nuevos caminos en la aplicación del Modelado del Lenguaje Visual (VLM) al ámbito del procesamiento de documentos. A diferencia de los métodos tradicionales de fragmentación de textos, el sistema...
hace 7 meses
03.2K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): proyecto de código abierto que imita a Perplexity, integrando diálogo AI, búsqueda web, consulta meteorológica, etc.

Introducción general MiniPerplx (rebautizado Scira) es un motor de búsqueda minimalista basado en IA que integra una variedad de características útiles para proporcionar a los usuarios una gama completa de servicios de recuperación de información. El proyecto utiliza una moderna pila tecnológica que incluye Next.js, Tailwi...
hace 7 meses
03.2K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: servicio de razonamiento LLM basado en datos externos de grafos de conocimiento en tiempo real.

Introducción exhaustiva Diffbot LLM Reasoning Server es un innovador sistema de modelado lingüístico a gran escala con optimizaciones y mejoras especiales basadas en la arquitectura del modelo LLama. La característica más importante del proyecto es la integración de Knowledge Graph en tiempo real con la generación mejorada de recuperación...
hace 7 meses
02.9K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: Iluminación de imágenes con herramientas de pintura inteligentes

Introducción general LuminaBrush es una innovadora herramienta interactiva de edición de imágenes para efectos de iluminación, impulsada por tecnología de inteligencia artificial. El proyecto utiliza un marco de dos etapas para procesar imágenes: la primera etapa transforma la imagen de entrada en un aspecto "uniformemente iluminado", mientras que la segunda genera...
hace 7 meses
03.5K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: un marco de colaboración multiinteligencia para la creación de equipos de desarrollo de software de IA para la programación en lenguaje natural

Introducción exhaustiva MetaGPT es un innovador marco de trabajo para organismos multiinteligencia diseñado para simular el funcionamiento de una empresa de software de IA completa. Creado por geekan (Alexander Wu), el objetivo del proyecto es combinar modelos GPT con diferentes roles en una entidad colaborativa....
hace 5 meses
03.5K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

Generador llms.txt: Capture rápidamente el contenido del sitio web y genere conjuntos de datos de texto de formación LLM.

Introducción general llmstxt-generator es una herramienta profesional de extracción e integración de contenido web dedicada a la preparación de conjuntos de datos de texto de alta calidad para el entrenamiento y la inferencia en Large Language Models (LLM). La herramienta fue desarrollada por Mendable AI utilizando @firec...
hace 7 meses
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: ¡Acceso gratuito a GPT-4, Llama-3 y muchos otros modelos de IA a través de Raycast!

Introducción general Raycast-G4F (GPT4Free) es una potente extensión de Raycast que ofrece a los usuarios acceso gratuito a una amplia gama de modelos avanzados de IA, incluyendo GPT-4, Llama-3. La extensión no sólo proporciona transmisión de diálogos en tiempo real...
hace 7 meses
03.1K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: Mejorando la Experiencia de Desarrollo de Cursor IDE, Haciendo de Cursor/Windsurf un Asistente de Programación Inteligente similar a Devin.

Introducción General Devin.cursorrules es un innovador proyecto de código abierto diseñado para convertir el asequible Cursor o Windsurf IDE (~$20) en un potente asistente de programación AI como Devin. El proyecto proporciona un conjunto de ...
hace 7 meses
03.3K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...
hace 7 meses
03.2K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: edición inteligente de contenidos de vídeo en cortometrajes, extracción/recorte preciso de clips de vídeo de forma sencilla

Introducción FunClip es una herramienta automatizada de edición de vídeo de código abierto desarrollada por TONGYI Speech Lab del Instituto Dharma de Alibaba. La herramienta integra el modelo de reconocimiento de voz industrial Paraformer-Large, que puede identificar con precisión el habla en el vídeo....
hace 7 meses
03.7K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: un cliente de diálogo inteligente de escritorio basado en la API de Dify, que proporciona capacidades de diálogo AI de nivel empresarial.

Introducción general Dify-WebUI es una moderna aplicación de diálogo inteligente de escritorio basada en la API de Dify, diseñada para proporcionar a las empresas potentes capacidades de diálogo AI. La aplicación es compatible con una variedad de colores de temas preestablecidos para satisfacer las necesidades individuales de las empresas, y tiene una función de gestión de base de conocimientos para apoyar...
hace 7 meses
03.5K
小红书AI运营助手:自动生成和发布小红书文章

Asistente de operaciones Xiaohongshu AI: genera y publica automáticamente artículos Xiaohongshu.

Introducción completa Xiaohongshu AI Operation Assistant (xhsaipublisher) es una herramienta de automatización diseñada para publicar artículos en la plataforma Xiaohongshu. El proyecto combina una interfaz gráfica de usuario con scripts de automatización para generar contenido utilizando la tecnología big model e iniciar sesión y publicar automáticamente a través del navegador....
hace 7 meses
03.8K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown editor: herramientas de diseño gráfico de WeChat sencillas y eficaces, una llave para pegar el artículo al número público de WeChat.

Introducción completa WeChat Markdown Editor (WeChat Markdown Editor) es una herramienta de diseño gráfico WeChat muy conciso diseñado para ayudar a los usuarios a crear fácilmente hermosas mensajes WeChat. El editor es compatible con todos los básicos Markdown ...
hace 7 meses
02.7K
Orchestra: Creación de equipos inteligentes de IA para un desarrollo colaborativo multiinteligencia más fácil y eficiente

Orchestra: Creación de equipos inteligentes de IA para un desarrollo colaborativo multiinteligencia más fácil y eficiente

Orchestra es un innovador framework ligero de Python que se centra en la construcción de sistemas colaborativos multi-inteligencia basados en el Large Language Model (LLM). Emplea un método único de organización de inteligencias para que múltiples inteligencias IA puedan trabajar en armonía como una orquesta sinfónica. Al modelar ...
hace 7 meses
02.1K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent: creación de grafos de conocimiento para automatizar la planificación y ejecución de tareas

Introducción exhaustiva GraphAgent es un sistema automatizado de cuerpo inteligente que integra la generación de grafos, la planificación de tareas y su ejecución. Es capaz de procesar datos estructurados y no estructurados, construir complejos grafos de dependencias semánticas y ejecutar eficientemente tareas de usuario mediante autoplanificación y adaptación de herramientas.Graph...
hace 7 meses
02.3K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor: un conjunto de herramientas en contenedores para desplegar entornos de desarrollo LLM locales con un solo clic y gestionar y ejecutar fácilmente servicios de IA.

Introducción general Harbor es un revolucionario conjunto de herramientas LLM en contenedores centrado en simplificar el despliegue y la gestión de entornos de desarrollo de IA locales. Ofrece a los desarrolladores una interfaz de línea de comandos (CLI) limpia y una aplicación complementaria para lanzar y gestionar con un solo clic, incluyendo backends LLM, interfaces API,...
hace 7 meses
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extracción y categorización de documentos en datos estructurados para optimizar el proceso de tratamiento de documentos.

Introducción exhaustiva ExtractThinker es una herramienta flexible de inteligencia de documentos que extrae y clasifica datos estructurados de documentos utilizando modelos de grandes lenguajes (LLM), proporcionando un flujo de trabajo de procesamiento de documentos sin fisuras similar a ORM. Es compatible con diversos cargadores de documentos, como Tess...
hace 7 meses
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: proyecto de código abierto que permite a la IA manejar ordenadores a distancia y controlarlos mediante lenguaje natural

Introducción general NeoAI es una innovadora herramienta de código abierto AI asistente que permite a los usuarios controlar y gestionar fácilmente sus ordenadores a través del diálogo en lenguaje natural. Sin escribir ningún código, los usuarios pueden hacer la búsqueda de archivos, automatización de tareas, gestión de dispositivos y mucho más con sólo el diálogo diario.NeoAI...
hace 7 meses
04.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: herramienta de IA para extraer prendas de vestir de una persona como imagen de visualización de prendas en mosaico.

Introducción general TryOffAnyone es una innovadora herramienta de procesamiento de imágenes AI diseñada para resolver los desafíos de la exhibición de ropa en el sector del comercio electrónico. Es capaz de convertir de forma inteligente fotos de personas reales vistiendo ropa en imágenes de efecto de pantalla plana, esta tecnología se basa en la última...
hace 7 meses
02.7K
Agentarium: gestión y coordinación de interacciones entre múltiples inteligencias artificiales

Agentarium: gestión y coordinación de interacciones entre múltiples inteligencias artificiales

Introducción General Agentarium es un potente framework Python dedicado a la gestión y orquestación de agentes inteligentes de IA (Agentes). El framework proporciona una forma flexible e intuitiva de crear, gestionar y orquestar interacciones entre múltiples agentes de IA. Utiliza A...
hace 7 meses
03.1K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

ScrapeGraphAI: Una palabra rápida para el rastreo web, sin necesidad de escribir reglas herramienta inteligente de extracción de contenido web.

Introducción completa ScrapeGraphAI es una innovadora biblioteca de raspado web Python que combina inteligentemente Large Language Modelling (LLM) y Direct Graph Logic para crear tuberías de raspado para sitios web y documentos locales. Lo que hace única a esta herramienta es su perfecto nivel de simplicidad y potencia...
hace 7 meses
02.2K
AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

Descripción General AnkiAIUtils es un conjunto de herramientas mejoradas con IA diseñadas para el sistema de aprendizaje de tarjetas flash Anki. Desarrollado por un estudiante de medicina, la herramienta está diseñada para mejorar automáticamente las tarjetas que los usuarios están luchando con durante el proceso de aprendizaje a través de la tecnología de IA. Proporciona a los usuarios...
hace 7 meses
02.9K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Adaptador de historias: Genere ilustraciones gráficas continuas y coherentes basadas en una historia larga.

Introducción general Story-Adapter es un innovador marco de visualización de historias que convierte relatos textuales en secuencias de imágenes coherentes. Desarrollado por investigadores, este proyecto emplea un enfoque iterativo que no requiere formación para generar ilustraciones de historias de alta calidad. El marco se caracteriza por su capacidad para...
hace 7 meses
02.8K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: Visualiza la estructura de los repositorios de código de GitHub y transforma los repositorios de código en diagramas interactivos de arquitectura de sistemas.

Introducción general GitDiagram es una innovadora herramienta de visualización de la base de código de GitHub que transforma rápidamente cualquier repositorio de GitHub en un diagrama interactivo de la arquitectura del sistema. Utiliza tecnología avanzada de IA (Claude 3.5 Sonnet) para proporcionar a los desarrolladores...
hace 7 meses
04.5K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: creación de multiinteligentes de ejecución autónoma, un marco de desarrollo de organismos inteligentes de IA de código abierto totalmente funcional

Introducción general Eliza es un marco avanzado de desarrollo de múltiples cuerpos inteligentes (Multi-Agente) , se compromete a simplificar la construcción y el despliegue del proceso de cuerpo inteligente autónomo (Agente Autónomo) . Soporta el despliegue de múltiples cuerpos inteligentes con diferentes configuraciones de roles , puede lograr ...
hace 7 meses
04.1K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir eBooks en múltiples formatos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de e...
hace 7 meses
03.7K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: un proyecto de código abierto para mejorar la memoria a largo plazo del Agente mediante grafos de conocimiento

Introducción general Memary es un innovador proyecto de código abierto centrado en proporcionar soluciones de gestión de memoria a largo plazo para inteligencias autónomas. El proyecto ayuda a las inteligencias a superar las limitaciones de las ventanas contextuales tradicionales para lograr experiencias de interacción más inteligentes mediante grafos de conocimiento y módulos de memoria especializados.Memary adopta...
hace 7 meses
04.4K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

La IA lee libros: la IA lee libros en PDF página por página, extrae automáticamente los puntos clave del conocimiento y genera resúmenes.

Introducción completa AI-reads-books-page-by-page es un desarrollo basado en Python de la herramienta inteligente de análisis de libros PDF, que puede automatizar el análisis página por página de libros PDF, extraer los puntos clave de conocimiento, y después del intervalo de página especificado para generar etapa...
hace 7 meses
03.5K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: Experimenta un editor de código basado en IA, ¡haz de cada conversación un commit Git!

Introducción general Melty es un revolucionario editor de código de IA que combina conversaciones de chat con el control de versiones Git. Desarrollado por Charlie y Jackson de Replicate, esta herramienta pretende resolver los puntos débiles de las herramientas tradicionales de codificación de IA. Su mayor ...
hace 7 meses
02.6K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: extensión de ayuda de IA que mejora la experiencia de desarrollo de VSCode, la anotación con un solo clic, la conversión y la generación de interfaz de usuario de código.

Introducción general AIDE (AI-assisted Development Extension) es una potente extensión de desarrollo asistido por IA para VSCode, centrada en proporcionar una asistencia de programación de IA única y útil. Es diferente de GitHu...
hace 7 meses
03K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: Genera y edita texto de imagen multilingüe, altamente controlable para generar múltiples líneas de chino en la imagen.

Introducción AnyText es una revolucionaria herramienta de generación y edición de texto visual multilingüe desarrollada a partir del modelo de difusión. Genera texto multilingüe natural y de alta calidad en imágenes y admite funciones flexibles de edición de texto. Fue desarrollada por un equipo de investigadores y presentada en ICLR 2024....
hace 7 meses
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: clon de código abierto del sistema de integración digital man, despliegue en un clic del cliente gratuito digital man.

Introducción completa AigcPanel es un sistema de producción humana digital AI de ventanilla única para todos los usuarios, desarrollado con la pila de tecnología electron+vue3+typescript, compatible con la implementación de un solo clic en Windows. El sistema está diseñado para ser fácil de usar como el núcleo, incluso...
hace 7 meses
03.3K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: Conjunto de herramientas de desarrollo de modelos de IA nativos de Windows, integración de modelos de extremo a extremo en aplicaciones Windows

Introducción general AI Dev Gallery es una aplicación de herramientas de desarrollo de IA de Microsoft (actualmente en vista previa pública) diseñada para desarrolladores de Windows. Proporciona una plataforma completa para ayudar a los desarrolladores a integrar fácilmente las funciones de IA en sus aplicaciones Windo...
hace 7 meses
02.8K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: reconocimiento automático de voz independiente del orador que proporciona marcas de tiempo de gran precisión a nivel de palabra.

Introducción general BetterWhisperX es una versión optimizada del proyecto WhisperX centrada en proporcionar servicios de Reconocimiento Automático del Habla (ASR) eficientes y precisos. Como rama mejorada de WhisperX, el proyecto fue desarrollado por Federico ...
hace 8 meses
03K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot backend proxy service: hacerse cargo del servidor de plugins de GitHub Copilot con otros modelos

Introducción general El Copilot Backend Agent Service es un proyecto de código abierto diseñado para gestionar el servidor de plugins de GitHub Copilot aprovechando otros modelos FIM como DeepSeek, a la vez que soporta que varias personas compartan cuentas oficiales. El servicio soporta una variedad de IDEs, incluyendo V...
hace 8 meses
02.8K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: la API del modelo Gemini es compatible con el formato OpenAI, desbloquea las restricciones regionales y admite el sondeo de claves multiAPI.

Introducción completa Gemini Balance es un servicio proxy de API OpenAI desarrollado sobre la base del marco FastAPI, con el objetivo de proporcionar una gestión eficaz de claves multiAPI y funciones de optimización. El proyecto es compatible con las llamadas al modelo Gemini, y entre sus principales...
hace 4 meses
02.9K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词

DeepSeek Engineer: un asistente de codificación experimental basado en la API DeepSeek, con palabras clave.

Descripción general DeepSeek Engineer es una potente herramienta asistente de programación basada en la API DeepSeek, capaz de interactuar con el usuario a través de una intuitiva interfaz de línea de comandos para ayudarle en diversas tareas de desarrollo de software. La herramienta combina la potencia del modelado de lenguajes a gran escala con...
hace 6 meses
03K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: Interfaz de chat web sencilla con modelos de IA multiplataforma integrados (sin implantación)

Introducción general OrionChat es una interfaz de chat de IA basada en web que proporciona a los usuarios una plataforma unificada para interactuar con múltiples modelos de IA de corriente principal. El proyecto es compatible con una amplia gama de modelos de IA, incluidos Ollama (que se ejecuta localmente), OpenAI GPT, Google Gemi...
hace 8 meses
02.6K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: rastreo de datos de Twitter y análisis de datos de usuarios X y tweets

Introducción general X-Kit es una herramienta de código abierto diseñada para rastrear y analizar datos y tweets de usuarios de X (antes Twitter). Desarrollada por el usuario de GitHub xiaoxiunique, la herramienta está diseñada para ayudar a los usuarios a automatizar el proceso de obtención de información básica y tweets sobre un determinado usuario de X y...
hace 8 meses
03K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT: Creación de vídeos narrados breves o resúmenes de vídeos largos en un solo clic mediante modelos Gemini

Introducción general AI2SRT es un proyecto de código abierto que utiliza el gran modelo GeminiAI para generar vídeos narrados cortos y resúmenes de vídeo para vídeos largos con un solo clic, a la vez que admite subtítulos de transcripción de audio y vídeo. El proyecto pretende simplificar el proceso de creación de contenidos de vídeo y proporcionar funciones eficaces de generación y traducción de subtítulos. Los usuarios pueden pasar...
hace 8 meses
03.1K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: modelo de lenguaje visual inteligente de código abierto de Smart Spectrum para la automatización de interfaces gráficas

Introducción CogAgent es un modelo de lenguaje visual de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), cuyo objetivo es automatizar el funcionamiento de la interfaz gráfica de usuario (GUI) en todas las plataformas. El modelo se basa en CogVLM (GLM-4V-9B) y es compatible con el chino y el inglés bilingües....
hace 8 meses
02.9K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: generación de vídeos con control preciso de la postura humana, creación de bailarinas

Introducción general DisPose es un innovador proyecto de inteligencia artificial de código abierto centrado en la generación controlada de animación de imágenes de personajes. Desarrollado por un equipo de investigadores y de código abierto en GitHub, el proyecto utiliza técnicas avanzadas de aprendizaje profundo para lograr un control preciso de la animación de personajes mediante la descomposición de la información de pose esquelética.D...
hace 8 meses
02.5K
Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Introducción completa Smolagents es una biblioteca ligera de agentes inteligentes desarrollada por HuggingFace que se centra en simplificar el proceso de desarrollo de sistemas de agentes de IA. El proyecto es conocido por su simplicidad en la filosofía de diseño, con sólo alrededor de 1000 líneas de código del núcleo, sin embargo, proporciona potentes capacidades de integración de características. Es más ...
hace 7 meses
04.2K
Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Introducción completa Vision Parse es una revolucionaria herramienta de procesamiento de documentos, que combina inteligentemente la tecnología más avanzada de modelos de lenguaje visual (Vision Language Models), la capacidad de convertir inteligentemente documentos PDF a formato Markdown de alta calidad...
hace 8 meses
02.8K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Proyecto de superresolución de imágenes de código abierto para mejorar la calidad de la resolución de imágenes.

Introducción general InvSR es un innovador proyecto de código abierto de superresolución de imágenes basado en técnicas de inversión de la difusión capaces de convertir imágenes de baja resolución en imágenes de alta calidad y alta resolución. El proyecto explota el rico conocimiento previo de la imagen incrustado en modelos de difusión a gran escala preentrenados y, mediante un mecanismo de muestreo flexible, admite...
hace 8 meses
03.5K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelización autorregresiva por bits de la generación de imágenes de alta resolución para una generación ilimitada de imágenes de alta resolución

Introducción general Infinity es un innovador marco de generación de imágenes de alta resolución desarrollado por el equipo de FoundationVision. El proyecto rompe con las limitaciones de los modelos tradicionales de generación de imágenes a través de un innovador enfoque de modelado autorregresivo visual a nivel de bits.Las principales características de Infinity...
hace 8 meses
03.5K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: Asistente de programación inteligente que se ejecuta en un terminal de línea de comandos, alternativa localizada al intérprete de código ChatGPT.

Introducción GPTMe es un revolucionario asistente de IA para terminales diseñado para mejorar la eficiencia del trabajo de los desarrolladores. Combina a la perfección potentes capacidades de IA con el entorno del terminal, soportando diversas funciones como ejecución de código, edición de archivos, navegación web y reconocimiento visual. Como solucionador de código ChatGPT...
hace 8 meses
02.9K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Herramienta de supervisión de la degradación del servicio ChatGPT: Detección de degradaciones del servicio ChatGPT

Introducción completa La herramienta de monitorización de la degradación del servicio ChatGPT es un proyecto de código abierto diseñado para ayudar a los usuarios a detectar si su servicio ChatGPT se ha degradado debido a IPs de alto riesgo. La herramienta analiza los valores de dificultad de Proof of Work (PoW) para determinar si los usuarios...
hace 8 meses
02.8K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: generador de logotipos de código abierto que utiliza inteligencia artificial para generar logotipos de marca profesionales.

Introducción general LogoCreator es un generador de logotipos de código abierto basado en el modelo Together AI y Flux, centrado en proporcionar servicios de diseño de logotipos rápidos y profesionales para empresas y particulares. El proyecto es desarrollado y de código abierto por el desarrollador Nutlope en Git...
hace 8 meses
03.3K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: un marco profesional de preguntas y respuestas sobre bases de conocimiento para la recuperación híbrida de vectores y grafos de conocimiento

Introducción exhaustiva KAG (Knowledge Augmented Generation) es un marco de razonamiento y recuperación guiado por formas lógicas basado en el motor OpenSPG y en grandes modelos lingüísticos (LLM). El marco está diseñado específicamente para construir bases de conocimiento de dominio profesional...
hace 8 meses
04.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: Herramienta avanzada de código abierto para incrustar y extraer marcas de agua ocultas en vídeo y proteger los derechos de autor.

Introducción general VideoSeal es una herramienta de marca de agua de vídeo de código abierto desarrollada por Facebook Research, diseñada para proporcionar una incrustación y extracción eficientes de marcas de agua de vídeo. La herramienta es compatible con los últimos modelos de código abierto y contiene modelos preentrenados, código de entrenamiento, código de inferencia y herramientas de evaluación....
hace 8 meses
02.8K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库

Languine: traducción de aplicaciones mediante IA, compatible con las principales bibliotecas i18n.

Introducción general Languine es una potente herramienta de traducción desarrollada por Midday para ayudar a los desarrolladores a agilizar el proceso de localización de sus aplicaciones. Con Languine, los desarrolladores pueden aprovechar la tecnología de IA para generar rápidamente traducciones precisas y...
hace 8 meses
02.9K