Proyecto AI de código abierto

Total 1020 artículos
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Introducción general Devika es un ingeniero de software de IA avanzada que entiende instrucciones humanas de alto nivel, las descompone en pasos, estudia la información relevante y escribe código para lograr un objetivo determinado. Desarrolla software de forma inteligente utilizando modelos lingüísticos a gran escala, algoritmos de planificación y razonamiento y capacidades de navegación web.D...
hace 5 meses
03.3K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

Markdown To Poster: convierta Markdown en pósters para redes sociales/pequeños rojos con edición en línea y soporte de despliegue con un solo clic.

Descripción general Markdown to Image es un componente React para renderizar texto Markdown en imágenes de medios sociales visualmente atractivas. El proyecto también incluye un editor web incorporado que se puede utilizar como un editor en línea de Markdown a póster....
hace 9 meses
03K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: una herramienta de IA para ofrecer tutorías personalizadas, un proyecto de tutor personal de IA de código abierto basado en Llama 3.1

Introducción general Llama Tutor es un proyecto de tutor personal de IA de código abierto basado en Llama 3.1, diseñado para proporcionar a los usuarios una experiencia de aprendizaje personalizada. Mediante la integración de múltiples pilas tecnológicas como Together AI, Next.js y T...
hace 9 meses
02.7K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: Ejecución de clústeres de IA distribuidos utilizando dispositivos domésticos inactivos, con soporte para múltiples motores de inferencia y descubrimiento automatizado de dispositivos.

Introducción general Exo es un proyecto de código abierto diseñado para ejecutar su propio clúster de IA utilizando dispositivos cotidianos (por ejemplo, iPhone, iPad, Android, Mac, Linux, etc.). Mediante la partición dinámica de modelos y el descubrimiento automatizado de dispositivos, Exo es capaz de unificar múltiples dispositivos en un potente...
hace 9 meses
05.6K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: un conjunto de herramientas para construir rápidamente interfaces de chat de IA con soporte para la integración de modelos y la gestión del flujo de datos.

Introducción Ant Design X es un conjunto de herramientas de código abierto de Ant Group, diseñado para ayudar a los desarrolladores a crear rápidamente interfaces de diálogo basadas en IA. Proporciona un amplio conjunto de componentes y plantillas, soporta la integración de modelos compatibles con los estándares OpenAI, y es adecuado para una variedad de aplicaciones tales como servicio al cliente inteligente, asistentes de IA, y otros...
hace 9 meses
03.5K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: herramienta de código abierto para detectar vulnerabilidades LLM y asegurar la IA generativa

Introducción completa NVIDIA Garak es una herramienta de código abierto diseñada específicamente para detectar vulnerabilidades en Large Language Models (LLMs). Comprueba el modelo en busca de múltiples debilidades como ilusiones, fugas de datos, inyección de pistas, generación de mensajes de error, generación de contenido dañino, etc. mediante sondeos estáticos, dinámicos y adaptativos....
hace 9 meses
02.7K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: herramientas de gestión de marcadores AI de código abierto, compatible con múltiples formatos, clasificación inteligente de etiquetas, búsqueda de texto completo

Descripción general Hoarder es una herramienta de gestión de marcadores autoalojada que permite almacenar enlaces, notas, PDF e imágenes. Utiliza tecnología de IA para el etiquetado automático y ofrece funciones de búsqueda de texto completo. Los usuarios pueden utilizar el plugin de Chrome y el plugin de Firefox...
hace 8 meses
03.2K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: el estilo de interfaz unificado de OpenAI llama a varios modelos grandes, cambio rápido de modelo y pruebas comparativas.

Introducción completa aisuite es una interfaz sencilla y unificada diseñada para permitir a los desarrolladores invocar fácilmente los servicios de múltiples proveedores de IA generativa. Con una interfaz similar a OpenAI, aisuite facilita la interacción con los LLM (Large Language Models) más populares....
hace 9 meses
03.1K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: conversión sin pérdidas de PDF a HTML, manteniendo el formato del texto, adecuado para trabajos académicos y composición de revistas.

Introducción completa pdf2htmlEX es una herramienta de código abierto diseñada para convertir archivos PDF a formato HTML , mediante el análisis del contenido del archivo PDF y el uso de HTML + CSS para restaurar con precisión su efecto visual , el documento PDF se ...
hace 9 meses
03.3K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: Ofrecer una solución de puerta de enlace de IA eficiente para simplificar la gestión de microservicios y mejorar la seguridad

Introducción completa Higress es una pasarela de API nativa de la nube desarrollada por Alibaba, construida sobre Istio y Envoy, diseñada para proporcionar soluciones eficientes de programación de tráfico, gobernanza de servicios y seguridad. Admite extensiones de plugin Wasm para múltiples lenguajes de programación para negocios de IA....
hace 9 meses
03K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: Marco de orquestación de cuerpos inteligentes con soporte de agentes RAG y LLM para simplificar el desarrollo de aplicaciones de IA

Introducción general Dynamiq es un marco de orquestación de IA de código abierto diseñado para aplicaciones de IA de agentes y Large Language Modelling (LLM). Su objetivo es simplificar el desarrollo de aplicaciones basadas en IA, especialmente en el área de la Generación Aumentada de Recuperación (RAG) y la orquestación de agentes LLM.Dynamiq propone...
hace 9 meses
03.8K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: un modelo de lenguaje visual ligero de código abierto para la retropropagación por lotes de palabras clave de imágenes

Introducción exhaustiva Moondream es un modelo de lenguaje visual ligero de código abierto diseñado para habilitar capacidades de descripción de imágenes mediante técnicas de aprendizaje profundo y visión por ordenador. El modelo es capaz de funcionar de manera eficiente en una variedad de plataformas, y es particularmente adecuado para dispositivos edge.Moondream utiliza técnicas avanzadas y...
hace 7 meses
03K
PicMenu:文字菜单转换为美观的图文菜单

PicMenu: Convierte menús de texto en bonitos menús gráficos

Introducción exhaustiva PicMenu es una innovadora herramienta de IA que transforma los menús tradicionales de papel en menús de imágenes vívidas e intuitivas a través de una simple operación fotográfica. La herramienta no solo genera automáticamente imágenes de alta calidad de cada plato, sino que también proporciona información enriquecida sobre los platos para la transformación digital del sector de la restauración....
hace 9 meses
02.9K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: generación rápida de imágenes de alta resolución, modelo de tamaño ultrapequeño de 0,6B, funcionamiento con GPU de portátil de bajo perfil

Introducción general Sana es un eficiente marco de generación de imágenes de alta resolución desarrollado por NVIDIA Labs, capaz de generar imágenes de hasta 4096 × 4096 de resolución en cuestión de segundos.Sana emplea un transformador de difusión lineal y tecnología de autocodificación de compresión profunda para...
hace 9 meses
03.2K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: herramienta profesional de creación de ilustraciones manga de cuatro paneles, generación de imágenes, edición de páginas manga

Introducción general SP-MangaEditer es una plataforma independiente de edición de manga diseñada para creadores de manga. La plataforma soporta generación de imágenes, edición por capas, ajuste de imágenes, aplicación de filtros y muchas otras funciones para ayudar a los usuarios a crear fácilmente ilustraciones manga de alta calidad. Los usuarios pueden manipular...
hace 7 meses
03.1K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: Permite a los usuarios consultar bases de datos SQLite y archivos CSV/JSON para obtener datos de consulta.

Introducción general SQLite-Utils-Ask es una potente herramienta diseñada para ayudar a los usuarios a realizar consultas de datos de preguntas y respuestas en bases de datos SQLite y archivos CSV/JSON con la ayuda de LLM (Large Language Model). La herramienta es capaz de generar automáticamente preguntas de usuario basadas en...
hace 9 meses
02.9K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: herramienta de lectura de código fuente, que utiliza LLM para analizar el código, proporcionar explicaciones detalladas del código, soporte para una variedad de lenguajes de programación.

Introducción general askrepo es una herramienta de lectura de código fuente basada en LLM (Large Language Model). Puede leer el contenido de un archivo de texto gestionado por Git en un directorio especificado y enviarlo a la API Gemini de Google para proporcionar respuestas a preguntas basadas en preguntas especificadas....
hace 9 meses
03.1K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: herramienta de traducción automática que conserva toda la tipografía de los PDF

Introducción completa PDFMathTranslate es una herramienta de código abierto centrado en la traducción de artículos científicos , documentos PDF se pueden traducir en su totalidad y generar una versión bilingüe . Utiliza la tecnología AI para conservar el diseño completo del documento original , incluyendo fórmulas , diagramas , tablas de contenido y notas , soporte ...
hace 2 meses
04.8K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: herramienta de traducción de vídeo multifuncional de código abierto, transcripción y traducción de voz a varios idiomas, instalación de Windows con un solo clic.

Introducción general Voice-Pro es una herramienta versátil basada en Gradio WebUI que admite voz a texto, texto a voz, traducción en tiempo real, descarga de vídeos de YouTube y separación de voz humana. Integra Whisper, Faster-Wh...
hace 9 meses
03.4K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Introducción Linly-Dubbing es una herramienta inteligente de traducción y doblaje multilingüe diseñada para proporcionar a los usuarios servicios de traducción de subtítulos y doblaje de vídeo multilingüe de alta calidad mediante la integración de tecnología avanzada de IA. La herramienta es especialmente adecuada para la educación internacional, la localización de contenidos globales y otros escenarios, ayudando...
hace 7 meses
03.3K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: convierte dibujos estáticos en animaciones de bocetos guiadas por texto, simplificando el proceso de animación.

Introducción general FlipSketch es un proyecto de código abierto diseñado para convertir dibujos estáticos en animaciones guiadas por texto. Alojado en GitHub, el proyecto proporciona una herramienta innovadora que permite a los usuarios generar efectos de animación a partir de descripciones de texto.FlipSketch combina...
hace 9 meses
02.5K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: base de conocimientos conversacional basada en GraphRAG/herramienta de búsqueda profunda en la web con diálogos que pueden integrarse en otros sitios web.

Introducción general AutoFlow es una herramienta de código abierto desarrollada por PingCAP para construir bases de conocimiento basadas en grafos con almacenamiento vectorial sin servidor TiDB. Integra los frameworks LlamaIndex y DSPy para soportar búsquedas complejas de diálogos y grafos de conocimiento....
hace 7 meses
02.9K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: una plataforma sin código y de código abierto que rastrea automáticamente datos web y los convierte en API u hojas de cálculo.

Introducción completa Maxun es una plataforma de extracción de datos web sin código de código abierto que permite a los usuarios entrenar robots en cuestión de minutos para rastrear automáticamente datos web y convertirlos en API u hojas de cálculo. La plataforma admite paginación y desplazamiento, se adapta a los cambios en el diseño del sitio web, proporciona un potente rastreo de datos...
hace 7 meses
03.8K
OpenPromptStudio:可视化编辑、管理图像提示词,同步自己的Notion提示词表

OpenPromptStudio: edita y gestiona visualmente avisos de imagen, sincroniza tus propias listas de avisos de Notion.

Introducción general OpenPromptStudio (OPS) es un editor visual de código abierto para palabras clave AIGC, desarrollado por el equipo Moonvy. Está diseñado para simplificar el proceso de creación y gestión de palabras de aviso, apoyando modelos de IA como Midjourney.OPS soporta modelos de IA a través de No...
hace 9 meses
02.7K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Interfaz web de generación de texto: interfaz de chat basada en modelos lingüísticos de gran tamaño de Gradio y compatible con varios servicios backend.

Introducción general La interfaz web de generación de texto es una interfaz web basada en Gradio diseñada para el Large Language Model (LLM). Soporta una variedad de backends de generación de texto, incluyendo Transformers, llama.cp...
hace 9 meses
04.1K
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码

Morphic: motor de búsqueda de código abierto impulsado por inteligencia artificial que ofrece preguntas y respuestas inteligentes, búsqueda de vídeos y generación de código de interfaz de usuario.

Introducción general Morphic es un motor de búsqueda basado en tecnología de IA con una interfaz de usuario generativa diseñada para ofrecer preguntas y respuestas inteligentes y una experiencia de búsqueda eficiente. Los usuarios pueden realizar una gran variedad de búsquedas con Morphic, incluyendo texto, vídeo, etc., y pueden guardar el historial de búsqueda y compartir los resultados.Mo...
hace 9 meses
03K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Swarm: un proyecto pedagógico experimental para el aprendizaje de sistemas corporales ligeros multiinteligentes (ejemplo de OpenAI)

Introducción general Swarm es un marco educativo experimental desarrollado por OpenAI para explorar interfaces ligeras, controladas y fáciles de probar para sistemas multiagente. El marco se utiliza principalmente para demostrar traspasos y patrones rutinarios entre agentes, ayudando a los desarrolladores a comprender e implementar la coordinación y ejecución de sistemas multiagente....
hace 7 meses
03K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: retratos sonoros para generar vídeos parlantes (instalador acelerado de EchoMimicV2)

Introducción general EchoMimic es un proyecto de código abierto diseñado para generar animaciones de retratos realistas controladas por audio. Desarrollado por la división Terminal Technologies de Ant Group, el proyecto utiliza condiciones de puntos marcadores editables para generar vídeos de retratos dinámicos utilizando una combinación de audio y puntos marcadores faciales.EchoMimic...
hace 7 meses
03.3K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: un asistente de IA para la gestión del conocimiento empresarial y la búsqueda de documentos, que integra múltiples herramientas de trabajo

Introducción general Danswer es un asistente de IA para la recuperación de documentos empresariales de código abierto diseñado para conectarse con documentos, aplicaciones y personas del equipo para proporcionar respuestas unificadas de búsqueda y consultas en lenguaje natural a través de una interfaz de chat inteligente y capacidades de búsqueda unificadas. Garantiza que los datos de los usuarios y los chats...
hace 5 meses
03.6K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: Asistente de Chat de Documentos, obtenga respuestas fiables a partir de documentos individuales, fuentes web, soporte a la implantación local.

Introducción general DocsGPT es un asistente de documentación de código abierto diseñado para simplificar el proceso de consulta de la documentación del proyecto. Mediante la integración de un potente modelo GPT , los desarrolladores pueden hacer fácilmente preguntas sobre el proyecto y obtener respuestas precisas.DocsGPT soporta el despliegue local para garantizar la privacidad de los datos mientras...
hace 9 meses
03.4K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: un robot de diálogo inteligente construido a partir de un modelo de gran tamaño, compatible con WeChat y otras plataformas de acceso multidiálogo.

Introducción general El proyecto ChatGPT-on-WeChat es un gran robot de diálogo inteligente basado en modelos, que admite el acceso multiplataforma a WeChat personal, número público de WeChat, aplicación WeChat empresarial, Flybook, Nail, etc. Los usuarios pueden elegir GPT3.5, GPT-4, Claude, Man...
hace 8 meses
03.5K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atómicos: un marco para construir inteligencias de IA modulares y ligeras

Introducción general Atomic Agents es un framework extremadamente ligero y modular diseñado en torno al concepto de atomicidad para construir pipelines y aplicaciones de IA con agentes. El marco proporciona un conjunto de herramientas y agentes que pueden combinarse para crear potentes aplicaciones. Se basa en Instruc...
hace 8 meses
02.8K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragmentos: versiones de código abierto de aplicaciones como Claude Artifacts de Anthropic, Vercel v0 o GPT Engineer.

Introducción general Fragments by E2B es un proyecto de código abierto que proporciona una plantilla basada en Next.js para construir aplicaciones generadas íntegramente por IA. Desarrollado por E2B, el proyecto pretende simplificar y acelerar el proceso de desarrollo de aplicaciones de IA. Integra una variedad de ...
hace 9 meses
02.8K
E2B:安全云沙箱中的AI代码运行平台

E2B: plataforma de ejecución de código de inteligencia artificial en un entorno seguro en la nube

Introducción general E2B es una plataforma de código abierto diseñada para ejecutar código generado por IA en un entorno seguro en la nube. Es compatible con una amplia gama de lenguajes y marcos de programación y proporciona un entorno virtual aislado para garantizar la seguridad y la fiabilidad de la ejecución del código.
hace 7 meses
03.1K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: una biblioteca experimental para la optimización de grandes modelos de palabras clave, que optimiza automáticamente Prompt

Introducción general Promptimizer es una biblioteca experimental de optimización de palabras clave diseñada para ayudar a los usuarios a mejorar sistemáticamente las palabras clave de sus sistemas de IA. Al automatizar el proceso de optimización, Promptimizer puede mejorar el rendimiento de las palabras clave en tareas específicas. Los usuarios sólo tienen que...
hace 9 meses
03.2K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: una interfaz de chat limpia para interactuar con los modelos nativos de Ollama

Introducción general HiOllama es una interfaz fácil de usar basada en Python y Gradio, diseñada para interactuar con los modelos de Ollama. Proporciona una interfaz web sencilla e intuitiva que admite la generación de texto en tiempo real y funciones de gestión de modelos. Los usuarios pueden ajustar parámetros como la temperatura y la mayoría...
hace 9 meses
03.1K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: proyecto de código abierto de reparación de imágenes dañadas y zoom de alta definición, mínimo 16G de memoria de vídeo

Descripción general InstantIR es un innovador modelo de restauración de una sola imagen desarrollado por el equipo de InstantX, diseñado para resucitar sus imágenes dañadas con detalles de gran calidad y realismo, capaz de realizar una restauración de alta calidad de imágenes dañadas. La herramienta no sólo restaura los detalles de la imagen...
hace 9 meses
03.7K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: extrae cualquier dato no estructurado de documentos/multimedia y lo analiza para convertirlo en datos estructurados.

Introducción general OmniParse es una potente plataforma de análisis y optimización de datos diseñada para transformar cualquier dato no estructurado en datos estructurados y procesables, optimizada para el marco GenAI (Generative Artificial Intelligence). Tanto si trabaja con documentos, tablas, imágenes, vídeos, archivos de audio o...
hace 9 meses
02.9K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: herramienta de pizarra virtual estilo dibujo a mano | Diagrama de flujo de generación de texto basado en IA | Tutoriales de Excalidraw

Excalidraw Descripción General Excalidraw es una herramienta de dibujo de pizarra virtual de código abierto que le permite dibujar fácilmente diagramas con un estilo dibujado a mano. Puede utilizar Excalidraw para crear hermosas ilustraciones de estilo dibujado a mano, diagramas...
hace 9 meses
03.4K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK de código abierto para pizarras de lienzo ilimitadas, AI para generar wireframes minimalistas y diagramas UML.

Descripción general tldraw es una herramienta de dibujo colaborativo gratuita e instantánea que proporciona un lienzo ilimitado donde los usuarios pueden dibujar gráficos rápidamente, escribir texto y colaborar al instante. Con una interfaz intuitiva y un rendimiento excelente, es adecuada para la colaboración en equipo y el trabajo remoto. Apoyado por la comunidad de código abierto, tldr...
hace 9 meses
02.9K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: una plataforma de diálogo de análisis de datos para consultas de datos y generación de gráficos en lenguaje natural

Introducción general PandasAI es una plataforma de código abierto basada en Python diseñada para simplificar el proceso de análisis de datos mediante técnicas de procesamiento del lenguaje natural. Permite a los usuarios trabajar en un diálogo con bases de datos (por ejemplo, SQL, CSV, pandas, polars, mongodb, n...
hace 9 meses
02.9K
Reactive Resume:支持多语言、多模板的开源免费简历生成器

Reactive Resume: creador de currículos gratuito y de código abierto con soporte multilingüe y multiplantilla

Descripción general Reactive Resume es un creador de currículums gratuito y de código abierto diseñado para simplificar el proceso de crear, actualizar y compartir currículums. La plataforma se centra en la privacidad del usuario, sin seguimiento ni publicidad. Los usuarios pueden autoalojar la aplicación en menos de 30 segundos, tomando el control total de su...
hace 8 meses
02.9K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: sistema de procesamiento de documentos PDF y preguntas y respuestas basado en FastAPI

Introducción general FastAPI DocGPT es un sistema de cuestionarios sobre documentos basado en FastAPI que permite a los usuarios cargar archivos PDF y realizar cuestionarios basados en el contenido de los documentos. El sistema utiliza la tecnología de incrustación de OpenAI para incrustar el contenido del documento en una base de datos vectorial Q...
hace 9 meses
02.9K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: una herramienta automatizada de I+D basada en datos que facilita los procesos de I+D basados en datos mediante tecnología de IA.

Introducción general RD-Agent es una herramienta de código abierto de Microsoft diseñada para automatizar y optimizar el proceso de investigación y desarrollo (I+D). La herramienta se centra en escenarios basados en datos para mejorar la eficacia del desarrollo de modelos y datos mediante técnicas de inteligencia artificial.RD-Agent integra la investigación...
hace 5 meses
04.1K
TableGPT2:表格数据集成的多模态模型

TableGPT2: un modelo multimodal para la integración de datos tabulares

Introducción general TableGPT2 es un modelo multimodal desarrollado por un equipo de la Universidad de Zhejiang, centrado en la integración y el procesamiento de datos tabulares. El modelo está preentrenado y perfeccionado para poder realizar tareas relacionadas con datos de tablas, al tiempo que mantiene unas sólidas capacidades de lenguaje y codificación de propósito general.TableGP...
hace 9 meses
03.9K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: persona digital interactiva de voz en tiempo real con clonación personalizada de imágenes y tonos, compatible con soluciones de voz de extremo a extremo y soluciones en cascada.

Introducción general VideoChat es un proyecto de persona digital de interacción de voz en tiempo real basado en tecnología de código abierto, que admite tanto esquemas de voz de extremo a extremo (GLM-4-Voice - THG) como esquemas en cascada (ASR-LLM-TTS-THG). El proyecto permite a los usuarios personalizar la ...
hace 9 meses
02.9K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): asistente de voz local en tiempo real, versión de código abierto de Siri.

Introducción general Ichigo es un proyecto de IA de voz en tiempo real de código abierto que pretende ampliar los modelos de lenguaje basados en texto con capacidades de "escucha" nativa. El proyecto utiliza técnicas de fusión temprana inspiradas en el documento Chameleon de Meta.El objetivo de Ichigo es convertirse...
hace 7 meses
03K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: genere datos de entrenamiento de IA mediante la API gratuita de big models, generación de datos de entrenamiento de big models a coste 0.

Introducción completa SFT-data-builder es un proyecto de código abierto diseñado para generar datos de entrenamiento SFT de alta calidad utilizando la API gratuita Big Model combinada con datos de dominio privado de los usuarios. La herramienta admite múltiples formatos de modelos de IA y ofrece generación con un solo clic, generación por lotes, edición flexible y...
hace 9 meses
02.6K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)

Agregador: plataforma única de rastreo y agregación de agentes, fondo común de agentes gratuitos (utilícelo de forma respetuosa).

Introducción completa Aggregator es un proyecto de código abierto destinado a crear una piscina proxy libre que puede rastrear una variedad de nodos proxy disponibles. La plataforma tiene un sistema flexible de plug-in , los usuarios pueden de acuerdo a las necesidades especiales del sitio de destino , a través de plug-ins para lograr funciones específicas . El proyecto se utiliza principalmente para aprender a rastrear ...
hace 9 meses
02.9K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: agente asistente multiinteligente para el desarrollo de software basado en IA, que cubre todos los tipos de operaciones de los desarrolladores.

Introducción general OpenHands es un proyecto de código abierto desarrollado por el equipo All-Hands-AI para agilizar el proceso de desarrollo de software a través de la tecnología de IA. Anteriormente conocida como OpenDevin y ahora rebautizada como OpenHands, la plataforma proporciona potentes...
hace 7 meses
05.1K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: un motor de búsqueda de IA de código abierto que reproduce 1 a 1 las características y la interfaz de Perplexity AI.

Introducción general Perplexica es un motor de búsqueda de código abierto basado en IA diseñado para proporcionar respuestas que profundizan en Internet. Utiliza algoritmos avanzados de aprendizaje automático, como la búsqueda por similitud y técnicas de incrustación, para optimizar los resultados de búsqueda y ofrecer respuestas claras con fuentes citadas.Perple...
hace 9 meses
03.4K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: manejo automatizado de smartphones mediante inteligencias multimodales

Introducción AppAgent es un marco de agente multimodal basado en un modelo de lenguaje amplio (LLM) diseñado para manipular aplicaciones de teléfonos inteligentes. El marco imita interacciones humanas como toques y deslizamientos a través de un espacio de manipulación simplificado, eliminando así la necesidad de acceso al back-end del sistema y extendiendo su uso a través de diferentes aplicaciones....
hace 8 meses
03.4K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: Captura automática de noticias para generar podcasts de audio

Introducción general AI Podcast Generator es una herramienta inteligente de generación de podcasts que utiliza tecnología avanzada de IA para crear automáticamente contenidos de audio atractivos a partir de fuentes web. El sistema genera narraciones de flujo natural capturando contenidos de noticias y convirtiéndolos en podcasts de audio. El proyecto se basa en la...
hace 9 meses
03.3K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件

WhoDB: software ligero de gestión de visualización de bases de datos con interacción en lenguaje natural

Introducción general WhoDB es una herramienta de gestión de bases de datos ligera (~20MB), potente y fácil de usar, diseñada para simplificar las tareas de administración de bases de datos. Combina la simplicidad de Adminer con la experiencia del usuario y mejoras en el rendimiento.WhoDB utiliza Go...
hace 9 meses
02.5K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: Plataforma de análisis de datos financieros de código abierto que integra conjuntos de datos privados e IA para mejorar la toma de decisiones de inversión.

Introducción general OpenBB es una plataforma de análisis de datos financieros gratuita y de código abierto diseñada para facilitar el acceso a datos financieros y herramientas de análisis para todos. La plataforma integra más de 100 fuentes de datos diferentes que cubren acciones, opciones, criptomonedas, divisas, indicadores macroeconómicos,...
hace 7 meses
04.4K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: modelo experimental de conversión de texto en voz, TTS implementado mediante un enfoque de modelado lingüístico puro.

Introducción general OuteTTS es un modelo experimental de conversión de texto en habla (TTS) que utiliza un enfoque de modelado lingüístico puro para generar habla de alta calidad. A diferencia de los sistemas TTS tradicionales, OuteTTS no requiere adaptadores externos ni arquitecturas complejas. El modelo se basa en la arquitectura LLaMa...
hace 6 meses
03.2K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: Base de conocimientos + LLM Mentor inteligente de revisión de código para GitHub

Introducción completa CR-Mentor es una herramienta inteligente de revisión de código que combina una base de conocimientos profesional con la potencia de Large Language Modelling (LLM). No sólo admite la revisión de código para todos los lenguajes de programación, sino que también personaliza criterios de revisión exclusivos y áreas de enfoque para los equipos basándose en las mejores prácticas acumuladas en la base de conocimientos. A través de...
hace 9 meses
03.1K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: un nuevo marco de orquestación de agentes impulsado por LLM y EKG (conocimiento del sector)

Introducción general muAgent es un innovador marco multiinteligentsia desarrollado por Ant Group. El marco ayuda a los usuarios a ejecutar diversos procedimientos operativos estándar (SOP) complejos bajo orientación humana mediante arrastrar y soltar en lienzo y escritura de texto simple, en colaboración con multiintelligentsia, llamadas a funciones, intérpretes de código y otras tecnologías....
hace 9 meses
02.8K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: cliente de escritorio para asistentes de inteligencia artificial con modelos API/Web/locales integrados

Introducción general Cherry Studio es un cliente de escritorio que admite una amplia gama de servicios de Large Language Model (LLM) y es compatible con sistemas Windows, Mac y Linux. Ofrece numerosas opciones de personalización y funciones de vanguardia diseñadas para ayudar a los usuarios en una amplia gama de...
hace 6 meses
07K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: una aplicación web comercial que integra servicios de IA multimodal (código abierto gratuito)

Introducción general 99AI es un proyecto de aplicación web de IA de código abierto cuyo objetivo es proporcionar una plataforma de servicios de IA integrada de bajo umbral y fácil de desplegar. El proyecto admite diálogos inteligentes, modelos multimodales, plazas de aplicaciones, búsquedas en red e integra pintura, música y vídeo de IA....
hace 9 meses
03.3K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API de extracción de texto (text-extract-api): extracción visual de información textual, herramienta de extracción anónima de PDF

Introducción general La API de extracción de texto (text-extract-api) es una potente herramienta diseñada para extraer y analizar el contenido de diversos formatos de documento (por ejemplo, PDF, Word, PPTX, etc.). La API utiliza tecnología punta de reconocimiento óptico de caracteres (OCR) y Ol...
hace 7 meses
03.3K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: un modelo unificado de generación de imágenes con entradas multimodales para generar imágenes coherentes con los caracteres

Introducción general OmniGen es un modelo "universal" de generación de imágenes desarrollado por VectorSpaceLab que permite a los usuarios crear efectos visuales diversos y contextualmente ricos con simples indicaciones de texto o entradas multimodales. Es especialmente adecuado para aplicaciones que necesitan reconocer...
hace 9 meses
03.7K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): marco de generación de gestos de cuerpo entero, marco de animación 3D para generar gestos de cuerpo entero a partir de audio.

Introducción exhaustiva PantoMatrix es un marco avanzado de generación de gestos de cuerpo completo capaz de generar movimientos humanos completos a partir de audio y gestos parciales, incluidos movimientos faciales, corporales parciales, de manos y de cuerpo completo. El marco utiliza los últimos conjuntos de datos multimodales y técnicas de aprendizaje profundo para proporcionar...
hace 9 meses
03.2K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue: un asistente de código de IA de código abierto que se integra con VS Code y personaliza modelos e incrustaciones.

Introducción general Continue es un asistente de código de IA de código abierto diseñado para mejorar la eficiencia de los desarrolladores de software. Sus principales características incluyen autocompletado de código, optimización de código y sugerencias inteligentes de código para VS Code y JetBrains IDEs.Continue hace...
hace 6 meses
04.5K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: un editor de código colaborativo multijugador de alto rendimiento desarrollado por Rust

Introducción general Zed es un editor de código colaborativo multiusuario de alto rendimiento desarrollado por los creadores de Atom y Tree-sitter.Escrito en el lenguaje Rust, Zed está diseñado para proporcionar una experiencia de codificación rápida y fluida. Entre sus principales características se incluye la compatibilidad con...
hace 8 meses
02.8K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: big model API ligera convertida en interfaz OpenAI, archivo YAML para configurar el canal API

Introducción completa No front-end , pura configuración de archivos de configuración del canal API . Sólo tienes que escribir un archivo puede ejecutar una estación de API de su propia , el documento tiene una guía de configuración detallada , blanco amigable. uni-api es una gestión unificada de gran proyecto API modelo , lo que permite una ...
hace 9 meses
03.2K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): control mágico de la iluminación de la imagen, controla la luz y la sombra de la imagen y el fondo

Introducción general IC-Light es un proyecto para el control de la iluminación de imágenes que pretende manipular los efectos lumínicos de las imágenes mediante modelos avanzados de IA. Desarrollado por Lvmin Zhang et al, el proyecto ofrece dos modelos principales: un modelo de reiluminación condicional al texto y un modelo condicional al fondo. Los usuarios pueden pasar...
hace 8 meses
03.4K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code: herramienta de AI para convertir capturas de pantalla en código front-end limpio.

Introducción general Screenshot-to-Code es una herramienta de código abierto que utiliza inteligencia artificial para convertir capturas de pantalla, borradores de diseño y diseños Figma en código limpio y funcional. La herramienta soporta múltiples tecnologías front-end, incluyendo HTML, Tailwind CS...
hace 10 meses
04.1K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: una interfaz gráfica web para interactuar con todos los modelos y API de OpenAI.

Introducción general Ortlin es una interfaz gráfica de usuario basada en web diseñada para ayudar a cualquier persona, usuarios técnicos y no técnicos por igual, a interactuar fácilmente con las API de OpenAI y los modelos subyacentes. Es completamente gratuita y de código abierto, lo que permite a los usuarios aprovechar las ventajas de OpenAI sin complicaciones...
hace 10 meses
03.3K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: inclusión automática de sitios web y compatibilidad con el sitio de navegación multilingüe de herramientas de IA de código abierto

Introducción general AigoTools es un código abierto AI navegación de sitios web diseñado para ayudar a los usuarios a crear y gestionar rápidamente los sitios de navegación. Se ha incorporado en la gestión del sitio y las características de auto-inclusión basada en AI , soporte para multi-idioma , cambio de tema oscuro / claro , y la optimización SEO.AigoTools propone...
hace 10 meses
02.9K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: plataforma de búsqueda de grandes modelos y AI localizada para datos personales (avance)

Introducción Quanta Quest es el primer producto del mundo con "end-side big model + C-side data localisation" como dirección de evolución central. Ayuda a los usuarios a almacenar todos los datos de Gmail, Notion, Dropbox, etc. localmente, y procesarlos a través de la base de datos vectorial para garantizar...
hace 10 meses
03K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: Permite que la IA controle directamente tu ordenador, una implementación de código abierto del ordenador de control de Claude.

Introducción general Agent.exe es una aplicación Electron de código abierto que utiliza la API Sonnet Claude 3.5 de Anthropic para permitir a los usuarios controlar su ordenador local directamente a través de la IA. El proyecto fue desarrollado por K...
hace 8 meses
03.2K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: motor de búsqueda de IA de código abierto para desplegar su propio motor de búsqueda Perplexity.

Introducción general MindSearch es un marco de motor de búsqueda de IA de código abierto lanzado por el Laboratorio de Inteligencia Artificial de Shanghai (SAL), cuyo objetivo es simular el proceso de pensamiento humano para la recopilación e integración de información compleja. La herramienta combina las tecnologías avanzadas de modelado de lenguaje a gran escala (LLM) y motores de búsqueda a través de la multiinteligencia....
hace 8 meses
02.9K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: Ali lanza un proyecto de código abierto de clonación de voz en 3 segundos con soporte para etiquetas controladas emocionalmente.

Introducción CosyVoice es un modelo multilingüe de generación de voz a gran escala que ofrece capacidades completas, desde la inferencia y el entrenamiento hasta el despliegue. Desarrollado por el equipo FunAudioLLM, su objetivo es lograr un habla de alta calidad mediante transformadores autorregresivos avanzados y modelos de difusión basados en ODE....
hace 6 meses
06.3K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: un marco de flujo de trabajo de código abierto de IA que integra muchas palabras clave para gestionar eficazmente una variedad de transacciones.

Introducción general Fabric es un marco de IA de código abierto desarrollado por Daniel Miessler para simplificar y automatizar las tareas informáticas cotidianas y facilitar el uso de la inteligencia artificial. Ayuda a los usuarios de forma eficiente a través de un diseño modular y de palabras clave predefinidas (Patrones)...
hace 10 meses
03.2K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: Creación de tablas inteligentes en múltiples bases de datos, alternativa de código abierto a Airtable

Introducción general NocoDB es una alternativa de código abierto a Airtable diseñada para proporcionar una herramienta de gestión de bases de datos en línea potente y fácil de usar. Con NocoDB, los usuarios pueden crear, leer, actualizar y eliminar fácilmente datos de bases de datos sin escribir código. La plataforma soporta ...
hace 10 meses
03.4K
Pyramid Flow:快手推出的开源版

Pyramid Flow: una versión de código abierto de "Kringle" lanzada por Racer, basada en SD3 y que funciona en GPU de menos de 8 GB (versión de despliegue con un solo clic).

Introducción exhaustiva Pyramid Flow es un eficaz método autorregresivo de generación de vídeo basado en la técnica Flow Matching. El método consigue una mayor eficiencia computacional en la generación y descompresión de contenidos de vídeo interpolando entre diferentes resoluciones y niveles de ruido....
hace 9 meses
02.9K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: Plataforma de desarrollo de aplicaciones de IA generativa, orquestación visual, soporte de despliegue privado

Introducción completa Dify es una plataforma de desarrollo de aplicaciones de IA generativa de código abierto diseñada para ayudar a los desarrolladores a construir y operar rápidamente aplicaciones nativas de IA basadas en Grandes Modelos de Lenguaje (LLMs). La plataforma proporciona todo, desde la construcción de agentes hasta la orquestación de flujos de trabajo de IA, la recuperación de RAG...
hace 7 meses
04.3K