Proyecto AI de código abierto

Total 1020 artículos
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: inteligencias interactivas automatizadas en redes sociales que buscan, dan a me gusta y dejan mensajes automáticamente.

Introducción general Riona-AI-Agent es una innovadora herramienta de automatización impulsada por IA diseñada específicamente para gestionar y optimizar las operaciones de las principales plataformas de medios sociales. El proyecto utiliza modelos avanzados de IA para plataformas como Instagram, Twitter y GitHub con el fin de proporcionar...
hace 9 meses
075.1K
Serena:语义检索和编辑代码的免费MCP工具

Serena: una herramienta MCP gratuita para la recuperación semántica y la edición de código

Introducción general Serena es una herramienta de programación gratuita y de código abierto desarrollada por el equipo Oraios AI y alojada en GitHub. Es un potente asistente de código que funciona directamente en su base de código para ayudar a los desarrolladores a analizar, editar y ejecutar código.Seren...
hace 6 meses
063.7K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: Ali lanza un proyecto de código abierto de clonación de voz en 3 segundos con soporte para etiquetas controladas emocionalmente.

Introducción CosyVoice es un modelo multilingüe de generación de voz a gran escala que ofrece capacidades completas, desde la inferencia y el entrenamiento hasta el despliegue. Desarrollado por el equipo FunAudioLLM, su objetivo es lograr un habla de alta calidad mediante transformadores autorregresivos avanzados y modelos de difusión basados en ODE....
hace 8 meses
062.3K
Archon:自主构建与优化AI智能体的开发框架

Archon: un marco de desarrollo para construir y optimizar de forma autónoma inteligencias artificiales

Archon es el primer proyecto "Agenteer" del mundo creado por el desarrollador Cole Medin (nombre de usuario en GitHub coleam00), un marco de código abierto centrado en la creación, optimización e iteración autónoma de Inteligencia Artificial. Inteligencia Artificial. Es...
hace 7 meses
058.7K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI Chatbot: Construye tu compañero de chat AI, diálogo de voz fácil e interacción inteligente.

Introducción Xiaozhi AI Chatbot es un proyecto de código abierto basado en la placa de desarrollo ESP32, diseñado para ayudar a los usuarios a construir su propio compañero de chat de IA. El proyecto fue desarrollado por Shrimp y se utiliza principalmente con fines didácticos para ayudar a más personas a iniciarse en el desarrollo de hardware de IA y entender cómo aplicar grandes modelos de lenguaje a...
hace 7 meses
054.3K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell): Clonación instantánea de voz en varios idiomas con menos muestras

Introducción general OpenVoice es un método versátil de clonación instantánea del habla que permite copiar la voz de un locutor de referencia y generar habla multilingüe utilizando sólo breves clips de audio del locutor. Además de copiar tonos, OpenVoice permite controlar con precisión el estilo de la voz,...
hace 12 meses
052.5K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: cliente de escritorio para asistentes de inteligencia artificial con modelos API/Web/locales integrados

Introducción general Cherry Studio es un cliente de escritorio que admite una amplia gama de servicios de Large Language Model (LLM) y es compatible con sistemas Windows, Mac y Linux. Ofrece numerosas opciones de personalización y funciones de vanguardia diseñadas para ayudar a los usuarios en una amplia gama de...
hace 8 meses
051.2K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: herramienta de código abierto para generar vídeo con sincronización labial directamente a partir de audio

Introducción general LatentSync es una herramienta de código abierto desarrollada por ByteDance y alojada en GitHub. Controla los movimientos labiales de los personajes de un vídeo directamente a través del audio, de modo que la forma de la boca coincide con la voz con precisión. El proyecto se basa en Stable Di...
hace 4 meses
050.2K
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本

IOPaint: Herramienta polivalente de tratamiento de imágenes AI, borrado, ampliación, sustitución de elementos y dibujo de texto.

Introducción general IOPaint es una herramienta de procesamiento de imágenes de IA gratuita y de código abierto que permite borrar, reparar y ampliar imágenes. Utiliza modelos de IA de última generación para ayudar a los usuarios a eliminar fácilmente objetos no deseados de las imágenes, reparar defectos, añadir nuevos contenidos e incluso expandir imágenes.IOPa...
hace 12 meses
050.1K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: programa de retoque y edición de fotos y vídeos potente y fácil de usar

Introducción general VisoMaster es una herramienta de edición e intercambio de caras de vídeo potente y fácil de usar que utiliza tecnología de inteligencia artificial para conseguir efectos de intercambio de caras naturales y realistas. Tanto si se trata de una imagen como de un vídeo, VisoMaster puede generar resultados de intercambio de caras de alta calidad con operaciones sencillas, aptas para...
hace 8 meses
049.7K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: análisis y etiquetado automático de documentos mediante IA para el sistema de gestión documental paperless-ngx

Introducción general Paperless-AI es una innovadora herramienta de análisis de automatización de documentos diseñada específicamente para el sistema de gestión documental Paperless-ngx. Combina inteligentemente la API OpenAI con una variedad de modelos avanzados de IA como Ollama...
hace 9 meses
047.6K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: Ejecución de clústeres de IA distribuidos utilizando dispositivos domésticos inactivos, con soporte para múltiples motores de inferencia y descubrimiento automatizado de dispositivos.

Introducción general Exo es un proyecto de código abierto diseñado para ejecutar su propio clúster de IA utilizando dispositivos cotidianos (por ejemplo, iPhone, iPad, Android, Mac, Linux, etc.). Mediante la partición dinámica de modelos y el descubrimiento automatizado de dispositivos, Exo es capaz de unificar múltiples dispositivos en un potente...
hace 11 meses
047.3K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: extracción de documentos PDF y conversión a formato Markdown multimodal, compatibilidad con escaneado OCR de libros electrónicos

Introducción exhaustiva MinerU es una herramienta de extracción de datos de código abierto desarrollada por el equipo OpenDataLab del Laboratorio de Inteligencia Artificial de Shanghai, centrada en la extracción eficiente de contenido de documentos PDF, páginas web y libros electrónicos complejos. Es capaz de tomar PDF multimodales que contengan imágenes, fórmulas, tablas y otros elementos...
hace 1 año
045.6K
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: herramienta gratuita de edición de síntesis de canciones de código abierto

Introducción general OpenUtau es una plataforma libre de código abierto de síntesis y edición de canciones diseñada para proporcionar a la comunidad UTAU una experiencia de edición moderna. Es el sucesor del software UTAU y resuelve los problemas de compatibilidad y complejidad del software original.OpenUtau soporta Wind...
hace 6 meses
044.7K
Surya:专业多语言文档OCR工具,开源本地部署

Surya: Herramienta profesional de OCR de documentos multilingües, de código abierto y despliegue nativo

Introducción completa Surya es un conjunto de herramientas de OCR de documentos multilingües de código abierto que admite el reconocimiento de texto en más de 90 idiomas. No sólo realiza la detección de texto línea por línea, sino también el análisis de diseño, la detección del orden de lectura y el reconocimiento de tablas.El rendimiento de Surya es comparable al de los servicios en la nube para todo tipo de...
hace 1 año
044.4K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作

FaceFusion: Video Face Swap Enhancement Tool | Voice Sync Video Mouth Moves

Descripción general FaceFusion es una plataforma en la nube de última generación con intercambio y mejora facial integrados, optimizada para el intercambio de imagen a vídeo e imagen a imagen, con 5 modelos profesionales para garantizar un resultado impecable. Además, realiza la mejora facial con 7 modelos utilizando 3...
hace 8 meses
043.7K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC: admite la conversión en tiempo real de voz y canciones con menos muestras.

Introducción general Seed-VC es un proyecto de código abierto en GitHub, desarrollado por Plachtaa. Puede utilizar una pieza de 1 a 30 segundos de audio de referencia , el habla rápida o la conversión de canciones , sin formación adicional . El proyecto soporta la conversión de voz en tiempo real , retraso ...
hace 7 meses
042.7K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: kit de herramientas de reconocimiento del habla de código abierto, separación de hablantes/reconocimiento del habla en diálogos multipersona

Introducción FunASR es un conjunto de herramientas de reconocimiento del habla de código abierto desarrollado por la Academia Alibaba Dharmo para unir la investigación académica y las aplicaciones industriales. Es compatible con una amplia gama de funciones de reconocimiento del habla, incluido el reconocimiento del habla (ASR), la detección del punto final de la voz (VAD), la recuperación de la puntuación, el modelado del lenguaje, el habla...
hace 12 meses
042.5K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: Visualiza la estructura de los repositorios de código de GitHub y transforma los repositorios de código en diagramas interactivos de arquitectura de sistemas.

Introducción general GitDiagram es una innovadora herramienta de visualización de la base de código de GitHub que transforma rápidamente cualquier repositorio de GitHub en un diagrama interactivo de la arquitectura del sistema. Utiliza tecnología avanzada de IA (Claude 3.5 Sonnet) para proporcionar a los desarrolladores...
hace 9 meses
041.1K
Wav2Lip:开源高精度口型同步生成工具(推荐)

Wav2Lip: herramienta de código abierto para generar sincronías labiales de alta precisión (recomendado)

Introducción general Wav2Lip es una herramienta de código abierto de generación de sincronización labial de alta precisión diseñada para sincronizar con precisión audio arbitrario con la sincronización labial en vídeo. La herramienta fue desarrollada por Rudrabha Mukhopadhyay et al. en ACM Multimedia 20...
hace 9 meses
040.9K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow: una herramienta de bajo código para crear potentes flujos de trabajo e inteligencia artificial

Introducción general Langflow es una herramienta de bajo código diseñada para que los desarrolladores construyan potentes agentes y flujos de trabajo de IA. Es compatible con el uso de cualquier API, modelo o base de datos, lo que simplifica el desarrollo de aplicaciones complejas AI.Langflow proporciona una interfaz visual intuitiva....
hace 10 meses
040.5K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: un asistente de IA para generar actas de reuniones, transcribir y generar resúmenes de reuniones en tiempo real.

Descripción general Meetily es un asistente de reuniones basado en IA desarrollado por Zackriya Solutions que captura el audio de las reuniones en tiempo real, realiza transcripciones de voz y genera resúmenes de las reuniones. Es único en el sentido de que todo el procesamiento se realiza localmente en el dispositivo, garantizando la privacidad del usuario...
hace 8 meses
039.9K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: un asistente de IA para la gestión del conocimiento empresarial y la búsqueda de documentos, que integra múltiples herramientas de trabajo

Introducción general Danswer es un asistente de IA para la recuperación de documentos empresariales de código abierto diseñado para conectarse con documentos, aplicaciones y personas del equipo para proporcionar respuestas unificadas de búsqueda y consultas en lenguaje natural a través de una interfaz de chat inteligente y capacidades de búsqueda unificadas. Garantiza que los datos de los usuarios y los chats...
hace 7 meses
039.9K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: modelos de vídeo de código abierto para generar vídeos de acción humana de alta calidad

Introducción general SkyReels-V1 es un proyecto de código abierto desarrollado por el equipo SkyworkAI centrado en la generación de contenidos de vídeo de alta calidad centrados en el ser humano. El proyecto se basa en el modelo HunyuanVideo , a través de decenas de millones de clips de cine y televisión de alta calidad de micro...
hace 8 meses
039.3K
Marker:快速将PDF转换为Markdown的开源工具

Marker: herramientas de código abierto para convertir rápidamente PDF a Markdown

Introducción general Marker es una herramienta de procesamiento de documentos basada en aprendizaje profundo diseñada para convertir archivos PDF a formato Markdown de forma rápida y precisa. Es compatible con una amplia gama de tipos de documentos y está especialmente optimizado para la conversión de libros y artículos científicos.Marker es capaz de eliminar los encabezados...
hace 7 meses
039.2K
SkyReels V2:生成无限长度视频的开源AI工具

SkyReels V2: una herramienta de IA de código abierto para generar vídeos de duración ilimitada

Introducción completa SkyReels-V2 es un modelo de generación de vídeo de código abierto desarrollado por SkyworkAI. Admite la generación de vídeos de longitud ilimitada mediante la tecnología avanzada Diffusion Forcing, y es apto para la conversión de texto a vídeo (T2V) y graf...
hace 6 meses
038.3K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: sistema digital interactivo en tiempo real de código abierto que permite el diálogo síncrono por audio y vídeo.

Introducción completa LiveTalking es un sistema humano digital interactivo en tiempo real de código abierto , se ha comprometido a la construcción de alta calidad humana digital solución en vivo . El proyecto utiliza el protocolo de código abierto Apache 2.0 , integrado con una serie de tecnologías de vanguardia , incluyendo ER-NeRF renderizado , audio en tiempo real y procesamiento de streaming de vídeo ...
hace 9 meses
037.8K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: herramienta para la sincronización labial de vídeo de alta calidad, optimizada para Wav2Lip

Introducción general Easy-Wav2Lip es una herramienta mejorada basada en Wav2Lip diseñada para simplificar el proceso de sincronización labial de vídeo. La herramienta ofrece una configuración e implementación más sencillas con soporte para Google Colab e instalación local. Mediante la optimización del algoritmo, Ea...
hace 10 meses
037.5K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: una plataforma de chat de código abierto para interactuar con personajes de IA personalizados

Introducción general Agnai Chat es una plataforma de chat de IA de código abierto que permite a los usuarios crear personajes de IA personalizados para la interacción individual o multijugador. Es compatible con una amplia gama de servicios de IA, incluyendo OpenAI, Claude, Kobold, etc., y es adecuado para el entretenimiento, juegos de rol, educación o...
hace 6 meses
037.3K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: agente asistente multiinteligente para el desarrollo de software basado en IA, que cubre todos los tipos de operaciones de los desarrolladores.

Introducción general OpenHands es un proyecto de código abierto desarrollado por el equipo All-Hands-AI para agilizar el proceso de desarrollo de software a través de la tecnología de IA. Anteriormente conocida como OpenDevin y ahora rebautizada como OpenHands, la plataforma proporciona potentes...
hace 9 meses
037.2K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: herramienta de código abierto para extraer y consultar los registros de chat de WeChat

Introducción General Chatlog es una herramienta de código abierto que se centra en la extracción y consulta de registros de chat de la base de datos local de WeChat. Es compatible con las versiones 3.x y 4.0 de WeChat, tanto para sistemas Windows como macOS. Los usuarios pueden utilizar la línea de comandos, la interfaz de terminal o H...
hace 6 meses
037.2K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: un reproductor de vídeo que genera subtítulos en tiempo real con traducción bilingüe

Introducción general LLPlayer es un reproductor multimedia de código abierto para estudiantes de idiomas, alojado en GitHub y creado por el desarrollador umlx5h. Integra una variedad de características útiles como la visualización de subtítulos bilingües, subtítulos autogenerados por IA, traducción en tiempo real y búsqueda de palabras....
hace 4 meses
037.2K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extraiga la compleja estructura del contenido PDF de la herramienta de código abierto

Introducción completa PDF-Extract-Kit es un proyecto de código abierto desarrollado por el equipo OpenDataLab , centrándose en la extracción eficiente de contenido de alta calidad a partir de documentos PDF complejos y diversos . Integra tecnología avanzada de análisis sintáctico de documentos para la detección de diseños, el reconocimiento de fórmulas ...
hace 8 meses
036.7K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: edición inteligente de contenidos de vídeo en cortometrajes, extracción/recorte preciso de clips de vídeo de forma sencilla

Introducción FunClip es una herramienta automatizada de edición de vídeo de código abierto desarrollada por TONGYI Speech Lab del Instituto Dharma de Alibaba. La herramienta integra el modelo de reconocimiento de voz industrial Paraformer-Large, que puede identificar con precisión el habla en el vídeo....
hace 9 meses
036.6K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: OpenAI lanza un asistente de programación de IA en línea de comandos de terminal

Introducción general OpenAI Codex CLI es una herramienta de codificación de terminal de código abierto, desarrollada por OpenAI, diseñada para desarrolladores acostumbrados a los terminales. Genera código, edita archivos, ejecuta comandos e integra el control de versiones Git a través de comandos en lenguaje natural.Cod...
hace 6 meses
036.6K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: generación automatizada de documentación AI para repositorios GitHub, GitLab

Introducción completa DeepWiki-Open es un proyecto de código abierto diseñado para generar automáticamente documentación estructurada para repositorios de código en GitHub, GitLab y Bitbucket. Utiliza tecnología de IA para analizar la estructura del código , el contenido de los archivos y las relaciones lógicas , la generación rápida...
hace 5 meses
036K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Buscador de tendencias: seguimiento de las tendencias en las redes sociales, los temas de moda y los nuevos artículos en tiempo real para la toma de decisiones de marketing.

Introducción general Trend Finder es una potente herramienta diseñada para ayudar a los usuarios a seguir en tiempo real las tendencias y los temas de moda en las redes sociales. Mediante la recopilación y el análisis de publicaciones de personas influyentes clave, Trend Finder es capaz de detectar nuevas tendencias o lanzamientos de productos a tiempo para enviar...
hace 9 meses
036K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: Plataforma de análisis de datos financieros de código abierto que integra conjuntos de datos privados e IA para mejorar la toma de decisiones de inversión.

Introducción general OpenBB es una plataforma de análisis de datos financieros gratuita y de código abierto diseñada para facilitar el acceso a datos financieros y herramientas de análisis para todos. La plataforma integra más de 100 fuentes de datos diferentes que cubren acciones, opciones, criptomonedas, divisas, indicadores macroeconómicos,...
hace 9 meses
036K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6G de memoria gráfica de bajo crecimiento rápido de vídeo largo proyecto de código abierto

Introducción general FramePack es una herramienta de generación de vídeo de código abierto centrada en hacer más prácticas las técnicas de difusión de vídeo. Desvincula la carga de trabajo de generación de la longitud del vídeo comprimiendo los fotogramas de entrada a una longitud fija mediante una red neuronal única de predicción del siguiente fotograma. Esto significa que, incluso cuando se generan vídeos largos, los requisitos de memoria de vídeo...
hace 5 meses
036K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: un marco profesional de preguntas y respuestas sobre bases de conocimiento para la recuperación híbrida de vectores y grafos de conocimiento

Introducción exhaustiva KAG (Knowledge Augmented Generation) es un marco de razonamiento y recuperación guiado por formas lógicas basado en el motor OpenSPG y en grandes modelos lingüísticos (LLM). El marco está diseñado específicamente para construir bases de conocimiento de dominio profesional...
hace 10 meses
035.8K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter: la alternativa sin censura de código abierto a Character.AI

Introducción general OpenCharacter es una herramienta de creación de personajes de código abierto diseñada para proporcionar a los usuarios una experiencia de creación e interacción de personajes de IA ilimitada y sin filtros como alternativa a Character.AI. Los usuarios pueden crear y ejecutar sus propios personajes utilizando modelos nativos, o...
hace 9 meses
035.7K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan (SiYuan Notes): software de gestión del conocimiento personal que da prioridad a la privacidad, con soporte de chat para la escritura y las preguntas y respuestas mediante inteligencia artificial.

General: SiYuan Notes (SiYuan) es un software de gestión del conocimiento personal que da prioridad a la privacidad, es de código abierto y admite autoalojamiento. Está escrito en TypeScript y Golang, proporciona referencias a nivel de bloque de grano fino y Markdown WYSIWYG (WYSIWY...
hace 8 meses
035.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicación de escritorio de Intelligentsia para controlar ordenadores mediante lenguaje natural

Introducción general UI-TARS Desktop es una aplicación de agente de interfaz gráfica basada en UI-TARS (Visual Language Model) desarrollada por ByteDance. La aplicación permite a los usuarios controlar los ordenadores a través del lenguaje natural para una interacción humano-ordenador más intuitiva y eficiente.UI-TAR...
hace 9 meses
035.6K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: herramienta de traducción automática que conserva toda la tipografía de los PDF

Introducción completa PDFMathTranslate es una herramienta de código abierto centrado en la traducción de artículos científicos , documentos PDF se pueden traducir en su totalidad y generar una versión bilingüe . Utiliza la tecnología AI para conservar el diseño completo del documento original , incluyendo fórmulas , diagramas , tablas de contenido y notas , soporte ...
hace 4 meses
035.4K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google lanza un protocolo abierto para la comunicación entre inteligencias artificiales

Introducción general A2A (Agent2Agent) es un protocolo de código abierto desarrollado por Google para permitir que las inteligencias artificiales desarrolladas por diferentes marcos o proveedores se comuniquen y colaboren entre sí. Proporciona un conjunto estandarizado de métodos para que las inteligencias descubran las capacidades de las demás, compartan tareas y completen el trabajo....
hace 6 meses
035.3K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序

Chatbot UI: una aplicación de chat con inteligencia artificial de código abierto que imita la interfaz y las funciones de ChatGPT.

Introducción general Chatbot UI es un proyecto de código abierto diseñado para ayudar a los desarrolladores a crear interfaces conversacionales personalizadas e inteligentes. El proyecto proporciona una serie de componentes de interfaz y funciones interactivas que pueden integrarse fácilmente en el sistema Chatbot existente para ofrecer a los usuarios un cuerpo de diálogo más fluido e inteligente....
hace 1 año
035.2K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: Extracción de texto de imágenes mediante modelos visuales en Ollama

Introducción general Ollama OCR es un potente kit de herramientas de reconocimiento óptico de caracteres (OCR) que utiliza el modelo de lenguaje visual de última generación proporcionado por la plataforma Ollama para extraer texto de imágenes. El proyecto está disponible como paquete Python y proporciona una interfaz Strea...
hace 9 meses
035K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12: una herramienta de código abierto para la detección de objetivos de imagen y vídeo en tiempo real

Introducción completa YOLOv12 es un proyecto de código abierto desarrollado por el usuario de GitHub sunsmarterjie , centrándose en la tecnología de detección de objetivos en tiempo real . El proyecto se basa en YOLO (You Only Look Once) serie de marcos , la introducción de nota ...
hace 8 meses
035K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: cliente de diálogo con inteligencia artificial que admite sesiones simultáneas con múltiples chats.

Introducción general DeepChat es un proyecto de asistente inteligente de código abierto desarrollado por el equipo ThinkInAIXYZ en GitHub. Su objetivo es conectar a los usuarios con el mundo digital a través de una potente tecnología de IA para proporcionar una experiencia de chat eficiente y natural. Es compatible con Win...
hace 7 meses
034.8K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: evaluación de la memoria RAG Precisión de la GC y correlación de respuestas

Introducción exhaustiva Ragas es una herramienta diseñada específicamente para evaluar y optimizar sistemas de Generación Aumentada de Recuperación (RAG). Proporciona un amplio conjunto de métricas de evaluación mediante el análisis de las relaciones entre consultas, contextos de recuperación y respuestas generadas. Estas métricas incluyen fidelidad, relevancia de la respuesta, relevancia del contexto, on...
hace 9 meses
034.6K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展

Plate: editor de texto enriquecido basado en inteligencia artificial y compatible con extensiones de plug-in enriquecidas.

Descripción general Plate es un editor de texto enriquecido impulsado por IA construido sobre React y TypeScript, diseñado para proporcionar una experiencia de edición altamente personalizable y extensible. Utiliza Slate.js en su núcleo, combinado con una moderna interfaz de usuario ...
hace 10 meses
034.5K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣

Open-LLM-VTuber: un compañero virtual de IA animada en Live2D para la interacción por voz en tiempo real.

Introducción general Open-LLM-VTuber es un proyecto de código abierto que permite a los usuarios interactuar con Large Language Models (LLMs) a través del habla y el texto, e incorpora la tecnología Live2D para presentar personajes virtuales dinámicos. Es compatible con Windows, macOS y Linux, y puede...
hace 7 meses
034K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: Genere y publique automáticamente vídeos cortos de YouTube y contenido de Twitter

Introducción General MoneyPrinter V2 es un proyecto de código abierto desarrollado por FujiwaraChoki para ayudar a los usuarios a ganar dinero en línea a través de la automatización. El proyecto integra principalmente la automatización de Twitter, la generación de vídeos cortos de YouTube y el camping de afiliados....
hace 9 meses
033.7K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: proyecto de código abierto de diálogo por IA que imita la interacción de la interfaz ChatGPT

Introducción general LibreChat es una plataforma de chat de IA gratuita y de código abierto con amplias opciones de personalización y soporte para múltiples proveedores, servicios e integraciones de IA. Reúne todas las conversaciones de IA en un solo lugar con una interfaz familiar y características innovadoras, soportando múltiples modelos de IA, plugins y múltiples idiomas. Por...
hace 1 año
033.7K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: una herramienta de generación de vídeo de código abierto para optimizar la coherencia de los rostros

Introducción general Open-Sora es un proyecto de código abierto diseñado para permitir a cualquiera generar vídeos de alta calidad de forma eficiente. Está desarrollado por el equipo hpcaitech para proporcionar herramientas para generar vídeo a partir de texto o imágenes, soportando múltiples resoluciones y duraciones. El proyecto es completamente de código abierto, con pesos de modelo público...
hace 6 meses
033.4K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Marco completo de generación de vídeo humano digital | Retrato a vídeo | Pose a vídeo | Sincronización de labios

Introducción general MuseV es un proyecto público en GitHub cuyo objetivo es la generación de vídeo avatar de longitud ilimitada y alta fidelidad. Se basa en la tecnología de difusión y proporciona Image2Video, Text2Image2Video, Video2Video...
hace 10 meses
033K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: modelos lingüísticos multimodales de código abierto para la interacción visual y verbal en tiempo real

Introducción general VITA es un proyecto líder de modelado de grandes lenguajes multimodales interactivos de código abierto, pionero en la capacidad de lograr una verdadera interacción multimodal completa. El proyecto lanzó VITA-1.0 en agosto de 2024, siendo pionero en el primer gran modelo de lenguaje interactivo completamente modal de código abierto.2024...
hace 9 meses
032.9K
VeighNa:国内流行的开源量化交易框架

VeighNa: un marco de comercio cuantitativo de código abierto muy popular en China

Introducción exhaustiva VeighNa es una plataforma de negociación cuantitativa de código abierto basada en Python, desarrollada originalmente por operadores privados nacionales y lanzada oficialmente en 2015. Ha evolucionado desde un simple paquete de interfaz de negociación hasta un marco de desarrollo de negociación totalmente funcional. Los usuarios incluyen fondos de capital privado, certificados...
hace 7 meses
032.7K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: un modelo de código abierto para el reconocimiento multilingüe de voz de alta precisión

Introducción general FireRedASR es un modelo de reconocimiento del habla desarrollado y de código abierto por el equipo de Little Red Book FireRed, centrado en proporcionar soluciones de reconocimiento automático del habla (ASR) de alta precisión y compatibles con varios idiomas. El proyecto está alojado en GitHub para desarrolladores e investigadores, y ofrece...
hace 7 meses
032.5K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: software de eliminación de marcas de agua de vídeo sin pérdidas y subtítulos difíciles con tecnología AI (cliente de eliminación de marcas de agua de vídeo 7G+)

Introducción completa Video Subtitle Remover (Video-subtitle-remover, o VSR para abreviar) es un software de procesamiento de vídeo basado en la tecnología de IA, que está especialmente diseñado para eliminar subtítulos duros y marcas de agua de texto de los vídeos. La herramienta utiliza una variedad de modelos de algoritmos de IA (STTN, L...
hace 9 meses
032.1K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: una aplicación de chat en grupo con múltiples personajes de inteligencia artificial que interactúan en tiempo real.

Introducción general Botgroup.chat es una aplicación de chat de grupo de IA de código abierto desarrollada sobre la base de React y Cloudflare Pages, con el objetivo de proporcionar a los usuarios una experiencia interactiva similar al chat de grupo de WeChat. Soporta la participación simultánea de múltiples personajes de IA....
hace 8 meses
031.9K
留痕(WeChatMsg):微信聊天记录导出与分析工具

Leave a trace (WeChatMsg): herramientas de análisis y exportación de registros de chat de WeChat

Introducción general WeChatMsg es un proyecto de código abierto ubicado en la plataforma GitHub. La herramienta tiene como objetivo proporcionar a los usuarios de WeChat una manera de extraer y exportar los chats de WeChat en una variedad de documentos (HTML, Word, CSV), y apoyar la generación de chat de visualización de datos informe anual ...
hace 1 año
031.9K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de preguntas y respuestas con base de conocimientos de inteligencia artificial para un servicio de atención al cliente inteligente y una base de conocimientos interna.

Introducción general MaxKB (Max Knowledge Base) es un sistema de preguntas y respuestas de base de conocimientos de código abierto basado en grandes modelos lingüísticos y RAG (Retrieval Augmented Generation). El sistema es ampliamente utilizado en el servicio al cliente inteligente, base de conocimiento interno de la empresa, la investigación académica y la educación y otros escenarios.MaxKB...
hace 9 meses
031.8K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: un motor RAG de código abierto basado en la comprensión profunda de los documentos, que proporciona flujos de trabajo de generación eficientes y mejorados por la recuperación.

Introducción exhaustiva RAGFlow es un motor de generación aumentada de recuperación (RAG) de código abierto basado en la tecnología de comprensión profunda de documentos. Proporciona un flujo de trabajo RAG eficiente para empresas de todos los tamaños, incorporando un modelo de lenguaje a gran escala (LLM) que puede proporcionar datos en formatos complejos basados en...
hace 9 meses
031.4K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: la API del modelo Gemini es compatible con el formato OpenAI, desbloquea las restricciones regionales y admite el sondeo de claves multiAPI.

Introducción completa Gemini Balance es un servicio proxy de API OpenAI desarrollado sobre la base del marco FastAPI, con el objetivo de proporcionar una gestión eficaz de claves multiAPI y funciones de optimización. El proyecto es compatible con las llamadas al modelo Gemini, y entre sus principales...
hace 6 meses
031.4K
Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Introducción completa Smolagents es una biblioteca ligera de agentes inteligentes desarrollada por HuggingFace que se centra en simplificar el proceso de desarrollo de sistemas de agentes de IA. El proyecto es conocido por su simplicidad en la filosofía de diseño, con sólo alrededor de 1000 líneas de código del núcleo, sin embargo, proporciona potentes capacidades de integración de características. Es más ...
hace 9 meses
031.4K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Analizador de vídeo: analiza el contenido de los vídeos y genera descripciones detalladas.

Comprehensive Introduction Video Analyzer es una completa herramienta de análisis de vídeo que combina técnicas de visión por ordenador, transcripción de audio y procesamiento del lenguaje natural para generar descripciones detalladas del contenido del vídeo. La herramienta transcribe el contenido de audio extrayendo fotogramas clave del vídeo....
hace 8 meses
031.3K
Onyx:连接企业知识库的智能AI聊天平台

Onyx: una plataforma de chat inteligente que conecta las bases de conocimiento de las empresas

Introducción general Onyx (antes conocido como Danswer) es una plataforma de chat de IA de código abierto desarrollada por el equipo onyx-dot-app para ayudar a las organizaciones a integrar y gestionar documentos, aplicaciones y datos de empleados. Proporciona una rica funcionalidad de chat con soporte para conectar cualquier Large Language Model (LLM...
hace 7 meses
031.3K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: un asistente de inteligencia artificial offline que se ejecuta en el teléfono, adaptado para DeepSeek-R1 (5,37 GB)

Introducción general Pocket AI (PocketPal AI versión china) es un potente asistente de IA offline diseñado para permitir a los usuarios hablar con la IA en cualquier momento y lugar. Se basa en Small Language Models (SLMs) y funciona en teléfonos móviles sin conexión a Internet, especialmente adaptado a la experiencia del usuario chino. Boca...
hace 8 meses
031.2K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboración multiagente para el asistente de explotación de dispositivos móviles

Introducción general MobileAgent es un potente asistente de operación de dispositivos móviles diseñado para mejorar la eficiencia y la automatización de la operación de dispositivos móviles a través de la colaboración multi-agente y módulos de percepción visual mejorada. Está desarrollado por el equipo de X-PLUG y es compatible con Android y ...
hace 9 meses
031.1K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: un marco de colaboración multiinteligencia para la creación de equipos de desarrollo de software de IA para la programación en lenguaje natural

Introducción exhaustiva MetaGPT es un innovador marco de trabajo para organismos multiinteligencia diseñado para simular el funcionamiento de una empresa de software de IA completa. Creado por geekan (Alexander Wu), el objetivo del proyecto es combinar modelos GPT con diferentes roles en una entidad colaborativa....
hace 7 meses
031K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: herramienta inteligente de doblaje/traducción multilingüe de vídeo por IA

Introducción Linly-Dubbing es una herramienta inteligente de traducción y doblaje multilingüe diseñada para proporcionar a los usuarios servicios de traducción de subtítulos y doblaje de vídeo multilingüe de alta calidad mediante la integración de tecnología avanzada de IA. La herramienta es especialmente adecuada para la educación internacional, la localización de contenidos globales y otros escenarios, ayudando...
hace 9 meses
030.9K