Proyecto AI de código abierto

Total 1020 artículos
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI Chatbot: Construye tu compañero de chat AI, diálogo de voz fácil e interacción inteligente.

Introducción Xiaozhi AI Chatbot es un proyecto de código abierto basado en la placa de desarrollo ESP32, diseñado para ayudar a los usuarios a construir su propio compañero de chat de IA. El proyecto fue desarrollado por Shrimp y se utiliza principalmente con fines didácticos para ayudar a más personas a iniciarse en el desarrollo de hardware de IA y entender cómo aplicar grandes modelos de lenguaje a...
hace 10 meses
0163.8K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣

Open-LLM-VTuber: un compañero virtual de IA animada en Live2D para la interacción por voz en tiempo real.

Introducción general Open-LLM-VTuber es un proyecto de código abierto que permite a los usuarios interactuar con Large Language Models (LLMs) a través del habla y el texto, e incorpora la tecnología Live2D para presentar personajes virtuales dinámicos. Es compatible con Windows, macOS y Linux, y puede...
hace 10 meses
0138.5K
Serena:语义检索和编辑代码的免费MCP工具

Serena: una herramienta MCP gratuita para la recuperación semántica y la edición de código

Introducción general Serena es una herramienta de programación gratuita y de código abierto desarrollada por el equipo Oraios AI y alojada en GitHub. Es un potente asistente de código que funciona directamente en su base de código para ayudar a los desarrolladores a analizar, editar y ejecutar código.Seren...
hace 9 meses
0135.6K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: cliente de escritorio para asistentes de inteligencia artificial con modelos API/Web/locales integrados

Introducción general Cherry Studio es un cliente de escritorio que admite una amplia gama de servicios de Large Language Model (LLM) y es compatible con sistemas Windows, Mac y Linux. Ofrece numerosas opciones de personalización y funciones de vanguardia diseñadas para ayudar a los usuarios en una amplia gama de...
hace 11 meses
0133.3K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: inteligencias interactivas automatizadas en redes sociales que buscan, dan a me gusta y dejan mensajes automáticamente.

Introducción general Riona-AI-Agent es una innovadora herramienta de automatización impulsada por IA diseñada específicamente para gestionar y optimizar las operaciones de las principales plataformas de medios sociales. El proyecto utiliza modelos avanzados de IA para plataformas como Instagram, Twitter y GitHub con el fin de proporcionar...
hace 12 meses
0133.1K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: Ali lanza un proyecto de código abierto de clonación de voz en 3 segundos con soporte para etiquetas controladas emocionalmente.

Introducción CosyVoice es un modelo multilingüe de generación de voz a gran escala que ofrece capacidades completas, desde la inferencia y el entrenamiento hasta el despliegue. Desarrollado por el equipo FunAudioLLM, su objetivo es lograr un habla de alta calidad mediante transformadores autorregresivos avanzados y modelos de difusión basados en ODE....
hace 11 meses
0128.4K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: programa de retoque y edición de fotos y vídeos potente y fácil de usar

Introducción general VisoMaster es una herramienta de edición e intercambio de caras de vídeo potente y fácil de usar que utiliza tecnología de inteligencia artificial para conseguir efectos de intercambio de caras naturales y realistas. Tanto si se trata de una imagen como de un vídeo, VisoMaster puede generar resultados de intercambio de caras de alta calidad con operaciones sencillas, aptas para...
hace 11 meses
0122.9K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell): Clonación instantánea de voz en varios idiomas con menos muestras

Introducción general OpenVoice es un método versátil de clonación instantánea del habla que permite copiar la voz de un locutor de referencia y generar habla multilingüe utilizando sólo breves clips de audio del locutor. Además de copiar tonos, OpenVoice permite controlar con precisión el estilo de la voz,...
hace 1 año
0121.9K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: un reproductor de vídeo que genera subtítulos en tiempo real con traducción bilingüe

Introducción general LLPlayer es un reproductor multimedia de código abierto para estudiantes de idiomas, alojado en GitHub y creado por el desarrollador umlx5h. Integra una variedad de características útiles como la visualización de subtítulos bilingües, subtítulos autogenerados por IA, traducción en tiempo real y búsqueda de palabras....
hace 7 meses
0114.4K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: kit de herramientas de reconocimiento del habla de código abierto, separación de hablantes/reconocimiento del habla en diálogos multipersona

Introducción FunASR es un conjunto de herramientas de reconocimiento del habla de código abierto desarrollado por la Academia Alibaba Dharmo para unir la investigación académica y las aplicaciones industriales. Es compatible con una amplia gama de funciones de reconocimiento del habla, incluido el reconocimiento del habla (ASR), la detección del punto final de la voz (VAD), la recuperación de la puntuación, el modelado del lenguaje, el habla...
hace 1 año
0111K
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: herramienta gratuita de edición de síntesis de canciones de código abierto

Introducción general OpenUtau es una plataforma libre de código abierto de síntesis y edición de canciones diseñada para proporcionar a la comunidad UTAU una experiencia de edición moderna. Es el sucesor del software UTAU y resuelve los problemas de compatibilidad y complejidad del software original.OpenUtau soporta Wind...
hace 9 meses
0108.7K
SkyReels V2:生成无限长度视频的开源AI工具

SkyReels V2: una herramienta de IA de código abierto para generar vídeos de duración ilimitada

Introducción completa SkyReels-V2 es un modelo de generación de vídeo de código abierto desarrollado por SkyworkAI. Admite la generación de vídeos de longitud ilimitada mediante la tecnología avanzada Diffusion Forcing, y es apto para la conversión de texto a vídeo (T2V) y graf...
hace 9 meses
0106.9K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: herramienta de código abierto para generar vídeo con sincronización labial directamente a partir de audio

Introducción general LatentSync es una herramienta de código abierto desarrollada por ByteDance y alojada en GitHub. Controla los movimientos labiales de los personajes de un vídeo directamente a través del audio, de modo que la forma de la boca coincide con la voz con precisión. El proyecto se basa en Stable Di...
hace 7 meses
0105.8K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit de Ostris: Difusión estable con FLUX.1 Kit de herramientas de formación de modelos

Introducción general AI Toolkit de Ostris es un conjunto de herramientas de IA de código abierto centrado en el soporte de los modelos Stable Diffusion y FLUX.1 para tareas de entrenamiento y generación de imágenes. El conjunto de herramientas es creado y mantenido por el desarrollador Ostris, tor...
hace 10 meses
0105.4K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作

FaceFusion: Video Face Swap Enhancement Tool | Voice Sync Video Mouth Moves

Descripción general FaceFusion es una plataforma en la nube de última generación con intercambio y mejora facial integrados, optimizada para el intercambio de imagen a vídeo e imagen a imagen, con 5 modelos profesionales para garantizar un resultado impecable. Además, realiza la mejora facial con 7 modelos utilizando 3...
hace 11 meses
0103.9K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: Ejecución de clústeres de IA distribuidos utilizando dispositivos domésticos inactivos, con soporte para múltiples motores de inferencia y descubrimiento automatizado de dispositivos.

Introducción general Exo es un proyecto de código abierto diseñado para ejecutar su propio clúster de IA utilizando dispositivos cotidianos (por ejemplo, iPhone, iPad, Android, Mac, Linux, etc.). Mediante la partición dinámica de modelos y el descubrimiento automatizado de dispositivos, Exo es capaz de unificar múltiples dispositivos en un potente...
hace 1 año
0102.5K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC: admite la conversión en tiempo real de voz y canciones con menos muestras.

Introducción general Seed-VC es un proyecto de código abierto en GitHub, desarrollado por Plachtaa. Puede utilizar una pieza de 1 a 30 segundos de audio de referencia , el habla rápida o la conversión de canciones , sin formación adicional . El proyecto soporta la conversión de voz en tiempo real , retraso ...
hace 10 meses
0102.1K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: extracción de documentos PDF y conversión a formato Markdown multimodal, compatibilidad con escaneado OCR de libros electrónicos

Introducción exhaustiva MinerU es una herramienta de extracción de datos de código abierto desarrollada por el equipo OpenDataLab del Laboratorio de Inteligencia Artificial de Shanghai, centrada en la extracción eficiente de contenido de documentos PDF, páginas web y libros electrónicos complejos. Es capaz de tomar PDF multimodales que contengan imágenes, fórmulas, tablas y otros elementos...
hace 1 año
0101K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: una herramienta de generación de vídeo de código abierto para optimizar la coherencia de los rostros

Introducción general Open-Sora es un proyecto de código abierto diseñado para permitir a cualquiera generar vídeos de alta calidad de forma eficiente. Está desarrollado por el equipo hpcaitech para proporcionar herramientas para generar vídeo a partir de texto o imágenes, soportando múltiples resoluciones y duraciones. El proyecto es completamente de código abierto, con pesos de modelo público...
hace 9 meses
099.6K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: herramienta de traducción automática que conserva toda la tipografía de los PDF

Introducción completa PDFMathTranslate es una herramienta de código abierto centrado en la traducción de artículos científicos , documentos PDF se pueden traducir en su totalidad y generar una versión bilingüe . Utiliza la tecnología AI para conservar el diseño completo del documento original , incluyendo fórmulas , diagramas , tablas de contenido y notas , soporte ...
hace 7 meses
099.5K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: análisis y etiquetado automático de documentos mediante IA para el sistema de gestión documental paperless-ngx

Introducción general Paperless-AI es una innovadora herramienta de análisis de automatización de documentos diseñada específicamente para el sistema de gestión documental Paperless-ngx. Combina inteligentemente la API OpenAI con una variedad de modelos avanzados de IA como Ollama...
hace 1 año
098.8K
Archon:自主构建与优化AI智能体的开发框架

Archon: un marco de desarrollo para construir y optimizar de forma autónoma inteligencias artificiales

Archon es el primer proyecto "Agenteer" del mundo creado por el desarrollador Cole Medin (nombre de usuario en GitHub coleam00), un marco de código abierto centrado en la creación, optimización e iteración autónoma de Inteligencia Artificial. Inteligencia Artificial. Es...
hace 10 meses
098K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: Visualiza la estructura de los repositorios de código de GitHub y transforma los repositorios de código en diagramas interactivos de arquitectura de sistemas.

Introducción general GitDiagram es una innovadora herramienta de visualización de la base de código de GitHub que transforma rápidamente cualquier repositorio de GitHub en un diagrama interactivo de la arquitectura del sistema. Utiliza tecnología avanzada de IA (Claude 3.5 Sonnet) para proporcionar a los desarrolladores...
hace 1 año
094.6K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: herramienta de código abierto para extraer y consultar los registros de chat de WeChat

Introducción General Chatlog es una herramienta de código abierto que se centra en la extracción y consulta de registros de chat de la base de datos local de WeChat. Es compatible con las versiones 3.x y 4.0 de WeChat, tanto para sistemas Windows como macOS. Los usuarios pueden utilizar la línea de comandos, la interfaz de terminal o H...
hace 9 meses
094.4K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: un asistente de IA para generar actas de reuniones, transcribir y generar resúmenes de reuniones en tiempo real.

Descripción general Meetily es un asistente de reuniones basado en IA desarrollado por Zackriya Solutions que captura el audio de las reuniones en tiempo real, realiza transcripciones de voz y genera resúmenes de las reuniones. Es único en el sentido de que todo el procesamiento se realiza localmente en el dispositivo, garantizando la privacidad del usuario...
hace 11 meses
093.2K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: sistema digital interactivo en tiempo real de código abierto que permite el diálogo síncrono por audio y vídeo.

Introducción completa LiveTalking es un sistema humano digital interactivo en tiempo real de código abierto , se ha comprometido a la construcción de alta calidad humana digital solución en vivo . El proyecto utiliza el protocolo de código abierto Apache 2.0 , integrado con una serie de tecnologías de vanguardia , incluyendo ER-NeRF renderizado , audio en tiempo real y procesamiento de streaming de vídeo ...
hace 1 año
093K
VeighNa:国内流行的开源量化交易框架

VeighNa: un marco de comercio cuantitativo de código abierto muy popular en China

Introducción exhaustiva VeighNa es una plataforma de negociación cuantitativa de código abierto basada en Python, desarrollada originalmente por operadores privados nacionales y lanzada oficialmente en 2015. Ha evolucionado desde un simple paquete de interfaz de negociación hasta un marco de desarrollo de negociación totalmente funcional. Los usuarios incluyen fondos de capital privado, certificados...
hace 10 meses
092.6K
留痕(WeChatMsg):微信聊天记录导出与分析工具

Leave a trace (WeChatMsg): herramientas de análisis y exportación de registros de chat de WeChat

Introducción general WeChatMsg es un proyecto de código abierto ubicado en la plataforma GitHub. La herramienta tiene como objetivo proporcionar a los usuarios de WeChat una manera de extraer y exportar los chats de WeChat en una variedad de documentos (HTML, Word, CSV), y apoyar la generación de chat de visualización de datos informe anual ...
hace 1 año
091.6K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: generación automatizada de documentación AI para repositorios GitHub, GitLab

Introducción completa DeepWiki-Open es un proyecto de código abierto diseñado para generar automáticamente documentación estructurada para repositorios de código en GitHub, GitLab y Bitbucket. Utiliza tecnología de IA para analizar la estructura del código , el contenido de los archivos y las relaciones lógicas , la generación rápida...
hace 8 meses
091K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: una plataforma de chat de código abierto para interactuar con personajes de IA personalizados

Introducción general Agnai Chat es una plataforma de chat de IA de código abierto que permite a los usuarios crear personajes de IA personalizados para la interacción individual o multijugador. Es compatible con una amplia gama de servicios de IA, incluyendo OpenAI, Claude, Kobold, etc., y es adecuado para el entretenimiento, juegos de rol, educación o...
hace 9 meses
090.4K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: modelos de vídeo de código abierto para generar vídeos de acción humana de alta calidad

Introducción general SkyReels-V1 es un proyecto de código abierto desarrollado por el equipo SkyworkAI centrado en la generación de contenidos de vídeo de alta calidad centrados en el ser humano. El proyecto se basa en el modelo HunyuanVideo , a través de decenas de millones de clips de cine y televisión de alta calidad de micro...
hace 11 meses
088.6K
Wav2Lip:开源高精度口型同步生成工具(推荐)

Wav2Lip: herramienta de código abierto para generar sincronías labiales de alta precisión (recomendado)

Introducción general Wav2Lip es una herramienta de código abierto de generación de sincronización labial de alta precisión diseñada para sincronizar con precisión audio arbitrario con la sincronización labial en vídeo. La herramienta fue desarrollada por Rudrabha Mukhopadhyay et al. en ACM Multimedia 20...
hace 1 año
087.8K
Surya:专业多语言文档OCR工具,开源本地部署

Surya: Herramienta profesional de OCR de documentos multilingües, de código abierto y despliegue nativo

Introducción completa Surya es un conjunto de herramientas de OCR de documentos multilingües de código abierto que admite el reconocimiento de texto en más de 90 idiomas. No sólo realiza la detección de texto línea por línea, sino también el análisis de diseño, la detección del orden de lectura y el reconocimiento de tablas.El rendimiento de Surya es comparable al de los servicios en la nube para todo tipo de...
hace 1 año
086.9K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Analizador de vídeo: analiza el contenido de los vídeos y genera descripciones detalladas.

Comprehensive Introduction Video Analyzer es una completa herramienta de análisis de vídeo que combina técnicas de visión por ordenador, transcripción de audio y procesamiento del lenguaje natural para generar descripciones detalladas del contenido del vídeo. La herramienta transcribe el contenido de audio extrayendo fotogramas clave del vídeo....
hace 11 meses
086.4K
Marker:快速将PDF转换为Markdown的开源工具

Marker: herramientas de código abierto para convertir rápidamente PDF a Markdown

Introducción general Marker es una herramienta de procesamiento de documentos basada en aprendizaje profundo diseñada para convertir archivos PDF a formato Markdown de forma rápida y precisa. Es compatible con una amplia gama de tipos de documentos y está especialmente optimizado para la conversión de libros y artículos científicos.Marker es capaz de eliminar los encabezados...
hace 11 meses
084.9K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: agente asistente multiinteligente para el desarrollo de software basado en IA, que cubre todos los tipos de operaciones de los desarrolladores.

Introducción general OpenHands es un proyecto de código abierto desarrollado por el equipo All-Hands-AI para agilizar el proceso de desarrollo de software a través de la tecnología de IA. Anteriormente conocida como OpenDevin y ahora rebautizada como OpenHands, la plataforma proporciona potentes...
hace 1 año
083.2K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: software de eliminación de marcas de agua de vídeo sin pérdidas y subtítulos difíciles con tecnología AI (cliente de eliminación de marcas de agua de vídeo 7G+)

Introducción completa Video Subtitle Remover (Video-subtitle-remover, o VSR para abreviar) es un software de procesamiento de vídeo basado en la tecnología de IA, que está especialmente diseñado para eliminar subtítulos duros y marcas de agua de texto de los vídeos. La herramienta utiliza una variedad de modelos de algoritmos de IA (STTN, L...
hace 1 año
082.6K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow: una herramienta de bajo código para crear potentes flujos de trabajo e inteligencia artificial

Introducción general Langflow es una herramienta de bajo código diseñada para que los desarrolladores construyan potentes agentes y flujos de trabajo de IA. Es compatible con el uso de cualquier API, modelo o base de datos, lo que simplifica el desarrollo de aplicaciones complejas AI.Langflow proporciona una interfaz visual intuitiva....
hace 1 año
082.4K
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本

IOPaint: Herramienta polivalente de tratamiento de imágenes AI, borrado, ampliación, sustitución de elementos y dibujo de texto.

Introducción general IOPaint es una herramienta de procesamiento de imágenes de IA gratuita y de código abierto que permite borrar, reparar y ampliar imágenes. Utiliza modelos de IA de última generación para ayudar a los usuarios a eliminar fácilmente objetos no deseados de las imágenes, reparar defectos, añadir nuevos contenidos e incluso expandir imágenes.IOPa...
hace 1 año
081.2K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: herramienta para la sincronización labial de vídeo de alta calidad, optimizada para Wav2Lip

Introducción general Easy-Wav2Lip es una herramienta mejorada basada en Wav2Lip diseñada para simplificar el proceso de sincronización labial de vídeo. La herramienta ofrece una configuración e implementación más sencillas con soporte para Google Colab e instalación local. Mediante la optimización del algoritmo, Ea...
hace 1 año
081K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序

Chatbot UI: una aplicación de chat con inteligencia artificial de código abierto que imita la interfaz y las funciones de ChatGPT.

Introducción general Chatbot UI es un proyecto de código abierto diseñado para ayudar a los desarrolladores a crear interfaces conversacionales personalizadas e inteligentes. El proyecto proporciona una serie de componentes de interfaz y funciones interactivas que pueden integrarse fácilmente en el sistema Chatbot existente para ofrecer a los usuarios un cuerpo de diálogo más fluido e inteligente....
hace 1 año
080.2K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: un asistente de inteligencia artificial offline que se ejecuta en el teléfono, adaptado para DeepSeek-R1 (5,37 GB)

Introducción general Pocket AI (PocketPal AI versión china) es un potente asistente de IA offline diseñado para permitir a los usuarios hablar con la IA en cualquier momento y lugar. Se basa en Small Language Models (SLMs) y funciona en teléfonos móviles sin conexión a Internet, especialmente adaptado a la experiencia del usuario chino. Boca...
hace 11 meses
079.4K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: edición inteligente de contenidos de vídeo en cortometrajes, extracción/recorte preciso de clips de vídeo de forma sencilla

Introducción FunClip es una herramienta automatizada de edición de vídeo de código abierto desarrollada por TONGYI Speech Lab del Instituto Dharma de Alibaba. La herramienta integra el modelo de reconocimiento de voz industrial Paraformer-Large, que puede identificar con precisión el habla en el vídeo....
hace 1 año
079K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12: una herramienta de código abierto para la detección de objetivos de imagen y vídeo en tiempo real

Introducción completa YOLOv12 es un proyecto de código abierto desarrollado por el usuario de GitHub sunsmarterjie , centrándose en la tecnología de detección de objetivos en tiempo real . El proyecto se basa en YOLO (You Only Look Once) serie de marcos , la introducción de nota ...
hace 11 meses
078.9K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: Genere y publique automáticamente vídeos cortos de YouTube y contenido de Twitter

Introducción General MoneyPrinter V2 es un proyecto de código abierto desarrollado por FujiwaraChoki para ayudar a los usuarios a ganar dinero en línea a través de la automatización. El proyecto integra principalmente la automatización de Twitter, la generación de vídeos cortos de YouTube y el camping de afiliados....
hace 1 año
078.4K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6G de memoria gráfica de bajo crecimiento rápido de vídeo largo proyecto de código abierto

Introducción general FramePack es una herramienta de generación de vídeo de código abierto centrada en hacer más prácticas las técnicas de difusión de vídeo. Desvincula la carga de trabajo de generación de la longitud del vídeo comprimiendo los fotogramas de entrada a una longitud fija mediante una red neuronal única de predicción del siguiente fotograma. Esto significa que, incluso cuando se generan vídeos largos, los requisitos de memoria de vídeo...
hace 8 meses
078.3K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): un conjunto de herramientas de aprendizaje profundo para la generación de texto a voz con soporte multilingüe y capacidades de clonación de voz.

Introducción exhaustiva Coqui TTS es un kit de herramientas avanzado de generación de texto a voz (TTS) de código abierto basado en técnicas de aprendizaje profundo. Se ha puesto a prueba tanto en entornos de investigación como de producción, y ofrece un amplio conjunto de funciones y modelos que admiten la conversión de texto a voz en varios idiomas.Coqui TTS...
hace 11 meses
078.1K
WeWe RSS:生成微信公众号RSS订阅的开源工具

WeWe RSS: herramienta de código abierto para generar canales RSS públicos de WeChat

Introducción completa WeWe RSS es una herramienta gratuita de código abierto diseñada específicamente para los usuarios de números públicos de WeChat. Captura artículos de números públicos a través de la plataforma de lectura de WeChat y genera fuentes RSS para que los usuarios puedan ver el contenido en cualquier momento con un lector RSS. Esta herramienta resuelve el problema de las letras de los números públicos de WeChat...
hace 10 meses
077.5K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: herramienta de código abierto para la generación automática de grafos de conocimiento a partir de texto plano

Introducción general KGGen es una herramienta de código abierto desarrollada por el Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), alojada en GitHub, diseñada para generar automáticamente grafos de conocimiento a partir de texto arbitrario. Utiliza algoritmos avanzados de modelado del lenguaje y agrupación para...
hace 11 meses
077.4K
FlowGram.AI:快速创建节点式工作流的开源引擎

FlowGram.AI: un motor de código abierto para crear rápidamente flujos de trabajo nodales

Introducción completa Flowgram.ai es un motor de construcción de procesos de código abierto desarrollado por ByteDance. Se basa en la edición de nodos , para ayudar a los desarrolladores a crear rápidamente flujos de trabajo , el apoyo a la disposición fija y libre vinculación dos modos . El proyecto está escrito en TypeScript ...
hace 10 meses
077.1K
XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印

XHS-Downloader: herramienta gratuita de recopilación de datos de Xiaohongshu, descarga por lotes de notas de apoyo, extracción de vídeo, marca de agua de imágenes

Introducción General XHS-Downloader es una herramienta de código abierto diseñada para los usuarios de Xiaohongshu para apoyar la extracción y descarga de imágenes sin marca de agua y obras de vídeo en Xiaohongshu. La herramienta proporciona una variedad de características, incluyendo la obtención de cookies de los navegadores, soporte para operaciones de línea de comandos, descarga por lotes...
hace 1 año
076.6K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan (SiYuan Notes): software de gestión del conocimiento personal que da prioridad a la privacidad, con soporte de chat para la escritura y las preguntas y respuestas mediante inteligencia artificial.

General: SiYuan Notes (SiYuan) es un software de gestión del conocimiento personal que da prioridad a la privacidad, es de código abierto y admite autoalojamiento. Está escrito en TypeScript y Golang, proporciona referencias a nivel de bloque de grano fino y Markdown WYSIWYG (WYSIWY...
hace 11 meses
076.4K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: un modelo de código abierto para el reconocimiento multilingüe de voz de alta precisión

Introducción general FireRedASR es un modelo de reconocimiento del habla desarrollado y de código abierto por el equipo de Little Red Book FireRed, centrado en proporcionar soluciones de reconocimiento automático del habla (ASR) de alta precisión y compatibles con varios idiomas. El proyecto está alojado en GitHub para desarrolladores e investigadores, y ofrece...
hace 10 meses
075.6K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: un marco profesional de preguntas y respuestas sobre bases de conocimiento para la recuperación híbrida de vectores y grafos de conocimiento

Introducción exhaustiva KAG (Knowledge Augmented Generation) es un marco de razonamiento y recuperación guiado por formas lógicas basado en el motor OpenSPG y en grandes modelos lingüísticos (LLM). El marco está diseñado específicamente para construir bases de conocimiento de dominio profesional...
hace 1 año
075.5K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter: la alternativa sin censura de código abierto a Character.AI

Introducción general OpenCharacter es una herramienta de creación de personajes de código abierto diseñada para proporcionar a los usuarios una experiencia de creación e interacción de personajes de IA ilimitada y sin filtros como alternativa a Character.AI. Los usuarios pueden crear y ejecutar sus propios personajes utilizando modelos nativos, o...
hace 12 meses
075.4K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: Extracción de texto de imágenes mediante modelos visuales en Ollama

Introducción general Ollama OCR es un potente kit de herramientas de reconocimiento óptico de caracteres (OCR) que utiliza el modelo de lenguaje visual de última generación proporcionado por la plataforma Ollama para extraer texto de imágenes. El proyecto está disponible como paquete Python y proporciona una interfaz Strea...
hace 1 año
075.3K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...
hace 8 meses
074.2K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Buscador de tendencias: seguimiento de las tendencias en las redes sociales, los temas de moda y los nuevos artículos en tiempo real para la toma de decisiones de marketing.

Introducción general Trend Finder es una potente herramienta diseñada para ayudar a los usuarios a seguir en tiempo real las tendencias y los temas de moda en las redes sociales. Mediante la recopilación y el análisis de publicaciones de personas influyentes clave, Trend Finder es capaz de detectar nuevas tendencias o lanzamientos de productos a tiempo para enviar...
hace 12 meses
073.9K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extraiga la compleja estructura del contenido PDF de la herramienta de código abierto

Introducción completa PDF-Extract-Kit es un proyecto de código abierto desarrollado por el equipo OpenDataLab , centrándose en la extracción eficiente de contenido de alta calidad a partir de documentos PDF complejos y diversos . Integra tecnología avanzada de análisis sintáctico de documentos para la detección de diseños, el reconocimiento de fórmulas ...
hace 11 meses
073.9K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: una aplicación de chat en grupo con múltiples personajes de inteligencia artificial que interactúan en tiempo real.

Introducción general Botgroup.chat es una aplicación de chat de grupo de IA de código abierto desarrollada sobre la base de React y Cloudflare Pages, con el objetivo de proporcionar a los usuarios una experiencia interactiva similar al chat de grupo de WeChat. Soporta la participación simultánea de múltiples personajes de IA....
hace 11 meses
073.7K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: cliente de diálogo con inteligencia artificial que admite sesiones simultáneas con múltiples chats.

Introducción general DeepChat es un proyecto de asistente inteligente de código abierto desarrollado por el equipo ThinkInAIXYZ en GitHub. Su objetivo es conectar a los usuarios con el mundo digital a través de una potente tecnología de IA para proporcionar una experiencia de chat eficiente y natural. Es compatible con Win...
hace 11 meses
072.9K
Suna:集成浏览器操作与数据分析的智能代理

Suna: agentes inteligentes que integran operaciones de navegación y análisis de datos

Introducción general Suna es un agente de IA de propósito general de código abierto desarrollado por Kortix AI, alojado en GitHub, basado en la licencia Apache 2.0, que permite a los usuarios descargarlo, modificarlo y autoalojarlo gratuitamente. Utiliza el diálogo en lenguaje natural para ayudar a los usuarios con...
hace 9 meses
072.4K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: herramienta de pizarra virtual estilo dibujo a mano | Diagrama de flujo de generación de texto basado en IA | Tutoriales de Excalidraw

Excalidraw Descripción General Excalidraw es una herramienta de dibujo de pizarra virtual de código abierto que le permite dibujar fácilmente diagramas con un estilo dibujado a mano. Puede utilizar Excalidraw para crear hermosas ilustraciones de estilo dibujado a mano, diagramas...
hace 1 año
071.8K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Descarga rápidamente WeChat Video No. de vídeo, soporta múltiples formatos y plataformas

Introducción completa WeChat Video No. Downloader es un proyecto de código abierto diseñado para ayudar a los usuarios a descargar rápidamente el contenido de vídeo de los números de vídeo WeChat. La herramienta es compatible con una gran variedad de formatos de vídeo y plataformas, y los usuarios pueden utilizarla fácilmente en sistemas Windows y macOS. El proyecto está desarrollado por ltaoo y alojado en...
hace 1 año
071.1K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: un sistema avanzado de recuperación de IA (RAG) para el análisis sintáctico de contenidos multimodales y la combinación del grafo de conocimiento con la búsqueda híbrida

Introducción completa R2R (RAG to Riches) es un sistema avanzado de recuperación de IA que admite la funcionalidad de generación aumentada de recuperación (RAG) con características listas para la producción. Construido sobre una API RESTful en contenedores, el sistema proporciona análisis de contenido multimodal, funcionalidad de búsqueda híbrida...
hace 1 año
071K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本

Restablecer Cursor: Un script para restablecer el identificador de dispositivo para las versiones de Cursor 0.45.x y superiores.

Descripción General Cursor Reset es una herramienta de scripting PowerShell para resetear identificadores de dispositivos en el IDE de Cursor, soportando la versión 0.45.x de Cursor. La herramienta está diseñada para ayudar a los usuarios a restablecer los identificadores de dispositivo en el IDE de Cursor....
hace 11 meses
070.5K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: OpenAI lanza un asistente de programación de IA en línea de comandos de terminal

Introducción general OpenAI Codex CLI es una herramienta de codificación de terminal de código abierto, desarrollada por OpenAI, diseñada para desarrolladores acostumbrados a los terminales. Genera código, edita archivos, ejecuta comandos e integra el control de versiones Git a través de comandos en lenguaje natural.Cod...
hace 9 meses
070.1K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Una interfaz fácil de usar para ComfyUI para agilizar el flujo de trabajo

Introducción general ComfyUI-disty-Flow es un nodo personalizado que proporciona una interfaz de usuario amigable para ComfyUI. Está pensado para simplificar la ejecución de flujos de trabajo proporcionando una interfaz de usuario alternativa a la creación de flujos de trabajo.ComfyUI-disty...
hace 12 meses
070K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: Plataforma de análisis de datos financieros de código abierto que integra conjuntos de datos privados e IA para mejorar la toma de decisiones de inversión.

Introducción general OpenBB es una plataforma de análisis de datos financieros gratuita y de código abierto diseñada para facilitar el acceso a datos financieros y herramientas de análisis para todos. La plataforma integra más de 100 fuentes de datos diferentes que cubren acciones, opciones, criptomonedas, divisas, indicadores macroeconómicos,...
hace 12 meses
069.5K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: un asistente de IA para la gestión del conocimiento empresarial y la búsqueda de documentos, que integra múltiples herramientas de trabajo

Introducción general Danswer es un asistente de IA para la recuperación de documentos empresariales de código abierto diseñado para conectarse con documentos, aplicaciones y personas del equipo para proporcionar respuestas unificadas de búsqueda y consultas en lenguaje natural a través de una interfaz de chat inteligente y capacidades de búsqueda unificadas. Garantiza que los datos de los usuarios y los chats...
hace 10 meses
068.7K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: los documentos PDF se traducirán a herramientas bilingües de código abierto

Introducción general BabelDOC es una herramienta de código abierto diseñada para traducir documentos PDF a un formato bilingüe. Está desarrollado por el equipo funstory-ai , alojado en GitHub , sirviendo principalmente a la necesidad de tratar con usuarios de documentos en lenguas extranjeras , como investigadores...
hace 7 meses
068.6K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: Plataforma de desarrollo de aplicaciones de IA generativa, orquestación visual, soporte de despliegue privado

Introducción completa Dify es una plataforma de desarrollo de aplicaciones de IA generativa de código abierto diseñada para ayudar a los desarrolladores a construir y operar rápidamente aplicaciones nativas de IA basadas en Grandes Modelos de Lenguaje (LLMs). La plataforma proporciona todo, desde la construcción de agentes hasta la orquestación de flujos de trabajo de IA, la recuperación de RAG...
hace 12 meses
068.6K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: modelos lingüísticos multimodales de código abierto para la interacción visual y verbal en tiempo real

Introducción general VITA es un proyecto líder de modelado de grandes lenguajes multimodales interactivos de código abierto, pionero en la capacidad de lograr una verdadera interacción multimodal completa. El proyecto lanzó VITA-1.0 en agosto de 2024, siendo pionero en el primer gran modelo de lenguaje interactivo completamente modal de código abierto.2024...
hace 1 año
068.1K