Proyecto AI de código abierto

Total 1020 artículos
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: Genera copias de vídeo y vídeos cortos en HD en un clic introduciendo un tema de vídeo

Introducción completa MoneyPrinterTurbo es un proyecto de código abierto que utiliza la tecnología avanzada AI big model para lograr la función de generar vídeos cortos de alta definición con un solo clic. Los usuarios sólo tienen que proporcionar un tema de vídeo o palabras clave, el sistema generará automáticamente la copia de vídeo, clips de vídeo, subtítulos de vídeo y...
hace 9 meses
035.5K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: ajuste virtual de modelos de alta fidelidad y ajuste de la pose de los personajes, Meta modelo de generación de imágenes de personajes controlable de código abierto

Introducción exhaustiva Leffa es un marco unificado para generar imágenes de personajes controlables, que permite la manipulación precisa de la apariencia del personaje (por ejemplo, ajuste virtual) y la pose (por ejemplo, transferencia de pose). El marco reduce significativamente la distorsión de detalles finos dirigiendo la consulta de destino para centrarse en la clave de referencia correcta en la capa de atención, con...
hace 12 meses
035.5K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: Confiar en MCP para consultar y resumir los mensajes de WeChat en Claude

Introducción general MCP Server ChatSum es un proyecto de código abierto diseñado para ayudar a los usuarios a consultar y resumir los mensajes de chat. El proyecto está alojado en GitHub y proporciona un potente conjunto de herramientas que permite a los usuarios consultar los registros de chat basándose en parámetros específicos y generar los resúmenes correspondientes....
hace 9 meses
035.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: lienzo colaborativo de edición de código, versión de código abierto de OpenAI Canvas/Claude Artifacts

Introducción general LangChain presenta Open Canvas, una aplicación web de código abierto diseñada para mejorar la experiencia de edición y colaboración de documentos con funcionalidad de memoria de doble agente incorporada y smith integrado para observar todos los detalles de ejecución. La plataforma está impulsada por OpenA...
hace 9 meses
035.4K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: una herramienta de pruebas automatizadas con IA que utiliza el lenguaje natural para realizar pruebas de principio a fin

Introducción general Shortest es un marco de pruebas de extremo a extremo en lenguaje natural basado en IA desarrollado por el equipo Anti-Work. Se basa en Playwright y admite la integración con GitHub y la autenticación de dos factores (2FA)....
hace 10 meses
035.4K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Herramienta paramétrica de generación de aumentos de recuperación para mejorar el rendimiento de los sistemas de preguntas y respuestas.

Introducción exhaustiva PRAG (Parametric Retrieval-Augmented Generation) es una innovadora herramienta de generación aumentada por recuperación que pretende mejorar la generación de conocimiento externo incrustándolo directamente en el espacio de parámetros de un Large Language Model (LLM)....
hace 10 meses
035.4K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.

Introducción general TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle su ordenador a través de la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar...
hace 10 meses
035.4K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: una herramienta de código abierto para generar materiales de estudio de palabras de 4º curso utilizando DeepSeek.

Introducción completa "Vocabulary Book by DeepSeek" es un proyecto de código abierto desarrollado sobre la base del gran modelo de DeepSeek, con el objetivo de ayudar a los estudiantes de inglés a dominar el vocabulario del nivel 4 de inglés universitario (CET-4) de manera eficiente. El proyecto está alojado en GitHub...
hace 9 meses
035.4K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos: herramienta de código abierto para la creación de documentos de identidad inteligentes con IA

Introducción completa HivisionIDPhotos es una herramienta de producción de fotos de documentos AI ligera de código abierto, puede identificar de forma inteligente la escena de la foto del usuario y la clave, para generar una foto de documento estándar en línea con una variedad de especificaciones. La herramienta soporta colores de fondo y tamaños personalizados, y en el futuro también lanzará...
hace 1 año
035.3K
Novel:模仿Notion AI的开源写作编辑器

Novel: un editor de escritura de código abierto que imita a Notion AI

Introducción integral Este es un proyecto de código abierto desarrollado por Steven Tey llamado Novel, es un editor de texto WYSIWYG estilo Noción , integrado AI función de autocompletado que puede ayudar a los usuarios a mejorar la eficiencia de la entrada de texto . El proyecto proporciona documentación detallada e instrucciones de instalación ...
hace 1 año
035.3K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: una herramienta de código abierto para la extracción y exploración eficientes de datos estructurados

Introducción exhaustiva Knowledge Table (Tabla de conocimientos) es un proyecto de código abierto diseñado para simplificar el proceso de extracción y exploración de datos estructurados a partir de documentos no estructurados. Los usuarios pueden crear representaciones estructuradas del conocimiento, como tablas y gráficos, mediante una interfaz de consulta en lenguaje natural. La herramienta permite personalizar la extracción ...
hace 1 año
035.3K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: Captura automática de noticias para generar podcasts de audio

Introducción general AI Podcast Generator es una herramienta inteligente de generación de podcasts que utiliza tecnología avanzada de IA para crear automáticamente contenidos de audio atractivos a partir de fuentes web. El sistema genera narraciones de flujo natural capturando contenidos de noticias y convirtiéndolos en podcasts de audio. El proyecto se basa en la...
hace 1 año
035.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: generación de modelos de conversión de texto en voz específicos para cada hablante a partir de un texto de entrada

Introducción general Parler-TTS es una biblioteca de modelos de texto a voz (TTS) de código abierto desarrollada por Hugging Face, diseñada para generar habla de alta calidad y sonido natural. El modelo es capaz de generar habla a partir de un texto de entrada con un estilo de locutor específico (por ejemplo, género, tono, estilo de habla...
hace 10 meses
035.3K
Coding Agent:基于Langgraph构建的简单编程助手

Agente de codificación: un sencillo asistente de programación basado en Langgraph

Introducción general Coding Agent es un asistente de programación inteligente desarrollado por AbhinavTheDev, diseñado para ayudar a los desarrolladores a mejorar su eficiencia en la programación. La herramienta utiliza tecnología de inteligencia artificial para generar código de forma automática, proporcionar sugerencias de programación y ayudar a los desarrolladores...
hace 10 meses
035.3K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: un marco de código abierto para construir aplicaciones modulares de GAR y probar rápidamente diversas estrategias de GAR.

Introducción general Cognita es un marco de código abierto desarrollado por TrueFoundry para simplificar el desarrollo de aplicaciones basadas en RAG (Retrieval-Augmented Generation). El framework proporciona un entorno estructurado, mod...
hace 10 meses
035.3K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: una plataforma sin código y de código abierto que rastrea automáticamente datos web y los convierte en API u hojas de cálculo.

Introducción completa Maxun es una plataforma de extracción de datos web sin código de código abierto que permite a los usuarios entrenar robots en cuestión de minutos para rastrear automáticamente datos web y convertirlos en API u hojas de cálculo. La plataforma admite paginación y desplazamiento, se adapta a los cambios en el diseño del sitio web, proporciona un potente rastreo de datos...
hace 11 meses
035.2K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: motor de búsqueda de IA de código abierto para desplegar su propio motor de búsqueda Perplexity.

Introducción general MindSearch es un marco de motor de búsqueda de IA de código abierto lanzado por el Laboratorio de Inteligencia Artificial de Shanghai (SAL), cuyo objetivo es simular el proceso de pensamiento humano para la recopilación e integración de información compleja. La herramienta combina las tecnologías avanzadas de modelado de lenguaje a gran escala (LLM) y motores de búsqueda a través de la multiinteligencia....
hace 11 meses
035.2K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos

Introducción general LivePortrait es una herramienta avanzada de animación dinámica de retratos AI desarrollada por Racer Technology. Utiliza una innovadora tecnología de IA para transformar imágenes fijas en vívidas animaciones de vídeo. Tanto si utiliza fotos reales, estilos de animación o retratos artísticos, LivePo...
hace 1 año
035.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: clonación de voz rápida y formación de modelos, conversión de texto a voz basada en xtts v2

Introducción completa MockingBird es un proyecto de código abierto que pretende conseguir una rápida clonación de voz y conversión de texto a voz mediante tecnología de IA. Los usuarios sólo tienen que proporcionar 5 segundos de muestras de voz, puede generar cualquier contenido de voz. El proyecto admite una gran variedad de conjuntos de datos chinos ...
hace 12 meses
035.2K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: un marco de código abierto para optimizar los proyectos de avisos con el fin de mejorar el rendimiento de las tareas.

Introducción completa PromptWizard es un marco de código abierto desarrollado por Microsoft que utiliza un mecanismo autoevolutivo que permite al modelo generar, evaluar y mejorar las palabras clave y generar ejemplos por sí mismo, mejorando la calidad del resultado mediante una retroalimentación continua. Puede optimizar de forma autónoma las palabras clave, generar y seleccionar ejemplos adecuados y...
hace 11 meses
035.2K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: Cursor de código abierto para el diseño front-end, diseñar y publicar código en aplicaciones React.

Introducción general Onlook es una herramienta de diseño de código abierto construida para diseñadores y desarrolladores que permite a los usuarios diseñar directamente en una aplicación React en ejecución y convertir los cambios de diseño en código. La herramienta proporciona una experiencia de edición visual intuitiva similar a Figma o Webf...
hace 10 meses
035.2K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: una herramienta automatizada de coloreado de líneas para colorear rápidamente dibujos anime de líneas en blanco y negro.

Introducción exhaustiva MangaNinjia es un proyecto de código abierto desarrollado por Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), centrado en el procesamiento automatizado del coloreado de dibujos lineales. Esta herramienta consigue un ajuste preciso del color de las imágenes de referencia mediante técnicas de aprendizaje profundo, mejorando enormemente...
hace 10 meses
035.2K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: un modelo unificado de generación de imágenes con entradas multimodales para generar imágenes coherentes con los caracteres

Introducción general OmniGen es un modelo "universal" de generación de imágenes desarrollado por VectorSpaceLab que permite a los usuarios crear efectos visuales diversos y contextualmente ricos con simples indicaciones de texto o entradas multimodales. Es especialmente adecuado para aplicaciones que necesitan reconocer...
hace 1 año
035.2K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

Bilingual Book Maker: Utiliza la traducción automática para crear libros electrónicos bilingües.

Introducción general Bilingual Book Maker es un proyecto de código abierto diseñado para ayudar a los usuarios a crear versiones multilingües de libros electrónicos utilizando tecnología de IA. La herramienta utiliza principalmente ChatGPT para la traducción y soporta múltiples formatos de archivo, incluyendo epub, txt y srt....
hace 10 meses
035.1K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: herramienta inteligente diseñada para analizar datos tabulares complejos

Introducción completa TableGPT Agent es una herramienta inteligente basada en el proyecto de código abierto GitHub, diseñada para procesar y analizar datos tabulares. Se basa en el modelo Big Language TableGPT2, que utiliza la interacción con el lenguaje natural para permitir a los usuarios consultar, manipular...
hace 9 meses
035.1K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Interfaz web de generación de texto: interfaz de chat basada en modelos lingüísticos de gran tamaño de Gradio y compatible con varios servicios backend.

Introducción general La interfaz web de generación de texto es una interfaz web basada en Gradio diseñada para el Large Language Model (LLM). Soporta una variedad de backends de generación de texto, incluyendo Transformers, llama.cp...
hace 1 año
035.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...
hace 1 año
035.1K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: un modelo de lenguaje visual ligero de código abierto para la retropropagación por lotes de palabras clave de imágenes

Introducción exhaustiva Moondream es un modelo de lenguaje visual ligero de código abierto diseñado para habilitar capacidades de descripción de imágenes mediante técnicas de aprendizaje profundo y visión por ordenador. El modelo es capaz de funcionar de manera eficiente en una variedad de plataformas, y es particularmente adecuado para dispositivos edge.Moondream utiliza técnicas avanzadas y...
hace 11 meses
035.1K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: una solución de memoria a largo plazo basada en el perfil del usuario para aplicaciones de IA

Introducción general Memobase es un sistema de memoria basado en el perfil del usuario diseñado para soportar una memoria de usuario duradera para aplicaciones de IA generativa. Tanto si estás construyendo un compañero virtual, una herramienta educativa o un asistente personalizado, Memobase ayuda a tu IA a recordar, comprender y crecer con el uso de...
hace 9 meses
035K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: herramienta todo en uno para la restauración y edición de imágenes lanzada por Tencent ARC

Introducción general BrushEdit es una herramienta integral de reparación y edición de imágenes desarrollada por Tencent ARC Labs. La herramienta se basa en la última tecnología de IA y es capaz de identificar y reparar automáticamente los defectos en las imágenes, mientras que el apoyo a la edición interactiva por users.BrushEdit combina una variedad de...
hace 11 meses
035K
Shandu:多轮收集分析信息的AI研究自动化工具

Shandu: una herramienta de automatización de la investigación con IA para recopilar y analizar información en múltiples rondas

Introducción general Shandu es un sistema de investigación basado en inteligencia artificial de código abierto alojado en GitHub y creado por el desarrollador jolovicdev. Utiliza las tecnologías LangChain y LangGraph, y su objetivo es proporcionar...
hace 8 meses
035K
LLM API Engine:通过自然语言快速生成和部署API

LLM API Engine: generación y despliegue rápidos de API mediante lenguaje natural

Introducción general LLM API Engine es un proyecto de código abierto diseñado para ayudar a los desarrolladores a crear y desplegar rápidamente API impulsadas por IA.El proyecto aprovecha el Large Language Model (LLM) y las tecnologías de rastreo web inteligente para permitir a los usuarios crear API personalizadas a través de descripciones en lenguaje natural.Su principal...
hace 10 meses
035K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Genera vídeos explicativos de matemáticas animados de más de 5 minutos con Manim

Introducción general TheoremExplainAgent es un proyecto innovador desarrollado por TIGER AI Lab para transformar complejos teoremas matemáticos y científicos en animaciones de vídeo fáciles de entender utilizando técnicas de inteligencia artificial. La herramienta se basa en el Large Language Model (LLM...
hace 9 meses
035K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

tarjeta de luz: HTML5 herramienta generadora de tarjetas, crear hermosas tarjetas de contenido de herramientas simples

Descripción general lightcard es una herramienta de generación de tarjetas simple y elegante diseñada para ayudar a los usuarios a crear fácilmente hermosas tarjetas de contenido. La herramienta soporta contenido de texto personalizado, múltiples estilos de temas y códigos QR para hacer la creación más fácil y divertida. Los usuarios pueden editar el título, el cuerpo y el autor...
hace 11 meses
034.9K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: ajuste de modelos lingüísticos mediante grafos de conocimiento para generar datos sintéticos

Introducción general GraphGen es un marco de código abierto desarrollado por OpenScienceLab, un laboratorio de IA de Shanghái, alojado en GitHub, que se centra en optimizar el ajuste fino supervisado de grandes modelos lingüísticos (LLM) guiando la generación de datos sintéticos a través de grafos de conocimiento. Se desarrolló a partir de ...
hace 7 meses
034.9K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: ingenieros de IA full-stack de código abierto que construyen e iteran rápidamente proyectos TypeScript completos.

Introducción general Srcbook es una plataforma de desarrollo de aplicaciones centrada en TypeScript diseñada para crear e iterar rápidamente aplicaciones web con asistentes de IA. Es compatible con el tiempo de ejecución nativo, proporciona una interfaz de bloc de notas interactivo y permite a los usuarios escribir y ejecutar código back-end.Srcbook está abierto...
hace 1 año
034.9K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: un modelo de vídeo de Vincennes que admite la entrada multilingüe y la generación de vídeos largos

Introducción completa Step-Video-T2V es un modelo avanzado de conversión de texto a vídeo de StepFun AI (StepFun Star). El modelo tiene 3.000 millones de parámetros y es capaz de generar vídeos de hasta 204 fps. Con un Auto-Encoder Variable (VAE) profundamente comprimido, el modelo...
hace 9 meses
034.9K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: aplicación local de chat en tiempo real basada en Nuxt 3 y Ollama

Introducción general ChatOllama es un proyecto de aplicación de chat en línea de código abierto basado en un modelo lingüístico a gran escala (LLM), que admite numerosos modelos lingüísticos y la gestión de la base de conocimientos. Los usuarios pueden utilizar la plataforma para la gestión de modelos ( visualización de listas , descarga , eliminación ) , chatear con los modelos y otras funciones . El proyecto utiliza ...
hace 1 año
034.9K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Descripción general Charla es una aplicación de chat basada en endpoints diseñada para entablar diálogos con modelos lingüísticos nativos. La aplicación se integra con el backend Ollama, admite diálogos contextuales y guarda las sesiones de chat como archivos Markdown. Los usuarios pueden...
hace 10 meses
034.9K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: una plataforma inteligente de preguntas y respuestas basada en grafos de conocimiento

Yuxi-Know es una plataforma inteligente de preguntas y respuestas de código abierto que combina el grafo de conocimiento y la tecnología RAG (Retrieval Augmented Generation) para ayudar a los usuarios a obtener rápidamente respuestas precisas. Se basa en Neo4j para almacenar el grafo de conocimiento , utilizando FastAPI y VueJS estructura...
hace 8 meses
034.9K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: una plataforma de agregación de comercialización que integra múltiples productos de IA

Introducción completa AIBot PRO es un cliente de agregación de AI basado en .NET 6 diseñado para proporcionar a los usuarios una plataforma conveniente para integrar múltiples productos de AI. El cliente admite el diálogo de conmutación sin sentido e integra ChatGPT, Gemini, Claude, Wenxin Yiyin...
hace 9 meses
034.9K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: implementación rápida de la deduplicación semántica de textos para mejorar la eficacia de la limpieza de datos

Introducción completa SemHash es una herramienta ligera y flexible para desduplicar conjuntos de datos por similitud semántica. Combina la rápida generación de incrustaciones de Model2Vec con la eficaz búsqueda de similitud RNA (vecino más cercano aproximado) de Vicinity.SemHa...
hace 10 meses
034.9K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor: un asistente inteligente de sobremesa basado en Gemini que puede ver, oír y hablar.

Introducción general Gemini Cursor es un asistente inteligente de escritorio basado en el modelo Gemini 2.0 Flash (experimental) de Google. Permite interacciones visuales, auditivas y de voz a través de una API multimodal, proporcionando un uso en tiempo real de baja latencia....
hace 10 meses
034.9K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: un conjunto de herramientas para construir rápidamente interfaces de chat de IA con soporte para la integración de modelos y la gestión del flujo de datos.

Introducción Ant Design X es un conjunto de herramientas de código abierto de Ant Group, diseñado para ayudar a los desarrolladores a crear rápidamente interfaces de diálogo basadas en IA. Proporciona un amplio conjunto de componentes y plantillas, soporta la integración de modelos compatibles con los estándares OpenAI, y es adecuado para una variedad de aplicaciones tales como servicio al cliente inteligente, asistentes de IA, y otros...
hace 1 año
034.9K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: modelo de lenguaje visual inteligente de código abierto de Smart Spectrum para la automatización de interfaces gráficas

Introducción CogAgent es un modelo de lenguaje visual de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), cuyo objetivo es automatizar el funcionamiento de la interfaz gráfica de usuario (GUI) en todas las plataformas. El modelo se basa en CogVLM (GLM-4V-9B) y es compatible con el chino y el inglés bilingües....
hace 11 meses
034.8K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: descargador de vídeo por línea de comandos compatible con casi todas las plataformas de vídeo

Introducción general Lux es una biblioteca de descarga de vídeo rápida y sencilla y una herramienta de línea de comandos escrita en Go. Soporta la descarga de vídeos de múltiples sitios web, incluyendo YouTube, Bilibili, Youku, etc. Lux ofrece una variedad de opciones de descarga y características, tales como la descarga multi-hilo....
hace 10 meses
034.8K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: dobles de IA entrenados localmente con recuerdos y hábitos personales.

Second Me es un proyecto de código abierto desarrollado por el equipo Mindverse que te permite crear una IA en tu ordenador que actúa como un "doble digital", aprendiendo tus patrones y hábitos de habla a través de tus palabras y recuerdos, y convirtiéndose en una persona inteligente que entiende tus...
hace 8 meses
034.8K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: lectura de archivos de texto de repositorios git y fragmentación rápida de modelos de gran tamaño

Introducción general Yek es una herramienta rápida basada en Rust para leer archivos de texto de repositorios o directorios, trocearlos y serializarlos para su uso en grandes modelos lingüísticos (LLM). La herramienta utiliza la regla .gitignore por defecto para omitir archivos innecesarios, y utiliza...
hace 10 meses
034.8K
RLAMA:命令行操作的本地文档智能问答 RAG 系统

RLAMA: un sistema RAG de interrogación inteligente de documentos locales operado desde la línea de comandos

Introducción general RLAMA es un sistema RAG (Retrieval Augmentation Generation) de cuestionario de inteligencia documental desarrollado por DonTizi de código abierto y alojado en GitHub, cuya característica principal es la funcionalidad a través de operaciones de línea de comandos. Los usuarios pueden utilizar simples comandos de terminal para conectarse a ...
hace 9 meses
034.7K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Generador de muestras de texto a vídeo cero lanzado por el equipo de investigación de IA de Picsart

Introducción general Text2Video-Zero es una implementación oficial de un generador de texto a vídeo de muestra cero para GitHub desarrollado por el equipo Picsart AI Research.El proyecto proporciona una forma de utilizar pistas de texto para generar texto con consistencia temporal y...
hace 1 año
034.7K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: un cliente de código abierto para traducir en tiempo real el contenido del chat de un juego

Introducción general DeepRant es una herramienta de traducción de código abierto para jugadores, diseñada para resolver el problema de las barreras lingüísticas en los servidores internacionales. Permite la traducción instantánea del texto del juego mediante atajos de teclado, admite que varios idiomas se traduzcan entre sí y permite a los jugadores entender y responder rápidamente a los mensajes del chat sin salir del juego....
hace 9 meses
034.7K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: compatibilidad con herramientas de generación de imágenes personalizadas mono y multisujeto (adecuadas para gráficos de comercio electrónico).

UNO es un marco de generación de imágenes de código abierto desarrollado por el equipo de creación inteligente ByteDance. Se basa en el modelo FLUX.1 y se centra en la generación de imágenes personalizadas de un único sujeto y de varios sujetos mediante un enfoque de generalización de "menos a más".UNO utiliza el transformador de difusión...
hace 7 meses
034.6K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Descripción general Quadratic es una herramienta de hoja de cálculo inteligente de código abierto que combina características de IA, código y conectividad de datos diseñadas para proporcionar a los usuarios potentes capacidades de procesamiento y análisis de datos. Al soportar lenguajes de programación como Python, SQL y Rust, Quadratic...
hace 9 meses
034.6K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: Herramienta de línea de comandos para utilizar los servicios de MCP en cualquier modelo grande, no depende de Claude.

Introducción general La CLI del proveedor de contexto de modelo (mcp-cli) es una herramienta de línea de comandos a nivel de protocolo para interactuar con un servidor de proveedor de contexto de modelo. La herramienta permite a los usuarios enviar comandos, consultar datos e interactuar con diversos recursos proporcionados por el servidor...
hace 9 meses
034.6K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: retratos sonoros para generar vídeos parlantes (instalador acelerado de EchoMimicV2)

Introducción general EchoMimic es un proyecto de código abierto diseñado para generar animaciones de retratos realistas controladas por audio. Desarrollado por la división Terminal Technologies de Ant Group, el proyecto utiliza condiciones de puntos marcadores editables para generar vídeos de retratos dinámicos utilizando una combinación de audio y puntos marcadores faciales.EchoMimic...
hace 11 meses
034.6K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: convertir ebooks epub en audiolibros m4b

Introducción general Autiobooks es una herramienta de código abierto diseñada para ayudar a los usuarios a convertir rápidamente libros electrónicos en formato .epub a audiolibros en formato .m4b. Utiliza tecnología de síntesis de voz de alta calidad proporcionada por Kokoro para generar un audio natural y fluido. Esta herramienta fue desarrollada por...
hace 9 meses
034.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: una herramienta de IA para ofrecer tutorías personalizadas, un proyecto de tutor personal de IA de código abierto basado en Llama 3.1

Introducción general Llama Tutor es un proyecto de tutor personal de IA de código abierto basado en Llama 3.1, diseñado para proporcionar a los usuarios una experiencia de aprendizaje personalizada. Mediante la integración de múltiples pilas tecnológicas como Together AI, Next.js y T...
hace 1 año
034.5K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: generación y traducción automática de subtítulos multilingües para vídeos con ayuda de la IA.

Introducción general AI no jimaku gumi (AI no subtitle group) es una potente herramienta de procesamiento de subtítulos de vídeo de línea de comandos centrada en permitir funciones automatizadas de extracción, transcripción y traducción de subtítulos de vídeo. La herramienta integra tecnologías avanzadas de inteligencia artificial, como...
hace 11 meses
034.5K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Herramienta de supervisión de la degradación del servicio ChatGPT: Detección de degradaciones del servicio ChatGPT

Introducción completa La herramienta de monitorización de la degradación del servicio ChatGPT es un proyecto de código abierto diseñado para ayudar a los usuarios a detectar si su servicio ChatGPT se ha degradado debido a IPs de alto riesgo. La herramienta analiza los valores de dificultad de Proof of Work (PoW) para determinar si los usuarios...
hace 11 meses
034.5K
MemFree:本地知识库与搜索信息混合的AI搜索引擎

MemFree: un motor de búsqueda de inteligencia artificial para mezclar bases de conocimiento local e información de búsqueda

Introducción general MemFree es un avanzado motor de búsqueda híbrido de IA capaz de buscar y hacer preguntas a través de texto, imágenes, documentos y páginas web. Proporciona acceso con un solo clic a los resultados de búsqueda de texto, mapas mentales, imágenes y vídeos.MemFree pretende extraer información de la base de conocimientos del usuario y...
hace 1 año
034.5K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragmentos: versiones de código abierto de aplicaciones como Claude Artifacts de Anthropic, Vercel v0 o GPT Engineer.

Introducción general Fragments by E2B es un proyecto de código abierto que proporciona una plantilla basada en Next.js para construir aplicaciones generadas íntegramente por IA. Desarrollado por E2B, el proyecto pretende simplificar y acelerar el proceso de desarrollo de aplicaciones de IA. Integra una variedad de ...
hace 1 año
034.5K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: un sistema avanzado de recuperación de IA (RAG) para el análisis sintáctico de contenidos multimodales y la combinación del grafo de conocimiento con la búsqueda híbrida

Introducción completa R2R (RAG to Riches) es un sistema avanzado de recuperación de IA que admite la funcionalidad de generación aumentada de recuperación (RAG) con características listas para la producción. Construido sobre una API RESTful en contenedores, el sistema proporciona análisis de contenido multimodal, funcionalidad de búsqueda híbrida...
hace 11 meses
034.5K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: Mejorando la Experiencia de Desarrollo de Cursor IDE, Haciendo de Cursor/Windsurf un Asistente de Programación Inteligente similar a Devin.

Introducción General Devin.cursorrules es un innovador proyecto de código abierto diseñado para convertir el asequible Cursor o Windsurf IDE (~$20) en un potente asistente de programación AI como Devin. El proyecto proporciona un conjunto de ...
hace 11 meses
034.5K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: un modelo de comprensión de vídeo de código abierto para generar descripciones de vídeo de alta calidad

Introducción general Tarsier es una familia de modelos de videolenguaje de código abierto desarrollada por ByteDance para generar descripciones de vídeo de alta calidad. Consta de una estructura sencilla: el CLIP-ViT procesa los fotogramas de vídeo, combinado con un Large Language Model (LLM) para analizar...
hace 8 meses
034.4K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: manejo automatizado de smartphones mediante inteligencias multimodales

Introducción AppAgent es un marco de agente multimodal basado en un modelo de lenguaje amplio (LLM) diseñado para manipular aplicaciones de teléfonos inteligentes. El marco imita interacciones humanas como toques y deslizamientos a través de un espacio de manipulación simplificado, eliminando así la necesidad de acceso al back-end del sistema y extendiendo su uso a través de diferentes aplicaciones....
hace 11 meses
034.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Asistente de programación Vim nativo basado en LLM, programación inteligente segura sin conexión

Introducción General VimLM es un plugin de Vim que proporciona un asistente de código impulsado por el LLM nativo (Large Language Model). Interactuando con el modelo LLM nativo a través de los comandos de Vim, obtiene automáticamente el contexto del código y ayuda a los usuarios a editar código en Vim.VimLM está inspirado en...
hace 9 meses
034.4K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Introducción general Devika es un ingeniero de software de IA avanzada que entiende instrucciones humanas de alto nivel, las descompone en pasos, estudia la información relevante y escribe código para lograr un objetivo determinado. Desarrolla software de forma inteligente utilizando modelos lingüísticos a gran escala, algoritmos de planificación y razonamiento y capacidades de navegación web.D...
hace 9 meses
034.4K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: generación de activos digitales modelados en 3D de alta resolución a partir de una sola imagen

Introducción general TripoSG es un proyecto de código abierto desarrollado por el equipo de investigación VAST AI para generar modelos 3D de alta calidad a partir de una sola imagen. El proyecto utiliza tecnología de convertidor rectificador-flujo a gran escala, combinada con entrenamiento híbrido supervisado y conjuntos de datos de alta calidad, para permitir que los modelos 3D generados tengan...
hace 8 meses
034.3K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: herramienta interactiva de edición de imágenes, control de la posición de las imágenes mediante apuntar y hacer clic y arrastrar y soltar.

Introducción general DragGAN es una herramienta interactiva de edición de imágenes basada en Redes Generativas Adversariales (GAN). Fue lanzada por Xingang Pan et al. en SIGGRAPH 2023 y tiene como objetivo permitir a los usuarios manipular intuitivamente a través de simples operaciones de apuntar y hacer clic y arrastrar y soltar....
hace 12 meses
034.3K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: revolucionaria tecnología de generación de imágenes de altísima resolución con gran riqueza de detalles

Introducción general UltraPixel es una tecnología avanzada de generación de imágenes de ultra alta resolución diseñada para crear imágenes de altísima calidad y ricas en detalles. Fue desarrollada por el usuario de GitHub catcathh y presentada en NeurIPS 2024.U...
hace 1 año
034.3K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: plataforma inteligente de carrozado para la automatización de flujos de trabajo y la ejecución autónoma de tareas

Descripción general AutoGPT es una potente plataforma diseñada para ayudar a los usuarios a crear, desplegar y gestionar agentes de IA en ejecución continua y automatizar flujos de trabajo complejos. Desarrollada por Significant Gravitas, la plataforma ofrece una amplia gama de herramientas y funciones que permiten a los usuarios centrarse...
hace 12 meses
034.3K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: aplicación portátil de diario vocal con inteligencia artificial y conversión de voz a texto.

Introducción general ALog es una aplicación de diario de voz basada en IA diseñada para ayudar a los usuarios a registrar su vida diaria por voz. Está desarrollada por duxins y de código abierto en GitHub. Los usuarios pueden grabar entradas de diario a través de la entrada de voz, y la aplicación convertirá automáticamente la voz en texto ...
hace 10 meses
034.3K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: proyecto de código abierto para la búsqueda por inferencia profunda mediante conocimiento local

Introducción exhaustiva Deep Searcher es una potente herramienta que combina grandes modelos lingüísticos (LLM) y bases de datos vectoriales diseñada para buscar, evaluar y razonar a partir de datos privados, proporcionando respuestas muy precisas e informes exhaustivos. Es adecuado para la gestión del conocimiento empresarial...
hace 10 meses
034.3K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: un marco RAG para la comprensión de vídeos ultralargos con soporte para la recuperación multimodal y la construcción de grafos de conocimiento

Introducción VideoRAG es un marco generativo de recuperación mejorado diseñado para procesar y comprender vídeos contextuales muy largos. La herramienta combina una base de conocimiento textual basada en grafos con la codificación jerárquica multimodal del contexto para procesar eficientemente en una sola GPU NVIDIA RTX 3090....
hace 10 meses
034.3K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreado de dibujos animados, sombreado automático de imágenes en blanco y negro para mejorar la coherencia y la calidad del color de las imágenes.

Introducción ColorFlow es una herramienta de autocoloreado de secuencias de imágenes desarrollada por el equipo ARC de Tencent para resolver el problema del autocoloreado de secuencias de imágenes en blanco y negro. La herramienta utiliza un proceso de sombreado mejorado para generar con precisión los colores de varios elementos a través de un conjunto de imágenes de referencia, incluidos los colores del pelo de los personajes y los servicios....
hace 11 meses
034.2K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: Creación de un editor de texto enriquecido basado en inteligencia artificial compatible con varios marcos de trabajo frontales.

Introducción completa AIEditor es un editor de texto enriquecido de próxima generación impulsado por IA, basado en el desarrollo de componentes web, soporte para Vue, React, Angular y otros casi todos los principales marcos front-end. Es compatible con PC Web y ...
hace 11 meses
034.2K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: una plataforma de IA para generar activos digitales modelados en 3D de alta resolución

Introducción general Neural4D es una innovadora plataforma basada en IA que se centra en ayudar a los usuarios a generar rápidamente modelos y animaciones 3D de alta calidad con la simple introducción de texto o imágenes. Desarrollada por DreamTech, se basa en la tecnología líder mundial de generación de modelos 3D de gran tamaño de extremo a extremo....
hace 9 meses
034.2K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: un servicio MCP para rastrear y organizar rápidamente la documentación técnica

Introducción general DevDocs es una herramienta de código abierto completamente gratuita desarrollada por el equipo CyberAGI y alojada en GitHub. Diseñada para programadores y desarrolladores de software, parte de la URL de un documento técnico, rastrea automáticamente las páginas relevantes y las organiza en un conciso ma...
hace 8 meses
034.2K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: reconocimiento de lenguas asiáticas y modelización de voz a texto para lenguas asiáticas

Introducción general Dolphin es un modelo de código abierto desarrollado por DataoceanAI y la Universidad de Tsinghua, centrado en el reconocimiento del habla y del lenguaje para las lenguas asiáticas. Es compatible con 40 lenguas de Asia Oriental, Asia Meridional, Asia Sudoriental y Oriente Medio, así como con 22 dialectos chinos...
hace 8 meses
034.2K