Proyecto AI de código abierto

Total 1020 artículos
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: proyecto de código abierto de reparación de imágenes dañadas y zoom de alta definición, mínimo 16G de memoria de vídeo

Descripción general InstantIR es un innovador modelo de restauración de una sola imagen desarrollado por el equipo de InstantX, diseñado para resucitar sus imágenes dañadas con detalles de gran calidad y realismo, capaz de realizar una restauración de alta calidad de imágenes dañadas. La herramienta no sólo restaura los detalles de la imagen...
hace 1 año
076.2K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: Las imágenes de retratos con audio generan vídeos de demostración digitales con expresiones faciales vivas

Introducción general Sonic es una innovadora plataforma centrada en la percepción global del audio y diseñada para generar vívidas animaciones de retratos controladas por audio. Desarrollada por un equipo de investigadores de Tencent y la Universidad de Zhejiang, la plataforma utiliza información de audio para controlar las expresiones faciales y los movimientos de la cabeza con el fin de generar vídeos animados naturales y fluidos.S...
hace 1 año
076.1K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Asistente de corrección de la pronunciación en inglés

Introducción general Gemini Teacher es un asistente para practicar la pronunciación en inglés basado en la IA Gemini de Google. Reconoce la pronunciación inglesa del usuario en tiempo real y proporciona sugerencias de corrección y comentarios instantáneos. La herramienta está diseñada para ayudar a los usuarios a...
hace 1 año
076K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: uso ilimitado de AI IDEs mediante herramientas de automatización (por ejemplo, Cursor y Windsurf)

Descripción general AI Auto Free es una potente herramienta de automatización diseñada para ayudar a los usuarios a hacer un uso ilimitado de los Entornos de Desarrollo Integrado (IDE) basados en IA, como Cursor y Windsurf. El proyecto ofrece soporte multiplataforma e incluye múltiples funciones de lenguaje...
hace 1 año
076K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly: una plataforma de redacción basada en IA que orquesta procesos sobre un lienzo libre para la generación automatizada de artículos.

Introducción completa Refly es un motor de creación nativo de IA basado en canvas gratuito diseñado para ayudar a los usuarios a convertir ideas en contenido de alta calidad a través del diálogo multihilo, la integración de la base de conocimientos, la memoria contextual y la tecnología de búsqueda inteligente. La plataforma cubre más de 20 plantillas de escenarios profesionales, incluyendo...
hace 1 año
075.9K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: generación de imágenes en tiempo real escribiendo palabras clave (acceso gratuito al modelo Flux Schnell)

Descripción general BlinkShot es un generador de imágenes de IA en tiempo real de código abierto que utiliza la tecnología Together AI y Flux Schnell para permitir a los usuarios generar imágenes de alta calidad a medida que introducen indicaciones. La plataforma es completamente gratuita y admite la personalización del usuario y...
hace 2 años
075.9K
FlowDown(浮望):iOS/macOS下体验流畅的AI客户端

FlowDown: una experiencia de cliente de IA fluida para iOS/macOS

Introducción general FlowDown-App es un cliente de diálogo AI ligero y eficiente, desarrollado por un equipo de desarrolladores utilizando Swift y UIKit, con el objetivo de proporcionar a los usuarios una experiencia de diálogo inteligente rápida y sin problemas. La aplicación se divide en una versión estándar (FlowDown...
hace 1 año
075.4K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: proxy/reversión del canal Midjourney Discord para llamadas a la API de mapeo de IA (prueba gratuita).

Introducción completa Midjourney Proxy es un proyecto de código abierto diseñado para proporcionar servicios de proxy para el canal Discord de Midjourney, convirtiendo las funciones de dibujo AI en forma de API. El proyecto es completamente gratuito y de código abierto , soporte para el intercambio de caras con un solo clic , mezcla de imágenes , nacimiento de gráficos ...
hace 1 año
075.2K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: el asistente inteligente de código abierto de LangChain para la investigación profunda

Introducción exhaustiva Open Deep Research es un asistente de investigación basado en web capaz de generar informes de investigación exhaustivos sobre cualquier tema. El sistema utiliza un flujo de trabajo de "planificar y hacer" que permite a los usuarios planificar y revisar la estructura del informe antes de pasar a la fase de investigación, que lleva mucho tiempo...
hace 1 año
075.2K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Proyecto de superresolución de imágenes de código abierto para mejorar la calidad de la resolución de imágenes.

Introducción general InvSR es un innovador proyecto de código abierto de superresolución de imágenes basado en técnicas de inversión de la difusión capaces de convertir imágenes de baja resolución en imágenes de alta calidad y alta resolución. El proyecto explota el rico conocimiento previo de la imagen incrustado en modelos de difusión a gran escala preentrenados y, mediante un mecanismo de muestreo flexible, admite...
hace 1 año
075.1K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: una plataforma inteligente de preguntas y respuestas basada en grafos de conocimiento

Yuxi-Know es una plataforma inteligente de preguntas y respuestas de código abierto que combina el grafo de conocimiento y la tecnología RAG (Retrieval Augmented Generation) para ayudar a los usuarios a obtener rápidamente respuestas precisas. Se basa en Neo4j para almacenar el grafo de conocimiento , utilizando FastAPI y VueJS estructura...
hace 1 año
075.1K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: una herramienta de código abierto para la detección de vídeo en tiempo real y la segmentación de objetos

YOLOE es un proyecto de código abierto desarrollado por el Grupo de Inteligencia Multimedia (THU-MIG) de la Escuela de Software de la Universidad de Tsinghua, cuyo nombre completo es "You Only Look Once Eye". Está basado en el framework PyTorch , pertenece a la serie de extensiones YOLO ...
hace 1 año
075K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): generación de activos 3D de alta resolución, múltiples flujos de trabajo de generación de materiales 3D

Introducción Tencent Hunyuan3D (Hunyuan3D 2.0) es un avanzado sistema de composición 3D a gran escala de Tencent diseñado para generar activos 3D texturizados de alta resolución. El sistema consta de dos componentes principales: Hunyuan3D-DiT, un modelo de generación de formas a gran escala, y Hunyuan3D-DiT, un...
hace 1 año
074.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...
hace 1 año
074.9K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: herramienta de traducción de vídeo multifuncional de código abierto, transcripción y traducción de voz a varios idiomas, instalación de Windows con un solo clic.

Introducción general Voice-Pro es una herramienta versátil basada en Gradio WebUI que admite voz a texto, texto a voz, traducción en tiempo real, descarga de vídeos de YouTube y separación de voz humana. Integra Whisper, Faster-Wh...
hace 1 año
074.8K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: la clásica herramienta de código abierto para colorear fotos y vídeos en blanco y negro mediante técnicas de IA

Introducción exhaustiva DeOldify es un proyecto de código abierto basado en tecnología de aprendizaje profundo dedicado a la coloración y restauración inteligente de fotos y vídeos en blanco y negro. El proyecto utiliza un innovador método de entrenamiento NoGAN para resolver con éxito los defectos comunes de las redes GAN tradicionales en el proceso de coloreado de imágenes....
hace 1 año
074.8K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot: un organismo inteligente para mejorar la eficacia del análisis de datos financieros y la investigación de inversiones

Introducción exhaustiva FinRobot es una plataforma de inteligencia de IA de código abierto desarrollada por AI4Finance Foundation y diseñada para el análisis financiero. No solo abarca los modelos lingüísticos tradicionales, sino que también incorpora diversas tecnologías de IA, con el objetivo de ofrecer una solución integral para el sector financiero.F...
hace 1 año
074.8K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): proyecto de código abierto que imita a Perplexity, integrando diálogo AI, búsqueda web, consulta meteorológica, etc.

Introducción general MiniPerplx (rebautizado Scira) es un motor de búsqueda minimalista basado en IA que integra una variedad de características útiles para proporcionar a los usuarios una gama completa de servicios de recuperación de información. El proyecto utiliza una moderna pila tecnológica que incluye Next.js, Tailwi...
hace 1 año
074.7K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces: automatización de flujos de trabajo con IA, herramienta de programación de tareas para usuarios no técnicos, sustituto de Zapier de código abierto.

Introducción general Activepieces es una plataforma de flujo de trabajo de automatización todo en uno de código abierto centrada en proporcionar soluciones de automatización intuitivas y potentes para empresas y usuarios individuales. Desarrollada en TypeScript, la plataforma es extremadamente escalable y soporta más de 200 servicios integrados...
hace 1 año
074.6K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: personas digitales inteligentes e interactivas en tiempo real con soporte de despliegue multiplataforma con un solo clic

Introducción general DUIX (Dialogue User Interface System) es una plataforma digital de interacción humana potenciada por IA creada por Silicon Intelligence. Con capacidades de interacción humana digital de código abierto, los desarrolladores pueden integrar fácilmente modelos a gran escala, reconocimiento automático del habla (ASR...
hace 1 año
074.5K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: herramienta de narración y edición automatizada generada por texto para cine y televisión

Introducción general NarratoAI es una herramienta totalmente automatizada que integra narración de películas y vídeos, edición automatizada, doblaje y generación de subtítulos. Se basa en la tecnología de modelado lingüístico a gran escala (LLM) para generar automáticamente copias y editar automáticamente vídeos con sus correspondientes locuciones y subtítulos, proporcionando a los usuarios un...
hace 2 años
074.4K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: herramienta de código abierto para detectar vulnerabilidades LLM y asegurar la IA generativa

Introducción completa NVIDIA Garak es una herramienta de código abierto diseñada específicamente para detectar vulnerabilidades en Large Language Models (LLMs). Comprueba el modelo en busca de múltiples debilidades como ilusiones, fugas de datos, inyección de pistas, generación de mensajes de error, generación de contenido dañino, etc. mediante sondeos estáticos, dinámicos y adaptativos....
hace 1 año
074.2K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: una aplicación web comercial que integra servicios de IA multimodal (código abierto gratuito)

Introducción general 99AI es un proyecto de aplicación web de IA de código abierto cuyo objetivo es proporcionar una plataforma de servicios de IA integrada de bajo umbral y fácil de desplegar. El proyecto admite diálogos inteligentes, modelos multimodales, plazas de aplicaciones, búsquedas en red e integra pintura, música y vídeo de IA....
hace 1 año
074.2K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: implementación rápida de la deduplicación semántica de textos para mejorar la eficacia de la limpieza de datos

Introducción completa SemHash es una herramienta ligera y flexible para desduplicar conjuntos de datos por similitud semántica. Combina la rápida generación de incrustaciones de Model2Vec con la eficaz búsqueda de similitud RNA (vecino más cercano aproximado) de Vicinity.SemHa...
hace 1 año
074.2K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicación web de chat con inteligencia artificial de código abierto con carga de documentos y compatibilidad multimodelo

Introducción general Zola es una aplicación de chat de IA gratuita y de código abierto desarrollada por el desarrollador Julien Thibeaut (nombre de usuario de GitHub ibelick) y alojada en GitHub. Su mejor característica es que soporta múltiples modos de IA...
hace 1 año
074.2K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon: una herramienta multimodal de código abierto para cuestionarios sobre documentos, fácil de implantar

Introducción general Kotaemon es una herramienta de código abierto de preguntas y respuestas sobre documentos diseñada para proporcionar a los usuarios finales y a los desarrolladores una funcionalidad de preguntas y respuestas basada en la Generación Aumentada de Recuperación (RAG). El proyecto fue desarrollado por Cinnamon y soporta una variedad de proveedores de API LLM (por ejemplo, OpenA...
hace 2 años
074.1K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: un asistente de diálogo de voz de código abierto y baja latencia para la conversación y la comunicación naturales

Introducción Bailing (Bailing) es un asistente de diálogo por voz de código abierto diseñado para entablar un diálogo natural con los usuarios a través del habla. El proyecto combina tecnologías de reconocimiento del habla (ASR), detección de la actividad de la voz (VAD), modelado amplio del lenguaje (LLM) y síntesis del habla (TTS) para lograr...
hace 1 año
074K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vídeo híbrido de Vincennes: generación de secuencias realistas de vídeo de alta calidad, generación de vídeo de código abierto de Tencent de modelos de gran tamaño

Introducción Tencent Mixed Yuan Text Generation Video (disponible en Yuanbao APP) es una plataforma de generación de vídeo basada en tecnología de IA lanzada por Tencent. La plataforma utiliza el Tencent Mixed Yuan Big Model con un potente conocimiento entre dominios y comprensión del lenguaje natural para generar vídeos de alta calidad basados en las descripciones de texto de los usuarios....
hace 1 año
074K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: una herramienta segura y fiable para probar aplicaciones LLM

Introducción completa promptfoo es una herramienta de línea de comandos de código abierto y la biblioteca dedicada a la evaluación y la prueba de red-teaming Large Language Model (LLM) aplicaciones. Proporciona a los desarrolladores un conjunto completo de herramientas para la construcción de prompts fiables, modelos, y la generación basada en la recuperación (RAGs) con auto...
hace 1 año
073.9K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: una herramienta para convertir contenidos web en canales RSS mediante IA

Introducción general AI RSS es una herramienta innovadora para convertir contenidos web en fuentes RSS mediante tecnología de IA. Consta de dos partes principales: un complemento del navegador y un servidor. El complemento del navegador permite a los usuarios seleccionar listas de páginas web y generar archivos de descripción de datos estructurados (SDD)...
hace 1 año
073.9K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

DreamTalk Introducción DreamTalk es un marco de generación de cabezas parlantes basado en modelos de difusión y expresión desarrollado conjuntamente por la Universidad Tsinghua, Alibaba Group y la Universidad Huazhong de Ciencia y Tecnología. Consta principalmente de tres partes: una red de reducción de ruido, un experto en labios consciente del estilo y un predictor de...
hace 1 año
073.9K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: Haz Hablar a las Fotos | Audio Sincronizado con la Boca | Vídeo Sincronizado con la Boca Sintetizado | Gente Digital Gratis

Introducción general SadTalker es una herramienta de código abierto que combina una única foto de retrato estática con un archivo de audio para crear vídeos de avatares parlantes realistas para una amplia gama de escenarios, como mensajes personalizados, contenido educativo y mucho más. Utiliza de forma revolucionaria tecnologías de modelado 3D como ExpNet y PoseVA...
hace 1 año
073.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus: herramienta de IA para generar vídeos cortos con un solo clic, mezcla por lotes gratuita

Introducción completa MoneyPrinterPlus es un proyecto de código abierto destinado a generar y mezclar todo tipo de vídeos cortos con un solo clic a través de la tecnología de IA y publicarlos automáticamente en múltiples plataformas de vídeo, como Jieyin, Shutterbugs, Xiaohongshu y Video Number. La herramienta admite modelos de voz locales y basados en la nube,...
hace 2 años
073.1K
AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

Descripción General AnkiAIUtils es un conjunto de herramientas mejoradas con IA diseñadas para el sistema de aprendizaje de tarjetas flash Anki. Desarrollado por un estudiante de medicina, la herramienta está diseñada para mejorar automáticamente las tarjetas que los usuarios están luchando con durante el proceso de aprendizaje a través de la tecnología de IA. Proporciona a los usuarios...
hace 1 año
073.1K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Introducción general ChatFree es un proyecto de código abierto que pretende liberar las aplicaciones de IA de los usuarios de las limitaciones de los navegadores para que se ejecuten localmente. Creado utilizando la API GPT, Copilot está diseñado para soportar una amplia gama de software ofimático como Office, Word, WPS, etc. El proyecto fue desarrollado por ...
hace 1 año
073K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: dobles de IA entrenados localmente con recuerdos y hábitos personales.

Second Me es un proyecto de código abierto desarrollado por el equipo Mindverse que te permite crear una IA en tu ordenador que actúa como un "doble digital", aprendiendo tus patrones y hábitos de habla a través de tus palabras y recuerdos, y convirtiéndose en una persona inteligente que entiende tus...
hace 1 año
073K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: generación de consultas SQL precisas a partir de texto mediante técnicas RAG

Introducción exhaustiva Vanna es un marco Python de código abierto con licencia del MIT centrado en la generación de consultas SQL mediante técnicas RAG (Retrieval Augmented Generation). Los usuarios pueden entrenar modelos RAG, aplicarlos a sus propios datos, y luego hacer preguntas, y Vanna devolverá los s...
hace 1 año
073K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: robot de mensajería instantánea de código abierto de modelo grande, compatible con múltiples WeChat, QQ, Flybook y otros despliegues multiplataforma de robots de IA.

LangBot es una plataforma bot de mensajería instantánea basada en modelos de gran tamaño que admite múltiples plataformas de mensajería y modelos de gran tamaño. La plataforma se adapta a QQ, WeChat (WeChat empresarial, WeChat personal), Flybook, Discord, OneBot y otras plataformas de mensajería, y es compatible con Open...
hace 1 año
073K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: un proyecto de código abierto para mejorar la memoria a largo plazo del Agente mediante grafos de conocimiento

Introducción general Memary es un innovador proyecto de código abierto centrado en proporcionar soluciones de gestión de memoria a largo plazo para inteligencias autónomas. El proyecto ayuda a las inteligencias a superar las limitaciones de las ventanas contextuales tradicionales para lograr experiencias de interacción más inteligentes mediante grafos de conocimiento y módulos de memoria especializados.Memary adopta...
hace 1 año
072.9K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: un modelo de generación de voz que imita la voz de una persona real hablando (paquete de aceleración ChatTTS one-click)

Introducción general ChatTTS es un modelo generativo del habla diseñado para escenarios de diálogo. Genera un habla natural y expresiva, admite varios idiomas y varios hablantes, y es adecuado para diálogos interactivos. Para ello, el modelo predice y controla con precisión características rítmicas como la risa, las pausas y las interjecciones,...
hace 1 año
072.9K
ACE++:用文本指令精准对图像局部编辑的多功能开源工具

ACE++: una versátil herramienta de código abierto para la edición local precisa de imágenes con comandos de texto

Introducción general ACE++ es un proyecto de código abierto desarrollado por el equipo ali-vilab de Alibaba Tongyi Lab (Laboratorio Tongyi). Se basa en el modelo FLUX.1-Fill-dev y pretende conseguir la generación y compilación de imágenes mediante sencillos comandos textuales....
hace 1 año
072.7K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni: un modelo de medición final para entrada multimodal e interacción verbal en tiempo real

Introducción general Qwen2.5-Omni es un modelo de IA multimodal de código abierto desarrollado por el equipo Qwen de Alibaba Cloud. Puede procesar múltiples entradas, como texto, imágenes, audio y vídeo, y generar respuestas de texto o habla natural en tiempo real. El modelo se lanzó en 2025 el 3 ...
hace 1 año
072.7K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: motor de código abierto para la implantación de FLUX en entornos de baja densidad, Wan 2.1

Introducción general DiffSynth-Engine es un proyecto de código abierto lanzado por ModelScope, alojado en GitHub.Se basa en la tecnología de modelado de difusión, se centra en la generación eficiente de imágenes y vídeos, y es adecuado para que los desarrolladores desplieguen modelos de IA en entornos de producción....
hace 1 año
072.7K
PocketFlow:100行代码实现AI应用开发的极简框架

PocketFlow: un marco minimalista para el desarrollo de aplicaciones de inteligencia artificial en 100 líneas de código

Introducción completa PocketFlow es un marco de desarrollo de aplicaciones de IA ligero con sólo 100 líneas de código, desarrollado por el equipo de The-Pocket y de código abierto en GitHub. Persigue un diseño minimalista , el núcleo de control de código en 100 líneas , sin dependencias externas ...
hace 1 año
072.6K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code: herramienta de AI para convertir capturas de pantalla en código front-end limpio.

Introducción general Screenshot-to-Code es una herramienta de código abierto que utiliza inteligencia artificial para convertir capturas de pantalla, borradores de diseño y diseños Figma en código limpio y funcional. La herramienta soporta múltiples tecnologías front-end, incluyendo HTML, Tailwind CS...
hace 1 año
072.5K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: investigación web y redacción de informes utilizando LLM nativo, profundizando automáticamente en temas especificados por el usuario y generando resúmenes.

Introducción general Research Rabbit es un asistente nativo de investigación y resumen web basado en LLM (Large Language Model). Después de que el usuario proporcione un tema de investigación, Research Rabbit genera una consulta de búsqueda, obtiene resultados web relevantes y resume estos resultados....
hace 1 año
072.3K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio): solución integral de B/C para aplicaciones de agregación de IA con facturación flexible y compatibilidad con el modelo de suscripción.

Introducción general CoAI.Dev (antes Chat Nio) es una plataforma de chat que integra múltiples modelos de IA y soporta streaming distribuido, generación de imágenes, sincronización y compartición de conversaciones entre dispositivos. Implementa un sistema de facturación por suscripción y Token, servicio de tránsito de claves y múltiples...
hace 1 año
072.3K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Genera vídeos explicativos de matemáticas animados de más de 5 minutos con Manim

Introducción general TheoremExplainAgent es un proyecto innovador desarrollado por TIGER AI Lab para transformar complejos teoremas matemáticos y científicos en animaciones de vídeo fáciles de entender utilizando técnicas de inteligencia artificial. La herramienta se basa en el Large Language Model (LLM...
hace 1 año
072.3K
Trackers:用于视频对象跟踪的开源工具库

Trackers: biblioteca de herramientas de código abierto para el seguimiento de objetos en vídeo

Introducción general Trackers es una biblioteca de herramientas Python de código abierto centrada en el seguimiento multiobjeto en vídeo. Integra varios algoritmos de seguimiento líderes, como SORT y DeepSORT, y permite a los usuarios combinar diferentes modelos de detección de objetos (como YOLO...
hace 12 meses
072.2K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: un backend de gestión local para Dify

Introducción completa Dify-Plus es una plataforma de desarrollo de aplicaciones de IA basada en el desarrollo secundario del proyecto de código abierto Dify. Añade un nuevo centro de gestión basado en Dify y optimiza la funcionalidad para escenarios empresariales. El proyecto fue inicialmente para uso interno de las empresas , y más tarde se encontró que la comunidad tiene necesidades similares,...
hace 1 año
072.2K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: un modelo para transformar el lenguaje natural en consultas SQL de alta calidad

Introducción general OmniSQL es un proyecto de código abierto desarrollado por el equipo RUCKBReasoning y alojado en GitHub. Su función principal es transformar las preguntas en lenguaje natural introducidas por el usuario en sentencias de consulta SQL de alta calidad , para ayudar a los usuarios fácilmente con el número de...
hace 1 año
072.2K
MyCoder:自动修复代码、生成测试用例的命令行AI工具

MyCoder: Herramienta de IA de línea de comandos para corregir código y generar casos de prueba automáticamente

Introducción general MyCoder es un proyecto de código abierto desarrollado por el equipo drivecore y alojado en GitHub, cuyo objetivo es proporcionar a los desarrolladores asistencia de programación inteligente a través de una interfaz de línea de comandos. Se basa en la tecnología Claude AP...
hace 1 año
072.1K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: una versátil herramienta de creación de contenidos de IA para generar historias cortas, guiones de diálogos, voces en off y gráficos.

Descripción general AI ContentCraft es una versátil herramienta de creación de contenidos que integra generación de texto, síntesis de voz, generación de imágenes y mucho más. Ayuda a los creadores a generar rápidamente historias, guiones de podcasts y contenidos de audio y vídeo complementarios. La herramienta admite conversiones a varios idiomas y puede...
hace 1 año
072K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: un modelo de audio de extremo a extremo para la interacción vocal en tiempo real

Introducción completa Baichuan-Audio es un proyecto de código abierto desarrollado por Baichuan Intelligence (baichuan-inc), alojado en GitHub, centrado en la tecnología de interacción de voz de extremo a extremo. El proyecto proporciona un marco completo de procesamiento de audio que permite ...
hace 1 año
071.8K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI Chatbot Supabase: código abierto Next.js y Supabase construyeron AI chatbot para un rápido despliegue en Vercel.

Introducción general AI Chatbot Supabase es una plantilla de chatbot AI de código abierto construida sobre Next.js y Supabase. Desarrollado por Vercel, el proyecto tiene como objetivo proporcionar una solución de chatbot totalmente funcional y personalizable. Por ...
hace 1 año
071.8K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: Genera y edita texto de imagen multilingüe, altamente controlable para generar múltiples líneas de chino en la imagen.

Introducción AnyText es una revolucionaria herramienta de generación y edición de texto visual multilingüe desarrollada a partir del modelo de difusión. Genera texto multilingüe natural y de alta calidad en imágenes y admite funciones flexibles de edición de texto. Fue desarrollada por un equipo de investigadores y presentada en ICLR 2024....
hace 1 año
071.8K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: Estructura de chat en grupo con modelos de gran tamaño: chatear con varios modelos lingüísticos de gran tamaño simultáneamente

Introducción general OpenAOE es un marco de chat de grupo de grandes modelos de código abierto, cuyo objetivo es resolver el problema de la falta de marcos de chat en el mercado actual con múltiples modelos respondiendo en paralelo. Con OpenAOE, los usuarios pueden hablar con múltiples Large Language Models (LLMs) al mismo tiempo y obtener una salida paralela. El marco soporta ...
hace 1 año
071.8K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: una herramienta de código abierto para mejorar la calidad de la generación de imágenes y vídeos

Introducción exhaustiva CFG-Zero-star es un proyecto de código abierto desarrollado por Weichen Fan y el equipo S-Lab de la Universidad Tecnológica de Nanyang. Se centra en la mejora de la técnica Classifier Free Guidance (CFG) en modelos de correspondencia de flujos mediante la optimización de la estrategia de guiado y de la ...
hace 1 año
071.6K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: modelo texto-imagen para generar imágenes de alta calidad, con soporte para generar carteles chinos

Introducción exhaustiva Kolors es un modelo de generación de texto a imagen a gran escala desarrollado por el equipo Racer, basado en técnicas de difusión de potencial. El modelo se ha entrenado con miles de millones de pares de datos de texto-imagen y es capaz de generar imágenes complejas de alta calidad y precisión semántica con soporte para entradas en chino e inglés.Kolors en calidad visual...
hace 1 año
071.6K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: una herramienta automatizada de coloreado de líneas para colorear rápidamente dibujos anime de líneas en blanco y negro.

Introducción exhaustiva MangaNinjia es un proyecto de código abierto desarrollado por Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), centrado en el procesamiento automatizado del coloreado de dibujos lineales. Esta herramienta consigue un ajuste preciso del color de las imágenes de referencia mediante técnicas de aprendizaje profundo, mejorando enormemente...
hace 1 año
071.6K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: Experimenta un editor de código basado en IA, ¡haz de cada conversación un commit Git!

Introducción general Melty es un revolucionario editor de código de IA que combina conversaciones de chat con el control de versiones Git. Desarrollado por Charlie y Jackson de Replicate, esta herramienta pretende resolver los puntos débiles de las herramientas tradicionales de codificación de IA. Su mayor ...
hace 1 año
071.5K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: lienzo colaborativo de edición de código, versión de código abierto de OpenAI Canvas/Claude Artifacts

Introducción general LangChain presenta Open Canvas, una aplicación web de código abierto diseñada para mejorar la experiencia de edición y colaboración de documentos con funcionalidad de memoria de doble agente incorporada y smith integrado para observar todos los detalles de ejecución. La plataforma está impulsada por OpenA...
hace 1 año
071.5K
AutoGen:微软开发的多智能体对话框架

AutoGen: un marco de diálogo corporal multiinteligente desarrollado por Microsoft

Introducción general AutoGen es un marco de código abierto desarrollado por un equipo de investigadores de Microsoft centrado en simplificar la creación de grandes aplicaciones de modelos de lenguaje (LLM) mediante el diálogo entre cuerpos multiinteligentes. Permite a los desarrolladores crear agentes de IA que pueden dialogar entre sí y colaborar para resolver tareas. Este enfoque no sólo mejora el rendimiento de los LLM...
hace 1 año
071.4K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...
hace 1 año
071.3K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: un marco para crear y desplegar rápidamente inteligencias de IA a través del lenguaje natural

Introducción general AutoAgent es un marco de inteligencias de IA de código abierto desarrollado por el Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong (HKUDS) y alojado en GitHub.Permite a los usuarios crear y desplegar rápidamente inteligencias de IA personalizadas describiendo sus requisitos en lenguaje puramente natural, sin ninguna base de programación....
hace 10 meses
071.2K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: un modelo que admite juegos de rol y diálogos complejos, con un rendimiento superior a 32b (con instalador de un solo clic).

Introducción exhaustiva Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 es un eficiente modelo de lenguaje diseñado para soportar juegos de rol complejos y diálogos de varias rondas. Profundamente optimizado sobre la base de Qwen 2.5-7B, cuenta con una excelente generación de texto y diálogo....
hace 1 año
071.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: herramienta de AI para añadir garabatos artísticos a fotos con comandos de texto

Introducción general PhotoDoodle es una herramienta de edición de imágenes de código abierto, desarrollada por ShowLab, centrada en la edición artística de fotos mediante tecnología de inteligencia artificial. Los usuarios pueden añadir un estilo de dibujos animados, efecto 3D, luz a fotos reales con sólo escribir...
hace 1 año
071.1K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: una herramienta sencilla para crear grandes conjuntos de datos de modelos afinados

Introducción exhaustiva Easy Dataset es una herramienta de código abierto diseñada específicamente para el ajuste fino de grandes modelos (LLM), alojada en GitHub. Ofrece una interfaz fácil de usar que permite a los usuarios cargar archivos, segmentar automáticamente el contenido, generar preguntas y respuestas y, en última...
hace 1 año
071K
Oliva:语音控制的多智能体产品搜索助手

Oliva: un asistente de búsqueda de productos con inteligencia múltiple controlado por voz

Introducción general Oliva es una herramienta de asistente multi-inteligencia de código abierto desarrollada por Deluxer en GitHub. Ayuda a los usuarios a buscar información sobre productos en la base de datos Qdrant mediante la colaboración de múltiples inteligencias IA. Su principal característica es que soporta la operación por voz....
hace 1 año
071K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: Genera copias de vídeo y vídeos cortos en HD en un clic introduciendo un tema de vídeo

Introducción completa MoneyPrinterTurbo es un proyecto de código abierto que utiliza la tecnología avanzada AI big model para lograr la función de generar vídeos cortos de alta definición con un solo clic. Los usuarios sólo tienen que proporcionar un tema de vídeo o palabras clave, el sistema generará automáticamente la copia de vídeo, clips de vídeo, subtítulos de vídeo y...
hace 1 año
070.9K