Proyecto AI de código abierto

Total 1020 artículos
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicación web de chat con inteligencia artificial de código abierto con carga de documentos y compatibilidad multimodelo

Introducción general Zola es una aplicación de chat de IA gratuita y de código abierto desarrollada por el desarrollador Julien Thibeaut (nombre de usuario de GitHub ibelick) y alojada en GitHub. Su mejor característica es que soporta múltiples modos de IA...
hace 9 meses
052.5K
阿布量化交易系统:基于Python的开源量化交易平台

Abu quantitative trading system: plataforma de negociación cuantitativa de código abierto basada en Python

Introducción general Abu Quantitative Trading System es una plataforma de código abierto basada en Python. Fue creada por el usuario "bbfamily" para ayudar a los inversores a aplicar estrategias de negociación cuantitativa mediante código. El sistema soporta backtesting y trading de varios productos financieros como acciones, opciones, futuros y bitcoin. Es...
hace 10 meses
052.5K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces: automatización de flujos de trabajo con IA, herramienta de programación de tareas para usuarios no técnicos, sustituto de Zapier de código abierto.

Introducción general Activepieces es una plataforma de flujo de trabajo de automatización todo en uno de código abierto centrada en proporcionar soluciones de automatización intuitivas y potentes para empresas y usuarios individuales. Desarrollada en TypeScript, la plataforma es extremadamente escalable y soporta más de 200 servicios integrados...
hace 1 año
052.3K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: herramienta de narración y edición automatizada generada por texto para cine y televisión

Introducción general NarratoAI es una herramienta totalmente automatizada que integra narración de películas y vídeos, edición automatizada, doblaje y generación de subtítulos. Se basa en la tecnología de modelado lingüístico a gran escala (LLM) para generar automáticamente copias y editar automáticamente vídeos con sus correspondientes locuciones y subtítulos, proporcionando a los usuarios un...
hace 1 año
051.9K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: Plataforma de código abierto de modelización de grandes lenguajes financieros para análisis y predicción financiera

Introducción general FinGPT es una plataforma de modelización de gran lenguaje financiero de código abierto desarrollada por la AI4Finance Foundation, diseñada para que el sector financiero resuelva tareas financieras complejas e impulse la innovación en fintech.FinGPT utiliza técnicas de adaptación ligera y enfoques de aprendizaje de refuerzo....
hace 12 meses
051.9K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: clon de código abierto del sistema de integración digital man, despliegue en un clic del cliente gratuito digital man.

Introducción completa AigcPanel es un sistema de producción humana digital AI de ventanilla única para todos los usuarios, desarrollado con la pila de tecnología electron+vue3+typescript, compatible con la implementación de un solo clic en Windows. El sistema está diseñado para ser fácil de usar como el núcleo, incluso...
hace 1 año
051.8K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: creación de herramientas inteligentes de automatización web para que las inteligencias artificiales manejen fácilmente los navegadores

Introducción exhaustiva Browser-Use es una innovadora herramienta de automatización web de código abierto diseñada específicamente para permitir que los modelos lingüísticos (LLM) interactúen de forma natural con los sitios web. Proporciona un marco potente y flexible que admite una amplia gama de modelos lingüísticos convencionales, como GPT-4, Claud...
hace 1 año
051.6K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: un asistente de diálogo de voz de código abierto y baja latencia para la conversación y la comunicación naturales

Introducción Bailing (Bailing) es un asistente de diálogo por voz de código abierto diseñado para entablar un diálogo natural con los usuarios a través del habla. El proyecto combina tecnologías de reconocimiento del habla (ASR), detección de la actividad de la voz (VAD), modelado amplio del lenguaje (LLM) y síntesis del habla (TTS) para lograr...
hace 12 meses
051.6K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: transforma la letra en un modelo base de una canción completa, compatible con una amplia gama de estilos musicales.

Introducción general YuE es un modelo base de generación de canciones completas de código abierto que se centra en transformar letras de canciones en canciones completas. A diferencia de otros modelos que sólo generan fragmentos cortos de música no vocal, YuE es capaz de generar canciones completas con voz principal y coros de hasta varios minutos de duración. El modelo aborda la generación de música en...
hace 12 meses
051.4K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly: una plataforma de redacción basada en IA que orquesta procesos sobre un lienzo libre para la generación automatizada de artículos.

Introducción completa Refly es un motor de creación nativo de IA basado en canvas gratuito diseñado para ayudar a los usuarios a convertir ideas en contenido de alta calidad a través del diálogo multihilo, la integración de la base de conocimientos, la memoria contextual y la tecnología de búsqueda inteligente. La plataforma cubre más de 20 plantillas de escenarios profesionales, incluyendo...
hace 11 meses
051.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: una plataforma de código abierto para automatizar el cumplimiento de SOC 2, ISO 27001 y GDPR

Introducción general Comp AI es una plataforma de código abierto desarrollada por Comp AI, Inc. con sede en San Francisco, Estados Unidos. Ayuda a las organizaciones a completar rápidamente los requisitos de cumplimiento como SOC 2, ISO 27001 y GDPR a través de herramientas automatizadas, con el objetivo de varios...
hace 9 meses
051.4K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: reconocimiento automático de voz independiente del orador que proporciona marcas de tiempo de gran precisión a nivel de palabra.

Introducción general BetterWhisperX es una versión optimizada del proyecto WhisperX centrada en proporcionar servicios de Reconocimiento Automático del Habla (ASR) eficientes y precisos. Como rama mejorada de WhisperX, el proyecto fue desarrollado por Federico ...
hace 1 año
051.3K
AgenticSeek:完全本地运行的任务自动化AI助手

AgenticSeek: un asistente de IA para la automatización de tareas que se ejecuta de forma totalmente local

Introducción general AgenticSeek es un asistente de IA de código abierto que se ejecuta de forma completamente local y se basa en el modelo Deepseek R1. No requiere una API en la nube y no incurre en cientos de dólares en cuotas mensuales. Pretende ser un asistente inteligente similar a "Jarvis" en la película...
hace 10 meses
051.2K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: Herramienta de rastreo de comentarios de vídeo y contenidos de plataformas de medios multisociales

Introducción general MediaCrawler es una herramienta de rastreo de contenido de medios sociales diseñada para desarrolladores. Al proporcionar un rastreador de gran alcance, se puede agarrar rápidamente vídeos, imágenes, comentarios, gustos, retweets y otros datos de las plataformas sociales como Xiaohongshu,...
hace 1 año
051.2K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: proxy/reversión del canal Midjourney Discord para llamadas a la API de mapeo de IA (prueba gratuita).

Introducción completa Midjourney Proxy es un proyecto de código abierto diseñado para proporcionar servicios de proxy para el canal Discord de Midjourney, convirtiendo las funciones de dibujo AI en forma de API. El proyecto es completamente gratuito y de código abierto , soporte para el intercambio de caras con un solo clic , mezcla de imágenes , nacimiento de gráficos ...
hace 1 año
051.1K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vídeo híbrido de Vincennes: generación de secuencias realistas de vídeo de alta calidad, generación de vídeo de código abierto de Tencent de modelos de gran tamaño

Introducción Tencent Mixed Yuan Text Generation Video (disponible en Yuanbao APP) es una plataforma de generación de vídeo basada en tecnología de IA lanzada por Tencent. La plataforma utiliza el Tencent Mixed Yuan Big Model con un potente conocimiento entre dominios y comprensión del lenguaje natural para generar vídeos de alta calidad basados en las descripciones de texto de los usuarios....
hace 12 meses
051K
ACE++:用文本指令精准对图像局部编辑的多功能开源工具

ACE++: una versátil herramienta de código abierto para la edición local precisa de imágenes con comandos de texto

Introducción general ACE++ es un proyecto de código abierto desarrollado por el equipo ali-vilab de Alibaba Tongyi Lab (Laboratorio Tongyi). Se basa en el modelo FLUX.1-Fill-dev y pretende conseguir la generación y compilación de imágenes mediante sencillos comandos textuales....
hace 10 meses
051K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: interfaz de chat para visualizar conversaciones basadas en árboles

Introducción general TreeGPT es una aplicación de chat de código abierto basada en Next.js, centrada en la visualización de conversaciones con grandes modelos lingüísticos (LLMs, por sus siglas en inglés, p. ej., GPTs) a través de estructuras de grafos en árbol (grafos acíclicos dirigidos, DAGs), sustituyendo a los métodos de chat lineales tradicionales para mejorar la velocidad y...
hace 11 meses
050.9K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown editor: herramientas de diseño gráfico de WeChat sencillas y eficaces, una llave para pegar el artículo al número público de WeChat.

Introducción completa WeChat Markdown Editor (WeChat Markdown Editor) es una herramienta de diseño gráfico WeChat muy conciso diseñado para ayudar a los usuarios a crear fácilmente hermosas mensajes WeChat. El editor es compatible con todos los básicos Markdown ...
hace 1 año
050.8K
Data Formulator:AI驱动的数据可视化工具

Data Formulator: una herramienta de visualización de datos basada en IA

Introducción general Data Formulator es una herramienta de código abierto de visualización de datos basada en IA desarrollada por Microsoft Research. La herramienta combina una interfaz gráfica de usuario (GUI) y la entrada de lenguaje natural (NL) para permitir a los usuarios crear e iterar rápidamente a través de interacciones y comandos sencillos....
hace 11 meses
050.8K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: herramienta de código abierto para detectar vulnerabilidades LLM y asegurar la IA generativa

Introducción completa NVIDIA Garak es una herramienta de código abierto diseñada específicamente para detectar vulnerabilidades en Large Language Models (LLMs). Comprueba el modelo en busca de múltiples debilidades como ilusiones, fugas de datos, inyección de pistas, generación de mensajes de error, generación de contenido dañino, etc. mediante sondeos estáticos, dinámicos y adaptativos....
hace 1 año
050.7K
AutoGen:微软开发的多智能体对话框架

AutoGen: un marco de diálogo corporal multiinteligente desarrollado por Microsoft

Introducción general AutoGen es un marco de código abierto desarrollado por un equipo de investigadores de Microsoft centrado en simplificar la creación de grandes aplicaciones de modelos de lenguaje (LLM) mediante el diálogo entre cuerpos multiinteligentes. Permite a los desarrolladores crear agentes de IA que pueden dialogar entre sí y colaborar para resolver tareas. Este enfoque no sólo mejora el rendimiento de los LLM...
hace 12 meses
050.5K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

DreamTalk Introducción DreamTalk es un marco de generación de cabezas parlantes basado en modelos de difusión y expresión desarrollado conjuntamente por la Universidad Tsinghua, Alibaba Group y la Universidad Huazhong de Ciencia y Tecnología. Consta principalmente de tres partes: una red de reducción de ruido, un experto en labios consciente del estilo y un predictor de...
hace 1 año
050.5K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: herramienta de generación y depuración automática de código con soporte multilingüe

Introducción general AutoDev es un proyecto de código abierto desarrollado por el equipo de Unit Mesh y alojado en GitHub, cuyo objetivo es mejorar la eficiencia de programación de los desarrolladores mediante tecnología de inteligencia artificial. Es un potente asistente de codificación que soporta múltiples lenguajes de programación, incluyendo Ja...
hace 11 meses
050.4K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: un modelo para transformar el lenguaje natural en consultas SQL de alta calidad

Introducción general OmniSQL es un proyecto de código abierto desarrollado por el equipo RUCKBReasoning y alojado en GitHub. Su función principal es transformar las preguntas en lenguaje natural introducidas por el usuario en sentencias de consulta SQL de alta calidad , para ayudar a los usuarios fácilmente con el número de...
hace 10 meses
050.4K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: personas digitales inteligentes e interactivas en tiempo real con soporte de despliegue multiplataforma con un solo clic

Introducción general DUIX (Dialogue User Interface System) es una plataforma digital de interacción humana potenciada por IA creada por Silicon Intelligence. Con capacidades de interacción humana digital de código abierto, los desarrolladores pueden integrar fácilmente modelos a gran escala, reconocimiento automático del habla (ASR...
hace 1 año
050.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: motor de física generativa de código abierto para la simulación de mundos dinámicos en 4D basados en la física real.

Introducción general Genesis es un mundo de física generativa diseñado para la robótica de propósito general y el aprendizaje de IA personificada. Proporciona una plataforma de simulación unificada que admite la simulación de una amplia gama de materiales y fenómenos físicos.Genesis tiene como objetivo desbloquear la IA generativa y la simulación física mediante la combinación...
hace 1 año
050.4K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: modelo texto-imagen para generar imágenes de alta calidad, con soporte para generar carteles chinos

Introducción exhaustiva Kolors es un modelo de generación de texto a imagen a gran escala desarrollado por el equipo Racer, basado en técnicas de difusión de potencial. El modelo se ha entrenado con miles de millones de pares de datos de texto-imagen y es capaz de generar imágenes complejas de alta calidad y precisión semántica con soporte para entradas en chino e inglés.Kolors en calidad visual...
hace 1 año
050.4K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code: herramienta de AI para convertir capturas de pantalla en código front-end limpio.

Introducción general Screenshot-to-Code es una herramienta de código abierto que utiliza inteligencia artificial para convertir capturas de pantalla, borradores de diseño y diseños Figma en código limpio y funcional. La herramienta soporta múltiples tecnologías front-end, incluyendo HTML, Tailwind CS...
hace 1 año
050.3K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: investigación web y redacción de informes utilizando LLM nativo, profundizando automáticamente en temas especificados por el usuario y generando resúmenes.

Introducción general Research Rabbit es un asistente nativo de investigación y resumen web basado en LLM (Large Language Model). Después de que el usuario proporcione un tema de investigación, Research Rabbit genera una consulta de búsqueda, obtiene resultados web relevantes y resume estos resultados....
hace 10 meses
050.3K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: una herramienta segura y fiable para probar aplicaciones LLM

Introducción completa promptfoo es una herramienta de línea de comandos de código abierto y la biblioteca dedicada a la evaluación y la prueba de red-teaming Large Language Model (LLM) aplicaciones. Proporciona a los desarrolladores un conjunto completo de herramientas para la construcción de prompts fiables, modelos, y la generación basada en la recuperación (RAGs) con auto...
hace 11 meses
050.3K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: motor de código abierto para la implantación de FLUX en entornos de baja densidad, Wan 2.1

Introducción general DiffSynth-Engine es un proyecto de código abierto lanzado por ModelScope, alojado en GitHub.Se basa en la tecnología de modelado de difusión, se centra en la generación eficiente de imágenes y vídeos, y es adecuado para que los desarrolladores desplieguen modelos de IA en entornos de producción....
hace 10 meses
050.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus: herramienta de IA para generar vídeos cortos con un solo clic, mezcla por lotes gratuita

Introducción completa MoneyPrinterPlus es un proyecto de código abierto destinado a generar y mezclar todo tipo de vídeos cortos con un solo clic a través de la tecnología de IA y publicarlos automáticamente en múltiples plataformas de vídeo, como Jieyin, Shutterbugs, Xiaohongshu y Video Number. La herramienta admite modelos de voz locales y basados en la nube,...
hace 1 año
050.2K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: una herramienta sencilla para crear grandes conjuntos de datos de modelos afinados

Introducción exhaustiva Easy Dataset es una herramienta de código abierto diseñada específicamente para el ajuste fino de grandes modelos (LLM), alojada en GitHub. Ofrece una interfaz fácil de usar que permite a los usuarios cargar archivos, segmentar automáticamente el contenido, generar preguntas y respuestas y, en última...
hace 10 meses
050.1K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: un modelo de audio de extremo a extremo para la interacción vocal en tiempo real

Introducción completa Baichuan-Audio es un proyecto de código abierto desarrollado por Baichuan Intelligence (baichuan-inc), alojado en GitHub, centrado en la tecnología de interacción de voz de extremo a extremo. El proyecto proporciona un marco completo de procesamiento de audio que permite ...
hace 11 meses
050.1K
QAnything:高度集成RAG处理流程的本地知识库问答系统

QAnything: Sistema de preguntas y respuestas de base de conocimientos local con flujo de procesamiento RAG altamente integrado

QAnything Introducción Completa QAnything (Question and Answer based on Anything) es un sistema de preguntas y respuestas de base de conocimiento local lanzado por NetEase, que admite todo tipo de formatos de archivo y bases de datos, y se puede instalar sin conexión para utilizar...
hace 1 año
050.1K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: una aplicación web comercial que integra servicios de IA multimodal (código abierto gratuito)

Introducción general 99AI es un proyecto de aplicación web de IA de código abierto cuyo objetivo es proporcionar una plataforma de servicios de IA integrada de bajo umbral y fácil de desplegar. El proyecto admite diálogos inteligentes, modelos multimodales, plazas de aplicaciones, búsquedas en red e integra pintura, música y vídeo de IA....
hace 1 año
050K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

Uso de ordenadores abiertos E2B: ejecución segura de un sistema operativo de inteligencia artificial en el espacio aislado E2B

Introducción general E2B Open Computer Use es un proyecto de código abierto cuyo objetivo es proporcionar una experiencia segura de uso de ordenadores Linux basada en la nube a través de E2B Desktop Sandbox.E2B Sandbox proporciona un entorno gráfico de escritorio que los usuarios...
hace 1 año
049.9K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: herramienta de AI para añadir garabatos artísticos a fotos con comandos de texto

Introducción general PhotoDoodle es una herramienta de edición de imágenes de código abierto, desarrollada por ShowLab, centrada en la edición artística de fotos mediante tecnología de inteligencia artificial. Los usuarios pueden añadir un estilo de dibujos animados, efecto 3D, luz a fotos reales con sólo escribir...
hace 10 meses
049.9K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: una herramienta para convertir contenidos web en canales RSS mediante IA

Introducción general AI RSS es una herramienta innovadora para convertir contenidos web en fuentes RSS mediante tecnología de IA. Consta de dos partes principales: un complemento del navegador y un servidor. El complemento del navegador permite a los usuarios seleccionar listas de páginas web y generar archivos de descripción de datos estructurados (SDD)...
hace 12 meses
049.9K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: despliegue sin servidor de un sitio de diálogo multimodal Gemini

Introducción General Gemini Playground es un proyecto de código abierto diseñado para ayudar a los usuarios a implementar rápidamente un sitio de diálogo multimodal . El proyecto es desarrollado por el camarón de rastreo técnico , apoyar el uso de Gemini API Key en 10 segundos para completar el despliegue . Si el usuario es ...
hace 11 meses
049.9K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio): solución integral de B/C para aplicaciones de agregación de IA con facturación flexible y compatibilidad con el modelo de suscripción.

Introducción general CoAI.Dev (antes Chat Nio) es una plataforma de chat que integra múltiples modelos de IA y soporta streaming distribuido, generación de imágenes, sincronización y compartición de conversaciones entre dispositivos. Implementa un sistema de facturación por suscripción y Token, servicio de tránsito de claves y múltiples...
hace 1 año
049.9K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: herramienta de desarrollo de código abierto de Shangtang para crear aplicaciones corporales multiinteligentes

Introducción exhaustiva LazyLLM es una herramienta de código abierto desarrollada por el equipo LazyAGI, centrada en simplificar el proceso de desarrollo de aplicaciones de grandes modelos de inteligencia múltiple. Ayuda a los desarrolladores a construir rápidamente aplicaciones complejas de IA a través de la implementación con un solo clic y mecanismos de puerta de enlace ligeros, ahorrando la tediosa configuración de ingeniería....
hace 11 meses
049.9K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreado de dibujos animados, sombreado automático de imágenes en blanco y negro para mejorar la coherencia y la calidad del color de las imágenes.

Introducción ColorFlow es una herramienta de autocoloreado de secuencias de imágenes desarrollada por el equipo ARC de Tencent para resolver el problema del autocoloreado de secuencias de imágenes en blanco y negro. La herramienta utiliza un proceso de sombreado mejorado para generar con precisión los colores de varios elementos a través de un conjunto de imágenes de referencia, incluidos los colores del pelo de los personajes y los servicios....
hace 1 año
049.8K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: Experimenta un editor de código basado en IA, ¡haz de cada conversación un commit Git!

Introducción general Melty es un revolucionario editor de código de IA que combina conversaciones de chat con el control de versiones Git. Desarrollado por Charlie y Jackson de Replicate, esta herramienta pretende resolver los puntos débiles de las herramientas tradicionales de codificación de IA. Su mayor ...
hace 1 año
049.7K
PocketFlow:100行代码实现AI应用开发的极简框架

PocketFlow: un marco minimalista para el desarrollo de aplicaciones de inteligencia artificial en 100 líneas de código

Introducción completa PocketFlow es un marco de desarrollo de aplicaciones de IA ligero con sólo 100 líneas de código, desarrollado por el equipo de The-Pocket y de código abierto en GitHub. Persigue un diseño minimalista , el núcleo de control de código en 100 líneas , sin dependencias externas ...
hace 10 meses
049.7K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: un modelo de generación de voz que imita la voz de una persona real hablando (paquete de aceleración ChatTTS one-click)

Introducción general ChatTTS es un modelo generativo del habla diseñado para escenarios de diálogo. Genera un habla natural y expresiva, admite varios idiomas y varios hablantes, y es adecuado para diálogos interactivos. Para ello, el modelo predice y controla con precisión características rítmicas como la risa, las pausas y las interjecciones,...
hace 11 meses
049.7K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: una herramienta de código abierto para mejorar la calidad de la generación de imágenes y vídeos

Introducción exhaustiva CFG-Zero-star es un proyecto de código abierto desarrollado por Weichen Fan y el equipo S-Lab de la Universidad Tecnológica de Nanyang. Se centra en la mejora de la técnica Classifier Free Guidance (CFG) en modelos de correspondencia de flujos mediante la optimización de la estrategia de guiado y de la ...
hace 10 meses
049.6K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

Diffusers Image Outpaint: herramienta de extensión de imagen AI de código abierto súper potente, image outpainting (pintado de imágenes)

Introducción general Diffusers Image Outpaint es una potente herramienta de expansión de imágenes AI creada por fffiloni, miembro de la comunidad Hugging Face. La herramienta utiliza técnicas avanzadas de modelado de difusión para...
hace 1 año
049.6K
AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

AnkiAIUtils: Anki Flashcard Learning AI Toolset, un asistente inteligente que optimiza automáticamente las tarjetas de memoria

Descripción General AnkiAIUtils es un conjunto de herramientas mejoradas con IA diseñadas para el sistema de aprendizaje de tarjetas flash Anki. Desarrollado por un estudiante de medicina, la herramienta está diseñada para mejorar automáticamente las tarjetas que los usuarios están luchando con durante el proceso de aprendizaje a través de la tecnología de IA. Proporciona a los usuarios...
hace 1 año
049.6K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: generador de logotipos de código abierto que utiliza inteligencia artificial para generar logotipos de marca profesionales.

Introducción general LogoCreator es un generador de logotipos de código abierto basado en el modelo Together AI y Flux, centrado en proporcionar servicios de diseño de logotipos rápidos y profesionales para empresas y particulares. El proyecto es desarrollado y de código abierto por el desarrollador Nutlope en Git...
hace 1 año
049.6K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelización autorregresiva por bits de la generación de imágenes de alta resolución para una generación ilimitada de imágenes de alta resolución

Introducción general Infinity es un innovador marco de generación de imágenes de alta resolución desarrollado por el equipo de FoundationVision. El proyecto rompe con las limitaciones de los modelos tradicionales de generación de imágenes a través de un innovador enfoque de modelado autorregresivo visual a nivel de bits.Las principales características de Infinity...
hace 1 año
049.6K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: Genera y edita texto de imagen multilingüe, altamente controlable para generar múltiples líneas de chino en la imagen.

Introducción AnyText es una revolucionaria herramienta de generación y edición de texto visual multilingüe desarrollada a partir del modelo de difusión. Genera texto multilingüe natural y de alta calidad en imágenes y admite funciones flexibles de edición de texto. Fue desarrollada por un equipo de investigadores y presentada en ICLR 2024....
hace 1 año
049.5K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: ¡Sube una foto de una habitación y rediseña su diseño con IA!

Introducción general RoomGPT es un proyecto de código abierto desarrollado por el usuario de GitHub Nutlope que permite a los usuarios subir fotos de habitaciones y generar versiones rediseñadas de las mismas utilizando tecnología de inteligencia artificial. El objetivo del proyecto es ofrecer a los usuarios acceso a un diseño de interiores profesional sin tener que pagar...
hace 1 año
049.5K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: una versátil herramienta de creación de contenidos de IA para generar historias cortas, guiones de diálogos, voces en off y gráficos.

Descripción general AI ContentCraft es una versátil herramienta de creación de contenidos que integra generación de texto, síntesis de voz, generación de imágenes y mucho más. Ayuda a los creadores a generar rápidamente historias, guiones de podcasts y contenidos de audio y vídeo complementarios. La herramienta admite conversiones a varios idiomas y puede...
hace 12 meses
049.5K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: Haz Hablar a las Fotos | Audio Sincronizado con la Boca | Vídeo Sincronizado con la Boca Sintetizado | Gente Digital Gratis

Introducción general SadTalker es una herramienta de código abierto que combina una única foto de retrato estática con un archivo de audio para crear vídeos de avatares parlantes realistas para una amplia gama de escenarios, como mensajes personalizados, contenido educativo y mucho más. Utiliza de forma revolucionaria tecnologías de modelado 3D como ExpNet y PoseVA...
hace 11 meses
049.4K
Trackers:用于视频对象跟踪的开源工具库

Trackers: biblioteca de herramientas de código abierto para el seguimiento de objetos en vídeo

Introducción general Trackers es una biblioteca de herramientas Python de código abierto centrada en el seguimiento multiobjeto en vídeo. Integra varios algoritmos de seguimiento líderes, como SORT y DeepSORT, y permite a los usuarios combinar diferentes modelos de detección de objetos (como YOLO...
hace 8 meses
049.4K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: generación de consultas SQL precisas a partir de texto mediante técnicas RAG

Introducción exhaustiva Vanna es un marco Python de código abierto con licencia del MIT centrado en la generación de consultas SQL mediante técnicas RAG (Retrieval Augmented Generation). Los usuarios pueden entrenar modelos RAG, aplicarlos a sus propios datos, y luego hacer preguntas, y Vanna devolverá los s...
hace 12 meses
049.3K
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: un pequeño modelo de código abierto para el razonamiento matemático eficiente y la generación de código

Introducción general MiMo es un proyecto de modelado de grandes lenguajes de código abierto desarrollado por Xiaomi, centrado en el razonamiento matemático y la generación de código. El producto principal es la familia de modelos MiMo-7B, que contiene un modelo base (Base), un modelo de ajuste fino supervisado (SFT), un químico fuerte entrenado a partir del modelo base....
hace 8 meses
049.3K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: un motor de búsqueda de IA de código abierto que reproduce 1 a 1 las características y la interfaz de Perplexity AI.

Introducción general Perplexica es un motor de búsqueda de código abierto basado en IA diseñado para proporcionar respuestas que profundizan en Internet. Utiliza algoritmos avanzados de aprendizaje automático, como la búsqueda por similitud y técnicas de incrustación, para optimizar los resultados de búsqueda y ofrecer respuestas claras con fuentes citadas.Perple...
hace 1 año
049.2K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: ¡la forma más rápida de ejecutar y ajustar LLM localmente!

Introducción general LlamaEdge es un proyecto de código abierto diseñado para simplificar el proceso de ejecución y puesta a punto de grandes modelos lingüísticos (LLM) en dispositivos locales o edge. El proyecto es compatible con la familia de modelos Llama2 y proporciona servicios API compatibles con OpenAI que permiten a los usuarios crear y ejecutar fácilmente...
hace 12 meses
049.1K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: un editor de código colaborativo multijugador de alto rendimiento desarrollado por Rust

Introducción general Zed es un editor de código colaborativo multiusuario de alto rendimiento desarrollado por los creadores de Atom y Tree-sitter.Escrito en el lenguaje Rust, Zed está diseñado para proporcionar una experiencia de codificación rápida y fluida. Entre sus principales características se incluye la compatibilidad con...
hace 1 año
049K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: una aplicación de IA para iOS de código abierto basada en modelos OLMoE que funcionan sin conexión.

Introducción general Ai2 OLMoE es una aplicación iOS de código abierto desarrollada por el Allen Institute for AI (Ai2, Instituto Allen de Inteligencia Artificial) para proporcionar modelos de IA que se ejecutan íntegramente en dispositivos. La aplicación aprovecha el código abie...
hace 11 meses
049K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: un proyecto de código abierto para mejorar la memoria a largo plazo del Agente mediante grafos de conocimiento

Introducción general Memary es un innovador proyecto de código abierto centrado en proporcionar soluciones de gestión de memoria a largo plazo para inteligencias autónomas. El proyecto ayuda a las inteligencias a superar las limitaciones de las ventanas contextuales tradicionales para lograr experiencias de interacción más inteligentes mediante grafos de conocimiento y módulos de memoria especializados.Memary adopta...
hace 1 año
049K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: un macromodelo multimodal de audio para el diálogo de voz en tiempo real de extremo a extremo, una implementación de código abierto de la interacción de voz GPT-4o

Introducción general Ultravox es un innovador modelo multimodal de lenguaje amplio (LLM) diseñado para el procesamiento del habla en tiempo real. A diferencia de los sistemas tradicionales de reconocimiento del habla, Ultravox elimina la necesidad de una etapa separada de reconocimiento del habla de audio (ASR), y es capaz de convertir directamente el audio en un espacio de alta dimensión en...
hace 1 año
048.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: análisis sintáctico de documentos de formato complejo y extracción de datos multimodales en metadatos y texto

Introducción completa NV Ingest (NVIDIA Ingest) es un conjunto de microservicios de acceso temprano diseñados para analizar cientos de miles de PDF complejos y desordenados sin estructurar y otros documentos empresariales. Puede convertir estos documentos en metadatos y texto para incrustarlos en...
hace 1 año
048.9K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: implementación rápida de la deduplicación semántica de textos para mejorar la eficacia de la limpieza de datos

Introducción completa SemHash es una herramienta ligera y flexible para desduplicar conjuntos de datos por similitud semántica. Combina la rápida generación de incrustaciones de Model2Vec con la eficaz búsqueda de similitud RNA (vecino más cercano aproximado) de Vicinity.SemHa...
hace 1 año
048.9K
Flock:低代码工作流编排快速构建聊天机器人

Flock: orquestación de flujos de trabajo de bajo código para la creación rápida de chatbots

Introducción general Flock es una plataforma de código abierto para flujos de trabajo, alojada en GitHub y desarrollada por el equipo Onelevenvy. Se basa en las tecnologías LangChain y LangGraph y se centra en ayudar a los usuarios a construir rápidamente máquinas de chat....
hace 11 meses
048.9K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: un backend de gestión local para Dify

Introducción completa Dify-Plus es una plataforma de desarrollo de aplicaciones de IA basada en el desarrollo secundario del proyecto de código abierto Dify. Añade un nuevo centro de gestión basado en Dify y optimiza la funcionalidad para escenarios empresariales. El proyecto fue inicialmente para uso interno de las empresas , y más tarde se encontró que la comunidad tiene necesidades similares,...
hace 10 meses
048.9K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...
hace 10 meses
048.9K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: big model API ligera convertida en interfaz OpenAI, archivo YAML para configurar el canal API

Introducción completa No front-end , pura configuración de archivos de configuración del canal API . Sólo tienes que escribir un archivo puede ejecutar una estación de API de su propia , el documento tiene una guía de configuración detallada , blanco amigable. uni-api es una gestión unificada de gran proyecto API modelo , lo que permite una ...
hace 1 año
048.9K