Proyecto AI de código abierto

Total 1020 artículos
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: un asistente nativo de programación de inteligencia artificial que se integra en VSCode

Introducción general Tabby es un asistente de programación de IA de código abierto desarrollado por el equipo TabbyML que los usuarios pueden desplegar ellos mismos localmente o en un servidor. Ofrece funciones similares a GitHub Copilot, como el autocompletado de código y las preguntas y respuestas...
hace 8 meses
042.2K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): plataforma de código abierto para crear y gestionar grafos de conocimiento, con soporte nativo para aplicaciones RAG.

Introducción Knowledge Graph Studio (KGS) es una plataforma de código abierto diseñada para simplificar el proceso de creación y gestión de grafos de conocimiento nativos de RAG. La plataforma ofrece resolución de entidades basada en reglas, construcción modular de grafos,...
hace 12 meses
042.2K
Chat2DB:智能生成SQL与数据报表的数据库管理工具

Chat2DB: Herramienta de gestión de bases de datos para SQL inteligente y generación de informes de datos

Introducción general Chat2DB es una herramienta de gestión de bases de datos y cliente SQL de código abierto desarrollada por el equipo CodePhiliaX , integrada con funcionalidad AI , soporte para escribir rápidamente consultas SQL , gestión de bases de datos , generación de informes de datos e interacción multi-base de datos . Soporta más de 16...
hace 9 meses
042.2K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: uso ilimitado de AI IDEs mediante herramientas de automatización (por ejemplo, Cursor y Windsurf)

Descripción general AI Auto Free es una potente herramienta de automatización diseñada para ayudar a los usuarios a hacer un uso ilimitado de los Entornos de Desarrollo Integrado (IDE) basados en IA, como Cursor y Windsurf. El proyecto ofrece soporte multiplataforma e incluye múltiples funciones de lenguaje...
hace 10 meses
042.1K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers: motor de rendimiento para la inferencia de grandes modelos: aceleración extrema, potenciación flexible

KTransformers: Un framework Python de alto rendimiento para romper el cuello de botella de la inferencia de grandes modelos. Es más que una simple herramienta de ejecución de modelos, es un conjunto de motores de optimización de rendimiento extremo y una plataforma flexible de potenciación de interfaces. KTransf...
hace 10 meses
042.1K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: modelado lingüístico multimodal MNN para Android

Introducción exhaustiva MNN (Mobile Neural Network) es un marco de aprendizaje profundo eficiente y ligero desarrollado por Alibaba y optimizado para dispositivos móviles.MNN no solo es capaz de realizar inferencias rápidas en dispositivos móviles, sino que también admite tareas multimodales, incluida la generación de texto....
hace 10 meses
042.1K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: un robot de diálogo inteligente construido a partir de un modelo de gran tamaño, compatible con WeChat y otras plataformas de acceso multidiálogo.

Introducción general El proyecto ChatGPT-on-WeChat es un gran robot de diálogo inteligente basado en modelos, que admite el acceso multiplataforma a WeChat personal, número público de WeChat, aplicación WeChat empresarial, Flybook, Nail, etc. Los usuarios pueden elegir GPT3.5, GPT-4, Claude, Man...
hace 11 meses
042K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: proyecto de código abierto de reparación de imágenes dañadas y zoom de alta definición, mínimo 16G de memoria de vídeo

Descripción general InstantIR es un innovador modelo de restauración de una sola imagen desarrollado por el equipo de InstantX, diseñado para resucitar sus imágenes dañadas con detalles de gran calidad y realismo, capaz de realizar una restauración de alta calidad de imágenes dañadas. La herramienta no sólo restaura los detalles de la imagen...
hace 1 año
041.8K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: herramienta gratuita de IA basada en el paquete Pollinations.

Introducción general FreeAI es una plataforma de aplicaciones de IA de código abierto basada en la API Pollinations.AI, que proporciona servicios gratuitos e ilimitados de asistentes de chat de IA, generación de imágenes y síntesis de voz. El proyecto fue iniciado por el desarrollador Azad-sl en G...
hace 8 meses
041.8K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: una herramienta de código abierto para ajustar y entrenar modelos lingüísticos de gran tamaño

Introducción Unsloth es un proyecto de código abierto diseñado para proporcionar herramientas eficientes para el ajuste fino y la formación de grandes modelos lingüísticos (LLM). El proyecto soporta una variedad de modelos bien conocidos, incluyendo Llama, Mistral, Phi, y Gemma.Unsloth...
hace 10 meses
041.7K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...
hace 11 meses
041.6K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: herramienta de clonación de voz multilingüe y sin muestras basada en xtts_v2 para Windows.

Descripción general Clone Voice es una herramienta de clonación de sonido de código abierto que proporciona una interfaz basada en web que permite a los usuarios clonar voces utilizando cualquier sonido o grabación de voz personal. La herramienta es fácil de usar, incluso sin una GPU NVIDIA, y se puede utilizar con una aplicación precompilada...
hace 1 año
041.6K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund: sistema de negociación automatizado de código abierto que utiliza inteligencias múltiples para tomar decisiones complejas de negociación en fondos de cobertura.

Introducción general AI Hedge Fund es un fondo de cobertura de inteligencia artificial que utiliza un sistema multiagente para tomar decisiones comerciales. El sistema trabaja en colaboración con varios agentes especializados, como agentes de datos de mercado, agentes cuantitativos, agentes de gestión de riesgos y agentes de gestión de carteras, para...
hace 10 meses
041.6K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: la herramienta de inteligencia artificial que genera automáticamente notas Markdown a partir de vídeos

Introducción completa BiliNote es una herramienta de código abierto AI video toma de notas que soporta la extracción de contenido de BiliNote y enlaces de vídeo de YouTube para generar automáticamente notas claramente estructuradas en formato Markdown. Hace uso de la transcripción nativa de audio y de una gran variedad de modelos ...
hace 7 meses
041.6K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: herramienta de conversión de voz en subtítulos, cliente ligero con interfaces integradas para Cutscene, Racer y Must-Cut.

Introducción completa AsrTools es una herramienta inteligente de voz a texto con interfaces incorporadas de grandes jugadores como Cutscene, QuickScope y MustScope, que soporta procesamiento por lotes multihilo eficiente sin necesidad de GPU o configuraciones tediosas. Se basa en el desarrollo PyQt5, interfaz hermosa y fácil de usar, capaz de salida SRT y TXT palabras de formato ...
hace 1 año
041.5K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Introducción general ChatFree es un proyecto de código abierto que pretende liberar las aplicaciones de IA de los usuarios de las limitaciones de los navegadores para que se ejecuten localmente. Creado utilizando la API GPT, Copilot está diseñado para soportar una amplia gama de software ofimático como Office, Word, WPS, etc. El proyecto fue desarrollado por ...
hace 12 meses
041.5K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de inteligencia artificial.

Introducción general Mem0 (pronunciado "mem-zero") es un proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de IA. Recuerda las preferencias del usuario, se adapta a las necesidades individuales y mejora con el tiempo, por lo que es ideal para chatbots asistidos por el cliente, asistentes de IA y sistemas autónomos....
hace 1 año
041.5K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: proyecto de código abierto que permite a la IA manejar ordenadores a distancia y controlarlos mediante lenguaje natural

Introducción general NeoAI es una innovadora herramienta de código abierto AI asistente que permite a los usuarios controlar y gestionar fácilmente sus ordenadores a través del diálogo en lenguaje natural. Sin escribir ningún código, los usuarios pueden hacer la búsqueda de archivos, automatización de tareas, gestión de dispositivos y mucho más con sólo el diálogo diario.NeoAI...
hace 11 meses
041.5K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new: modificación de código abierto basada en Bolt.new, herramientas de desarrollo de pila completa basadas en IA.

Descripción general multi-model-bolt.new es una versión modificada de Bolt.new que permite el uso de modelos TogetherAI, soportando características como el despliegue, la respuesta móvil y la entrada de voz. Los usuarios pueden ser solicitados directamente en el navegador, ejecutar...
hace 12 meses
041.4K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI Chatbot Supabase: código abierto Next.js y Supabase construyeron AI chatbot para un rápido despliegue en Vercel.

Introducción general AI Chatbot Supabase es una plantilla de chatbot AI de código abierto construida sobre Next.js y Supabase. Desarrollado por Vercel, el proyecto tiene como objetivo proporcionar una solución de chatbot totalmente funcional y personalizable. Por ...
hace 1 año
041.4K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 9 meses
041.4K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: revolucionarias herramientas de generación y clonación de voz

Introducción general GPT-SoVITS es una herramienta de conversión y síntesis de voz de código abierto que combina el modelo GPT y la tecnología de cambio de voz SoVITS. La herramienta admite la conversión de texto a voz sobre la marcha con cero y pocas muestras, y la migración de estilo de voz con sólo 5 segundos de muestras de audio. Entre sus funciones se incluyen la ...
hace 1 año
041.2K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot: un organismo inteligente para mejorar la eficacia del análisis de datos financieros y la investigación de inversiones

Introducción exhaustiva FinRobot es una plataforma de inteligencia de IA de código abierto desarrollada por AI4Finance Foundation y diseñada para el análisis financiero. No solo abarca los modelos lingüísticos tradicionales, sino que también incorpora diversas tecnologías de IA, con el objetivo de ofrecer una solución integral para el sector financiero.F...
hace 10 meses
041.2K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: herramienta de globalización multilingüe para vídeo con traducción y doblaje en un clic

Introducción completa KrillinAI es una herramienta de procesamiento de vídeo de código abierto que se centra en el uso de la inteligencia artificial para ayudar a los usuarios a traducir vídeos y doblarlos automáticamente. Puede empezar desde la descarga del vídeo, hasta generar el producto final adaptado a diferentes plataformas, todo el proceso es cuestión de unos pocos clics. Los desarrolladores están disponibles en GitHub...
hace 6 meses
041.2K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: PDF local para generar podcasts de voz de herramientas de código abierto

Introducción completa Local-NotebookLM es un proyecto de código abierto que tiene como objetivo proporcionar localmente ejecutar herramientas inteligentes de procesamiento de documentos y generación de contenidos. Está inspirado en Google NotebookLM , centrándose en ayudar a los usuarios a PDF y otros documentos en una variedad de ...
hace 9 meses
041.2K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: modelo de aprendizaje profundo para eliminar rápidamente el fondo de imágenes y vídeos

Introducción exhaustiva BEN2 (Background Erase Network 2) es un modelo de aprendizaje profundo desarrollado por Prama LLC específicamente diseñado para eliminar automáticamente el fondo de una imagen y generar una imagen en primer plano. El modelo utiliza un innovador algoritmo de Confiden...
hace 6 meses
041.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: herramienta de AI para añadir garabatos artísticos a fotos con comandos de texto

Introducción general PhotoDoodle es una herramienta de edición de imágenes de código abierto, desarrollada por ShowLab, centrada en la edición artística de fotos mediante tecnología de inteligencia artificial. Los usuarios pueden añadir un estilo de dibujos animados, efecto 3D, luz a fotos reales con sólo escribir...
hace 9 meses
041.1K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: una aplicación de traducción de voz en tiempo real para Android, ¡gratis y sin conexión!

Introducción general RTranslator es una aplicación de traducción en tiempo real, prácticamente gratuita y de código abierto diseñada para dispositivos Android. Los usuarios pueden mantener su teléfono en el bolsillo mediante la conexión de un auricular Bluetooth y mantener una conversación con otros como si estuvieran hablando su propio idioma.RTransla...
hace 11 meses
041.1K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelización autorregresiva por bits de la generación de imágenes de alta resolución para una generación ilimitada de imágenes de alta resolución

Introducción general Infinity es un innovador marco de generación de imágenes de alta resolución desarrollado por el equipo de FoundationVision. El proyecto rompe con las limitaciones de los modelos tradicionales de generación de imágenes a través de un innovador enfoque de modelado autorregresivo visual a nivel de bits.Las principales características de Infinity...
hace 11 meses
041K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Introducción general Aider es una potente herramienta de código abierto que ayuda a los desarrolladores a escribir, editar y refactorizar código a través del diálogo en lenguaje natural. Como herramienta interactiva de programación por pares de IA, Aider es compatible con muchos de los principales lenguajes de programación y puede integrarse perfectamente en Git....
hace 8 meses
040.9K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: un modelo de conversión de texto en habla de código abierto para la generación y clonación de habla de alta calidad

Introducción general Llasa-3B es un modelo de conversión de texto a voz (TTS) de código abierto desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong (HKUST Audio). El modelo se basa en la arquitectura Llama 3.2B, que ha sido cuidadosamente ajustada para proporcionar una generación de voz de alta calidad que no sólo soporta múltiples...
hace 10 meses
040.9K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon: una herramienta multimodal de código abierto para cuestionarios sobre documentos, fácil de implantar

Introducción general Kotaemon es una herramienta de código abierto de preguntas y respuestas sobre documentos diseñada para proporcionar a los usuarios finales y a los desarrolladores una funcionalidad de preguntas y respuestas basada en la Generación Aumentada de Recuperación (RAG). El proyecto fue desarrollado por Cinnamon y soporta una variedad de proveedores de API LLM (por ejemplo, OpenA...
hace 1 año
040.8K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real

WebUI de conversión de voz basado en VITS es un marco de conversión de voz basado en VITS fácil de usar que permite la conversión de voz entre cualquier altavoz, incluyendo covers de canciones y cambios de voz en tiempo real. Tiene bajo ...
hace 1 año
040.8K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: la clásica herramienta de código abierto para colorear fotos y vídeos en blanco y negro mediante técnicas de IA

Introducción exhaustiva DeOldify es un proyecto de código abierto basado en tecnología de aprendizaje profundo dedicado a la coloración y restauración inteligente de fotos y vídeos en blanco y negro. El proyecto utiliza un innovador método de entrenamiento NoGAN para resolver con éxito los defectos comunes de las redes GAN tradicionales en el proceso de coloreado de imágenes....
hace 11 meses
040.8K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: Permite que la IA controle directamente tu ordenador, una implementación de código abierto del ordenador de control de Claude.

Introducción general Agent.exe es una aplicación Electron de código abierto que utiliza la API Sonnet Claude 3.5 de Anthropic para permitir a los usuarios controlar su ordenador local directamente a través de la IA. El proyecto fue desarrollado por K...
hace 11 meses
040.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...
hace 8 meses
040.7K
Klee:桌面本地运行AI大模型并管理私人知识库

Klee: ejecución local de macromodelos de IA en el escritorio y gestión de una base de conocimientos privada

Introducción general Klee es una aplicación de escritorio de código abierto diseñada para ayudar a los usuarios a ejecutar localmente grandes modelos lingüísticos (LLM) de código abierto con gestión privada y segura de bases de conocimiento y capacidades de toma de notas Markdown. Se basa en las tecnologías Ollama y LlamaIndex...
hace 9 meses
040.7K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicación web de chat con inteligencia artificial de código abierto con carga de documentos y compatibilidad multimodelo

Introducción general Zola es una aplicación de chat de IA gratuita y de código abierto desarrollada por el desarrollador Julien Thibeaut (nombre de usuario de GitHub ibelick) y alojada en GitHub. Su mejor característica es que soporta múltiples modos de IA...
hace 8 meses
040.6K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: una plataforma de código abierto para automatizar el cumplimiento de SOC 2, ISO 27001 y GDPR

Introducción general Comp AI es una plataforma de código abierto desarrollada por Comp AI, Inc. con sede en San Francisco, Estados Unidos. Ayuda a las organizaciones a completar rápidamente los requisitos de cumplimiento como SOC 2, ISO 27001 y GDPR a través de herramientas automatizadas, con el objetivo de varios...
hace 8 meses
040.6K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: una herramienta de código abierto para editar imágenes con instrucciones de lenguaje natural

Introducción general Step1X-Edit es un marco de edición de imágenes de código abierto desarrollado por el equipo Stepfun AI y alojado en GitHub. Combina un modelo de lenguaje multimodal de gran tamaño (Qwen-VL) y un transformador de difusión (DiT) para permitir a los usuarios crear imágenes a través de un...
hace 7 meses
040.5K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: clon de código abierto del sistema de integración digital man, despliegue en un clic del cliente gratuito digital man.

Introducción completa AigcPanel es un sistema de producción humana digital AI de ventanilla única para todos los usuarios, desarrollado con la pila de tecnología electron+vue3+typescript, compatible con la implementación de un solo clic en Windows. El sistema está diseñado para ser fácil de usar como el núcleo, incluso...
hace 11 meses
040.5K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: generación de imágenes en tiempo real escribiendo palabras clave (acceso gratuito al modelo Flux Schnell)

Descripción general BlinkShot es un generador de imágenes de IA en tiempo real de código abierto que utiliza la tecnología Together AI y Flux Schnell para permitir a los usuarios generar imágenes de alta calidad a medida que introducen indicaciones. La plataforma es completamente gratuita y admite la personalización del usuario y...
hace 1 año
040.5K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock: herramienta de análisis de valores basada en IA, seguimiento en tiempo real de las cotizaciones de valores elegidos por el usuario y análisis en profundidad basados en IA.

Introducción completa go-stock es una herramienta de análisis de acciones con IA construida sobre Wails y NaiveUI. La herramienta es capaz de monitorizar en tiempo real las cotizaciones de las acciones, proporcionando visualización de costes y beneficios/pérdidas y función de empuje de alarma arriba/abajo. Todos los datos se guardan localmente para...
hace 10 meses
040.4K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: Las imágenes de retratos con audio generan vídeos de demostración digitales con expresiones faciales vivas

Introducción general Sonic es una innovadora plataforma centrada en la percepción global del audio y diseñada para generar vívidas animaciones de retratos controladas por audio. Desarrollada por un equipo de investigadores de Tencent y la Universidad de Zhejiang, la plataforma utiliza información de audio para controlar las expresiones faciales y los movimientos de la cabeza con el fin de generar vídeos animados naturales y fluidos.S...
hace 8 meses
040.4K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: modelo texto-imagen para generar imágenes de alta calidad, con soporte para generar carteles chinos

Introducción exhaustiva Kolors es un modelo de generación de texto a imagen a gran escala desarrollado por el equipo Racer, basado en técnicas de difusión de potencial. El modelo se ha entrenado con miles de millones de pares de datos de texto-imagen y es capaz de generar imágenes complejas de alta calidad y precisión semántica con soporte para entradas en chino e inglés.Kolors en calidad visual...
hace 11 meses
040.4K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue: un asistente de código de IA de código abierto que se integra con VS Code y personaliza modelos e incrustaciones.

Introducción general Continue es un asistente de código de IA de código abierto diseñado para mejorar la eficiencia de los desarrolladores de software. Sus principales características incluyen autocompletado de código, optimización de código y sugerencias inteligentes de código para VS Code y JetBrains IDEs.Continue hace...
hace 10 meses
040.3K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: proxy/reversión del canal Midjourney Discord para llamadas a la API de mapeo de IA (prueba gratuita).

Introducción completa Midjourney Proxy es un proyecto de código abierto diseñado para proporcionar servicios de proxy para el canal Discord de Midjourney, convirtiendo las funciones de dibujo AI en forma de API. El proyecto es completamente gratuito y de código abierto , soporte para el intercambio de caras con un solo clic , mezcla de imágenes , nacimiento de gráficos ...
hace 12 meses
040.3K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: cargue una imagen y migre las funciones de retrato para generar diferentes estilos de imágenes

Introducción completa InstantID es una tecnología avanzada centrada en la generación de imágenes con estilos o poses personalizados en cuestión de segundos, al tiempo que garantiza un alto nivel de fidelidad utilizando una única imagen de identificación de referencia. La tecnología utiliza una solución basada en un modelo de difusión mediante la integración de imágenes faciales, mapas de puntos de referencia...
hace 1 año
040.3K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: Herramienta especial para convertir archivos PPTX a Markdown

Introducción general PPTX2MD es una herramienta de código abierto diseñada para convertir archivos PPTX de PowerPoint al formato Markdown. Desarrollada por el usuario de GitHub ssine, la herramienta permite conservar los encabezados, las listas, el formato del texto (por ejemplo, negrita, cursiva, colores y super...
hace 10 meses
040.3K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...
hace 9 meses
040.1K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: un asistente de IA para la generación de descripciones de texto Flujos de trabajo ComfyUI

Introducción general ComfyUI-Copilot es un nodo personalizado impulsado por IA diseñado para el marco ComfyUI, con el objetivo de mejorar la eficiencia de la depuración y el despliegue de algoritmos de IA a través de la interacción del lenguaje natural. Está desarrollado por el equipo AIDC-AI (Alibaba) y derivado de GitHu...
hace 9 meses
040.1K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: restauración facial de imágenes y vídeos, restauración de fotos antiguas, ofrece una versión de despliegue con un solo clic

CodeFormer Introducción general CodeFormer es un código base para la reparación robusta de rostros ciegos, desarrollado por un equipo de investigadores del S-Lab de la Universidad Tecnológica de Nanyang y presentado en NeurIPS 2022. El proyecto utiliza un transformador de búsqueda de c...
hace 1 año
040.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

DreamTalk Introducción DreamTalk es un marco de generación de cabezas parlantes basado en modelos de difusión y expresión desarrollado conjuntamente por la Universidad Tsinghua, Alibaba Group y la Universidad Huazhong de Ciencia y Tecnología. Consta principalmente de tres partes: una red de reducción de ruido, un experto en labios consciente del estilo y un predictor de...
hace 12 meses
040K
FlowDown(浮望):iOS/macOS下体验流畅的AI客户端

FlowDown: una experiencia de cliente de IA fluida para iOS/macOS

Introducción general FlowDown-App es un cliente de diálogo AI ligero y eficiente, desarrollado por un equipo de desarrolladores utilizando Swift y UIKit, con el objetivo de proporcionar a los usuarios una experiencia de diálogo inteligente rápida y sin problemas. La aplicación se divide en una versión estándar (FlowDown...
hace 9 meses
039.9K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: una herramienta automatizada de I+D basada en datos que facilita los procesos de I+D basados en datos mediante tecnología de IA.

Introducción general RD-Agent es una herramienta de código abierto de Microsoft diseñada para automatizar y optimizar el proceso de investigación y desarrollo (I+D). La herramienta se centra en escenarios basados en datos para mejorar la eficacia del desarrollo de modelos y datos mediante técnicas de inteligencia artificial.RD-Agent integra la investigación...
hace 9 meses
039.8K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: herramienta de desarrollo de código abierto de Shangtang para crear aplicaciones corporales multiinteligentes

Introducción exhaustiva LazyLLM es una herramienta de código abierto desarrollada por el equipo LazyAGI, centrada en simplificar el proceso de desarrollo de aplicaciones de grandes modelos de inteligencia múltiple. Ayuda a los desarrolladores a construir rápidamente aplicaciones complejas de IA a través de la implementación con un solo clic y mecanismos de puerta de enlace ligeros, ahorrando la tediosa configuración de ingeniería....
hace 9 meses
039.8K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Asistente de corrección de la pronunciación en inglés

Introducción general Gemini Teacher es un asistente para practicar la pronunciación en inglés basado en la IA Gemini de Google. Reconoce la pronunciación inglesa del usuario en tiempo real y proporciona sugerencias de corrección y comentarios instantáneos. La herramienta está diseñada para ayudar a los usuarios a...
hace 10 meses
039.8K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: motor de física generativa de código abierto para la simulación de mundos dinámicos en 4D basados en la física real.

Introducción general Genesis es un mundo de física generativa diseñado para la robótica de propósito general y el aprendizaje de IA personificada. Proporciona una plataforma de simulación unificada que admite la simulación de una amplia gama de materiales y fenómenos físicos.Genesis tiene como objetivo desbloquear la IA generativa y la simulación física mediante la combinación...
hace 11 meses
039.6K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: Aprendizaje por refuerzo de bajo coste para la capacidad de generalización de modelos de lenguaje visual

Introducción exhaustiva R1-V es un proyecto de código abierto cuyo objetivo es lograr avances en el modelado del lenguaje visual (VLM) mediante el aprendizaje por refuerzo (RL) de bajo coste. El proyecto utiliza mecanismos de recompensa verificables para motivar a los VLM a aprender habilidades genéricas de conteo. Sorprendentemente, R1-V's 2B ...
hace 10 meses
039.6K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: bot de WeChat para inserción de noticias, diálogo con inteligencia artificial y gestión de grupos de chat

Introducción completa NGCBot es un mecanismo HOOK basado en el desarrollo de WeChat robot proyecto de código abierto , creado por el desarrollador ngc660sec (Yunshan/eXM) y alojado en GitHub Después de dos años de iteración , la versión actual de V2.3 , la función de la inicial simple ...
hace 9 meses
039.5K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly: una plataforma de redacción basada en IA que orquesta procesos sobre un lienzo libre para la generación automatizada de artículos.

Introducción completa Refly es un motor de creación nativo de IA basado en canvas gratuito diseñado para ayudar a los usuarios a convertir ideas en contenido de alta calidad a través del diálogo multihilo, la integración de la base de conocimientos, la memoria contextual y la tecnología de búsqueda inteligente. La plataforma cubre más de 20 plantillas de escenarios profesionales, incluyendo...
hace 10 meses
039.5K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: un motor de búsqueda de IA de código abierto que reproduce 1 a 1 las características y la interfaz de Perplexity AI.

Introducción general Perplexica es un motor de búsqueda de código abierto basado en IA diseñado para proporcionar respuestas que profundizan en Internet. Utiliza algoritmos avanzados de aprendizaje automático, como la búsqueda por similitud y técnicas de incrustación, para optimizar los resultados de búsqueda y ofrecer respuestas claras con fuentes citadas.Perple...
hace 1 año
039.5K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: Experimenta un editor de código basado en IA, ¡haz de cada conversación un commit Git!

Introducción general Melty es un revolucionario editor de código de IA que combina conversaciones de chat con el control de versiones Git. Desarrollado por Charlie y Jackson de Replicate, esta herramienta pretende resolver los puntos débiles de las herramientas tradicionales de codificación de IA. Su mayor ...
hace 11 meses
039.5K
Dia:生成超现实多人对话的文本转语音模型

Dia: un modelo texto-voz para generar diálogos multijugador hiperrealistas

Introducción general Dia es un modelo de texto a voz (TTS) de código abierto desarrollado por Nari Labs y centrado en la generación de audio de diálogo hiperrealista. Transforma guiones de texto en diálogos realistas de varios caracteres en un solo proceso, admite el control de emociones y entonación, e incluso genera representaciones no verbales....
hace 7 meses
039.5K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

La IA lee libros: la IA lee libros en PDF página por página, extrae automáticamente los puntos clave del conocimiento y genera resúmenes.

Introducción completa AI-reads-books-page-by-page es un desarrollo basado en Python de la herramienta inteligente de análisis de libros PDF, que puede automatizar el análisis página por página de libros PDF, extraer los puntos clave de conocimiento, y después del intervalo de página especificado para generar etapa...
hace 11 meses
039.4K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: un marco basado en Qwen para aplicaciones de agentes inteligentes, que incluye llamadas a herramientas, intérpretes de código, RAG y extensiones de Chrome.

Introducción completa Qwen-Agent es un marco de aplicación de agente inteligente desarrollado sobre la base de Qwen 2.0 y superiores, con capacidades tales como seguimiento de comandos, uso de herramientas, planificación y memoria. El marco proporciona una variedad de aplicaciones de ejemplo como asistentes de navegador, intérpretes de código y asistentes personalizados....
hace 12 meses
039.4K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: generador de logotipos de código abierto que utiliza inteligencia artificial para generar logotipos de marca profesionales.

Introducción general LogoCreator es un generador de logotipos de código abierto basado en el modelo Together AI y Flux, centrado en proporcionar servicios de diseño de logotipos rápidos y profesionales para empresas y particulares. El proyecto es desarrollado y de código abierto por el desarrollador Nutlope en Git...
hace 11 meses
039.4K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: creación de herramientas inteligentes de automatización web para que las inteligencias artificiales manejen fácilmente los navegadores

Introducción exhaustiva Browser-Use es una innovadora herramienta de automatización web de código abierto diseñada específicamente para permitir que los modelos lingüísticos (LLM) interactúen de forma natural con los sitios web. Proporciona un marco potente y flexible que admite una amplia gama de modelos lingüísticos convencionales, como GPT-4, Claud...
hace 11 meses
039.4K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces: automatización de flujos de trabajo con IA, herramienta de programación de tareas para usuarios no técnicos, sustituto de Zapier de código abierto.

Introducción general Activepieces es una plataforma de flujo de trabajo de automatización todo en uno de código abierto centrada en proporcionar soluciones de automatización intuitivas y potentes para empresas y usuarios individuales. Desarrollada en TypeScript, la plataforma es extremadamente escalable y soporta más de 200 servicios integrados...
hace 11 meses
039.3K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: una herramienta para convertir contenidos web en canales RSS mediante IA

Introducción general AI RSS es una herramienta innovadora para convertir contenidos web en fuentes RSS mediante tecnología de IA. Consta de dos partes principales: un complemento del navegador y un servidor. El complemento del navegador permite a los usuarios seleccionar listas de páginas web y generar archivos de descripción de datos estructurados (SDD)...
hace 10 meses
039.3K
阿布量化交易系统:基于Python的开源量化交易平台

Abu quantitative trading system: plataforma de negociación cuantitativa de código abierto basada en Python

Introducción general Abu Quantitative Trading System es una plataforma de código abierto basada en Python. Fue creada por el usuario "bbfamily" para ayudar a los inversores a aplicar estrategias de negociación cuantitativa mediante código. El sistema soporta backtesting y trading de varios productos financieros como acciones, opciones, futuros y bitcoin. Es...
hace 8 meses
039.2K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: robot de mensajería instantánea de código abierto de modelo grande, compatible con múltiples WeChat, QQ, Flybook y otros despliegues multiplataforma de robots de IA.

LangBot es una plataforma bot de mensajería instantánea basada en modelos de gran tamaño que admite múltiples plataformas de mensajería y modelos de gran tamaño. La plataforma se adapta a QQ, WeChat (WeChat empresarial, WeChat personal), Flybook, Discord, OneBot y otras plataformas de mensajería, y es compatible con Open...
hace 10 meses
039.2K