Proyecto AI de código abierto

Total 1020 artículos

ordenar

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: modelo AI dedicado al reconocimiento OCR, PDF a Markdown (código abierto/API)

Introducción completa Datalab ofrece una gama de modelos avanzados de IA centrados en OCR, análisis de diseño, conversión de PDF a Markdown y mucho más. Estos modelos no sólo son de alto rendimiento, sino también fáciles de usar y de código abierto. Los modelos Marker de la plataforma pueden...

hace 1 año

065.5K

ModelBest: el líder mundial en modelos grandes ligeros y de alto rendimiento de extremo a extremo

Introducción general ModelBest es una empresa centrada en el desarrollo de grandes modelos ligeros y de alto rendimiento, y se dedica a aplicar tecnologías avanzadas de IA a la electrónica de consumo convencional y a todo tipo de dispositivos finales de la vida cotidiana. Su serie MiniCPM de modelos finales con extrema potencia aritmética y eficiencia en el uso de la memoria...

Últimos recursos sobre IA # AI Big Model Herramienta de diálogo nativa # AI Java Proyecto de código abierto

hace 1 año

065.2K

Podcastfy：多源内容转多语言音频对话工具，NotebookLM 播客功能的开源替代方案

Podcastfy: Herramienta de conversión de contenidos de múltiples fuentes a audio multilingüe, una alternativa de código abierto a las funciones de podcasting de NotebookLM.

Introducción general Podcastfy es un paquete Python de código abierto que utiliza la tecnología de Inteligencia Artificial Generativa (GenAI) para convertir contenidos web, archivos PDF, texto, imágenes, vídeos de youtube y muchas otras fuentes en...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

056.5K

Una API: gestión de API multimodelo y equilibrio de carga, sistema de distribución

Introducción completa One API es un sistema de gestión y distribución de interfaces de código abierto compatible con una variedad de grandes modelos como OpenAI ChatGPT, Anthropic Claude, Google PaLM 2 y Gemini. El ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

078.6K

Wenduoduo AiPPT: AI Generated PPT, Generación de presentaciones

Introducción completa AiPPT es una herramienta de generación de PPT basada en tecnología de inteligencia artificial, diseñada para ayudar a los usuarios a crear rápidamente presentaciones profesionales. Genera automáticamente diapositivas ricas en contenido y bellamente diseñadas introduciendo temas, cargando archivos o proporcionando URL, etc. Es compatible con gráficos nativos, animaciones y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Presentación generada por AI/PPT

hace 1 año

079.3K

Easegen: plataforma de producción de cursos humanos digitales de código abierto, clonación de vídeos de conferencias humanas digitales de generación PPT con un solo clic

Introducción exhaustiva Easegen es una plataforma de creación de cursos humanos digitales de código abierto que tiene como objetivo mejorar la eficiencia de la producción y gestión de contenidos de enseñanza a través de la tecnología de IA. La plataforma proporciona una solución integral desde la producción de cursos, la gestión de vídeo hasta el interrogatorio inteligente, que permite a los usuarios crear cursos digitales de vídeo explicados por humanos....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Herramientas educativas # AI de texto a vídeo

hace 1 año

062.3K

Open Canvas：代码编辑协作画布，开源版OpenAI Canvas/Claude Artifacts

Open Canvas: lienzo colaborativo de edición de código, versión de código abierto de OpenAI Canvas/Claude Artifacts

Introducción general LangChain presenta Open Canvas, una aplicación web de código abierto diseñada para mejorar la experiencia de edición y colaboración de documentos con funcionalidad de memoria de doble agente incorporada y smith integrado para observar todos los detalles de ejecución. La plataforma está impulsada por OpenA...

Últimos recursos sobre IA # AI Escritura # AI Java Proyecto de código abierto # Lienzo AI

hace 1 año

067.6K

AutoGen Studio: versión con interfaz fácil de usar del sistema multiagente AutoGen

Descripción general AutoGen Studio 2.0 es una interfaz de usuario impulsada por AutoGen diseñada para simplificar el proceso de creación y gestión de soluciones multiagente. La plataforma permite a los usuarios definir y modificar de forma declarativa los agentes y sus flujos de trabajo a través de una interfaz intuitiva....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

078.1K

MeetingMind：依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: herramienta inteligente de código abierto para grabar y resumir reuniones basada en OpenAI Whisper

Introducción general MeetingMind es una aplicación de IA avanzada diseñada para mejorar la eficiencia de la captura y el resumen de las reuniones de negocios. La aplicación integra la tecnología Whisper de OpenAI para una conversión precisa de voz a texto y utiliza IBM Watso...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta AI de resumen de texto y audio/vídeo

hace 1 año

061.2K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

Coqui TTS (xTTS): un conjunto de herramientas de aprendizaje profundo para la generación de texto a voz con soporte multilingüe y capacidades de clonación de voz.

Introducción exhaustiva Coqui TTS es un kit de herramientas avanzado de generación de texto a voz (TTS) de código abierto basado en técnicas de aprendizaje profundo. Se ha puesto a prueba tanto en entornos de investigación como de producción, y ofrece un amplio conjunto de funciones y modelos que admiten la conversión de texto a voz en varios idiomas.Coqui TTS...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 1 año

0110.2K

MemFree: un motor de búsqueda de inteligencia artificial para mezclar bases de conocimiento local e información de búsqueda

Introducción general MemFree es un avanzado motor de búsqueda híbrido de IA capaz de buscar y hacer preguntas a través de texto, imágenes, documentos y páginas web. Proporciona acceso con un solo clic a los resultados de búsqueda de texto, mapas mentales, imágenes y vídeos.MemFree pretende extraer información de la base de conocimientos del usuario y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de búsqueda de IA

hace 1 año

055.1K

BlinkShot：输入提示词实时生成图像（免费接入Flux Schnell模型）

BlinkShot: generación de imágenes en tiempo real escribiendo palabras clave (acceso gratuito al modelo Flux Schnell)

Descripción general BlinkShot es un generador de imágenes de IA en tiempo real de código abierto que utiliza la tecnología Together AI y Flux Schnell para permitir a los usuarios generar imágenes de alta calidad a medida que introducen indicaciones. La plataforma es completamente gratuita y admite la personalización del usuario y...

Últimos recursos sobre IA # AI generación de imágenes en línea # AI Java Proyecto de código abierto

hace 1 año

072.7K

FunASR: kit de herramientas de reconocimiento del habla de código abierto, separación de hablantes/reconocimiento del habla en diálogos multipersona

Introducción FunASR es un conjunto de herramientas de reconocimiento del habla de código abierto desarrollado por la Academia Alibaba Dharmo para unir la investigación académica y las aplicaciones industriales. Es compatible con una amplia gama de funciones de reconocimiento del habla, incluido el reconocimiento del habla (ASR), la detección del punto final de la voz (VAD), la recuperación de la puntuación, el modelado del lenguaje, el habla...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

0155.6K

UltraPixel: revolucionaria tecnología de generación de imágenes de altísima resolución con gran riqueza de detalles

Introducción general UltraPixel es una tecnología avanzada de generación de imágenes de ultra alta resolución diseñada para crear imágenes de altísima calidad y ricas en detalles. Fue desarrollada por el usuario de GitHub catcathh y presentada en NeurIPS 2024.U...

Últimos recursos sobre IA # AI generación de imágenes en línea # AI Java Proyecto de código abierto

hace 1 año

056.6K

SiYuan (SiYuan Notes): software de gestión del conocimiento personal que da prioridad a la privacidad, con soporte de chat para la escritura y las preguntas y respuestas mediante inteligencia artificial.

General: SiYuan Notes (SiYuan) es un software de gestión del conocimiento personal que da prioridad a la privacidad, es de código abierto y admite autoalojamiento. Está escrito en TypeScript y Golang, proporciona referencias a nivel de bloque de grano fino y Markdown WYSIWYG (WYSIWY...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Notas

hace 1 año

0103.7K

Abu quantitative trading system: plataforma de negociación cuantitativa de código abierto basada en Python

Introducción general Abu Quantitative Trading System es una plataforma de código abierto basada en Python. Fue creada por el usuario "bbfamily" para ayudar a los inversores a aplicar estrategias de negociación cuantitativa mediante código. El sistema soporta backtesting y trading de varios productos financieros como acciones, opciones, futuros y bitcoin. Es...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Análisis de datos financieros

hace 1 año

075.3K

Knowledge Table: una herramienta de código abierto para la extracción y exploración eficientes de datos estructurados

Introducción exhaustiva Knowledge Table (Tabla de conocimientos) es un proyecto de código abierto diseñado para simplificar el proceso de extracción y exploración de datos estructurados a partir de documentos no estructurados. Los usuarios pueden crear representaciones estructuradas del conocimiento, como tablas y gráficos, mediante una interfaz de consulta en lenguaje natural. La herramienta permite personalizar la extracción ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Gráfico del conocimiento

hace 1 año

057.7K

CogView3: modelo de generación de imágenes por difusión de texto en cascada de código abierto de Wisdom Spectrum

Introducción CogView3 es un sistema avanzado de generación de imágenes de texto desarrollado por la Universidad de Tsinghua y Think Tank Team (Chi Spectrum Qingyan). Se basa en un modelo de difusión en cascada y genera imágenes de alta resolución a través de múltiples etapas.Las características clave de CogView3 incluyen la generación en múltiples etapas, una arquitectura innovadora y un rendimiento eficiente....

Últimos recursos sobre IA # AI generación de imágenes en línea # AI Java Proyecto de código abierto

hace 1 año

052.2K

RocketNotes：支持文本补全、文档对话、语义搜索的Markdown笔记应用

RocketNotes: aplicación de notas Markdown con completado de texto, diálogo de documentos y búsqueda semántica

Introducción general RocketNotes es una aplicación web para tomar notas en Markdown que integra capacidades de completado de texto, chat y búsqueda semántica basadas en Large Language Model (LLM). El proyecto utiliza el 100% serverless RAG (Re...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Notas

hace 1 año

053.3K

F5-TTS: clonación de voz sin muestras para generar voces clonadas suaves y emocionalmente ricas.

Introducción exhaustiva F5-TTS es un novedoso sistema de conversión de texto a voz (TTS) no autorregresivo basado en un transformador de difusión (DiT) de flujo coincidente. El sistema optimiza la representación del texto utilizando el modelo ConvNeXt...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 1 año

095K

AsrTools: herramienta de conversión de voz en subtítulos, cliente ligero con interfaces integradas para Cutscene, Racer y Must-Cut.

Introducción completa AsrTools es una herramienta inteligente de voz a texto con interfaces incorporadas de grandes jugadores como Cutscene, QuickScope y MustScope, que soporta procesamiento por lotes multihilo eficiente sin necesidad de GPU o configuraciones tediosas. Se basa en el desarrollo PyQt5, interfaz hermosa y fácil de usar, capaz de salida SRT y TXT palabras de formato ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

075.7K

Surya: Herramienta profesional de OCR de documentos multilingües, de código abierto y despliegue nativo

Introducción completa Surya es un conjunto de herramientas de OCR de documentos multilingües de código abierto que admite el reconocimiento de texto en más de 90 idiomas. No sólo realiza la detección de texto línea por línea, sino también el análisis de diseño, la detección del orden de lectura y el reconocimiento de tablas.El rendimiento de Surya es comparable al de los servicios en la nube para todo tipo de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 1 año

0118.9K

Implementación de la api gratuita de hugging face en cloudflare para soportar el reenvío de interfaces

Debido a que el despliegue doméstico no puede acceder a abrazar la cara, por lo que en el programa de despliegue de gran hermano basado en la transformación para poder desplegar a los trabajadores cloudflare. Preparación 1, cloudflare registro 2, abrazar fac...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Libre Modelo Grande API

hace 1 año

066.9K

Inbox Zero：轻松实现收件箱零邮件，借助 AI 帮助你对邮件进行归类、过滤、处理。

Inbox Zero: Consigue fácilmente cero correos electrónicos en tu bandeja de entrada, con la ayuda de la IA para ayudarte a categorizar, filtrar y procesar tus correos electrónicos.

Descripción general Inbox Zero es una aplicación de gestión de correo electrónico de código abierto diseñada para ayudar a los usuarios a alcanzar rápidamente la bandeja de entrada cero con un asistente de inteligencia artificial. La aplicación ofrece una gran variedad de funciones, como responder automáticamente, archivar, etiquetar y reenviar correos electrónicos, gestionar y darse de baja de boletines, bloquear correos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital

hace 1 año

050.9K

xyks: pequeño simio cálculo oral notas inversas, ingeniería inversa y algoritmos de descifrado

Introducción completa Ape Mouth Calculator Reverse Notes es un proyecto de código abierto que tiene como objetivo documentar y compartir el proceso y los métodos de ingeniería inversa de la aplicación Ape Mouth Calculator. El proyecto contiene una variedad de herramientas y técnicas inversas para usar las instrucciones , como Frida, dexdump , etc., para ayudar a los usuarios a entender y descifrar la suma aritmética oral del pequeño simio....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Herramientas educativas

hace 1 año

063.8K

XiaoYuanKouSuan_Auto：小猿口算自动答题工具，高效解决口算题目

XiaoYuanKouSuan_Auto: Herramienta automática de preguntas y respuestas XiaoYuanKouSuan, que resuelve eficazmente temas de aritmética oral.

Introducción completa Ape Mouth Calculator Automatic Question Answer Tool es un proyecto de código abierto basado en Python diseñado para resolver eficientemente las preguntas de la aplicación Ape Mouth Calculator a través de scripts de reconocimiento OCR y automatización. La herramienta hace uso de tecnologías como OpenCV y Tesseract para poder identificar las preguntas en la pantalla en tiempo real....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Herramientas educativas

hace 1 año

054.6K

Telegram GPT Worker：部署在Cloudflare Workers上的多模型AI Telegram机器人

Telegram GPT Worker: un bot de Telegram con IA multimodelo desplegado en Cloudflare Workers

Introducción General GPT-Telegram-Worker es un bot AI Telegram multi-modelo basado en Cloudflare Workers con soporte para múltiples APs como OpenAI, Claude, Azure, y más...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente

hace 1 año

056.2K

Cloud Document Converter：飞书文档下载插件，飞书云文档转换为本地Markdown格式文档

Conversor de documentos en la nube: complemento de descarga de documentos Flying Book, conversión de documentos Flying Book en la nube a documentos locales en formato Markdown.

Introducción general Cloud Document Converter es una extensión de Chrome diseñada para convertir documentos en la nube de Flying Book al formato Markdown. Los usuarios pueden descargar o copiar fácilmente documentos en la nube de Flying Book en formato Markdo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

057.4K

QuickPiperAudiobook：一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: una clave para generar audiolibros con calidad de sonido natural, compatible con PDF, epub, docx y otros formatos.

Introducción completa QuickPiperAudiobook es un proyecto de código abierto diseñado para convertir una variedad de formatos de texto (por ejemplo, epub, mobi, txt, PDF, HTML, etc) en audiolibros de sonido natural a través de un simple comando. La herramienta utiliza Pi...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

051.6K

Crawl4AI: herramienta asíncrona de código abierto para extraer datos estructurados sin LLM

Introducción general Crawl4AI es una herramienta de rastreo web asíncrona de código abierto diseñada para grandes modelos lingüísticos (LLM) y aplicaciones de inteligencia artificial (IA). Simplifica el rastreo web y el proceso de extracción de datos, soporta el rastreo web eficiente, y proporciona formatos de salida LLM-amigable para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

086.7K

Cloudflare Serverless Registry：基于Cloudflare Workers的无服务器容器注册表

Cloudflare Serverless Registry: Un registro de contenedores sin servidor basado en Cloudflare Workers

Introducción general Cloudflare Serverless Registry es un registro de contenedores sin servidor basado en Cloudflare Workers y almacenamiento R2. Soporta push y pull de imágenes y proporciona nombre de usuario contraseña y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

048.4K

AIHawk: Asistente inteligente de búsqueda de empleo, colocación automatizada de CV (sólo en inglés)

Introducción general Auto_Jobs_Applier_AIHawk es una herramienta para automatizar la búsqueda de empleo utilizando tecnología de inteligencia artificial. Ayuda a los usuarios a automatizar el envío de un gran número de CV en un corto periodo de tiempo y a personalizarlos según su información personal y sus intenciones de búsqueda de empleo. La herramienta está diseñada...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital

hace 1 año

059K

simple-one-api：一键集成多种免费大模型API，统一对外提供 OpenAI 接口

simple-one-api: integración con un solo clic de múltiples API gratuitas de grandes modelos, interfaces OpenAI externas unificadas.

Introducción simple-one-api es un proyecto de código abierto diseñado para simplificar la integración de múltiples APIs de big models. Soporta APIs compatibles con OpenAI como ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax y Deep-Seek....

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

061.3K

Cambiador de voz: ¡Un cambiador de voz en tiempo real para hacer cantar a tus personajes de anime favoritos!

Introducción general Voice Changer es una herramienta de transformación de voz en tiempo real de código abierto que admite una amplia gama de modelos de voz AI, como MMVC, so-vits-svc, RVC, DDSP-SVC y Beatrice.La herramienta es compatible con múltiples plataformas...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 1 año

069.4K

VoAPI: Sistema de gestión de interfaz de reenvío de modelos de IA de alto valor, el sitio web oficial ofrece cuota API gratuita diaria.

Introducción general VoAPI es un nuevo sistema de gestión y distribución de interfaces de modelos de IA de alto perfil y alto rendimiento, que se utiliza principalmente para la gestión interna y los canales de distribución personales o empresariales. Desarrollado sobre la base de NewAPI, el sistema proporciona módulos funcionales ricos e interfaz de usuario optimizada, con el objetivo de mejorar...

Últimos recursos sobre IA # AI Servicios abiertos # AI Java Proyecto de código abierto

hace 1 año

058.5K

MockingBird：快速克隆声音与模型训练，基于 xtts v2 实现的文本转语音

MockingBird: clonación de voz rápida y formación de modelos, conversión de texto a voz basada en xtts v2

Introducción completa MockingBird es un proyecto de código abierto que pretende conseguir una rápida clonación de voz y conversión de texto a voz mediante tecnología de IA. Los usuarios sólo tienen que proporcionar 5 segundos de muestras de voz, puede generar cualquier contenido de voz. El proyecto admite una gran variedad de conjuntos de datos chinos ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 1 año

062.2K

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

Clone Voice: herramienta de clonación de voz multilingüe y sin muestras basada en xtts_v2 para Windows.

Descripción general Clone Voice es una herramienta de clonación de sonido de código abierto que proporciona una interfaz basada en web que permite a los usuarios clonar voces utilizando cualquier sonido o grabación de voz personal. La herramienta es fácil de usar, incluso sin una GPU NVIDIA, y se puede utilizar con una aplicación precompilada...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 1 año

077K

StreamingT2V: generación dinámica y escalable de texto a vídeo largo

Introducción integral StreamingT2V es un proyecto público desarrollado por el equipo de investigación en IA de Picsart centrado en generar vídeos largos coherentes, dinámicos y escalables basados en descripciones textuales. Esta tecnología utiliza un enfoque autorregresivo avanzado que garantiza la coherencia temporal del vídeo con el texto descriptivo estrechamente...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI de texto a vídeo

hace 1 año

057.8K

Text2Video-Zero：Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Generador de muestras de texto a vídeo cero lanzado por el equipo de investigación de IA de Picsart

Introducción general Text2Video-Zero es una implementación oficial de un generador de texto a vídeo de muestra cero para GitHub desarrollado por el equipo Picsart AI Research.El proyecto proporciona una forma de utilizar pistas de texto para generar texto con consistencia temporal y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI de texto a vídeo

hace 1 año

055.4K

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real

WebUI de conversión de voz basado en VITS es un marco de conversión de voz basado en VITS fácil de usar que permite la conversión de voz entre cualquier altavoz, incluyendo covers de canciones y cambios de voz en tiempo real. Tiene bajo ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 2 años

066.4K

VoiceCraft: herramienta de código abierto de clonación de voz sin muestras y conversión de texto a voz

Introducción completa VoiceCraft es una herramienta de código abierto para la edición del habla y la síntesis del habla sin muestras basada en el modelo de lenguaje del códec neural. Emplea un innovador método de generación de secuencias codificadas que permite realizar operaciones de inserción, eliminación y sustitución en secuencias de habla existentes para generar un habla editada natural y coherente....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 2 años

066.9K

edge-tts: módulo Python de conversión de texto a voz | Servicio gratuito de conversión de texto a voz

Descripción general edge-tts es un módulo Python de código abierto que permite a los usuarios utilizar el servicio de texto a voz en línea de Microsoft Edge en código Python sin necesidad del navegador Microsoft Edge, el sistema operativo Windows o la API secreta....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 2 años

0106.3K

CoAI.Dev (Chat Nio)：AI聚合应用一站式 B/C 端解决方案，支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio): solución integral de B/C para aplicaciones de agregación de IA con facturación flexible y compatibilidad con el modelo de suscripción.

Introducción general CoAI.Dev (antes Chat Nio) es una plataforma de chat que integra múltiples modelos de IA y soporta streaming distribuido, generación de imágenes, sincronización y compartición de conversaciones entre dispositivos. Implementa un sistema de facturación por suscripción y Token, servicio de tránsito de claves y múltiples...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 1 año

068.2K

ChatOllama: aplicación local de chat en tiempo real basada en Nuxt 3 y Ollama

Introducción general ChatOllama es un proyecto de aplicación de chat en línea de código abierto basado en un modelo lingüístico a gran escala (LLM), que admite numerosos modelos lingüísticos y la gestión de la base de conocimientos. Los usuarios pueden utilizar la plataforma para la gestión de modelos ( visualización de listas , descarga , eliminación ) , chatear con los modelos y otras funciones . El proyecto utiliza ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada # Recuperación de conocimientos y marco RAG

hace 2 años

058.6K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: extracción de documentos PDF y conversión a formato Markdown multimodal, compatibilidad con escaneado OCR de libros electrónicos

Introducción exhaustiva MinerU es una herramienta de extracción de datos de código abierto desarrollada por el equipo OpenDataLab del Laboratorio de Inteligencia Artificial de Shanghai, centrada en la extracción eficiente de contenido de documentos PDF, páginas web y libros electrónicos complejos. Es capaz de tomar PDF multimodales que contengan imágenes, fórmulas, tablas y otros elementos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 2 años

0138.7K

DCT-Net: una herramienta de código abierto para transformar fotos y vídeos en anime estilizado

Introducción general DCT-Net es un proyecto de código abierto desarrollado por la Academia DAMO y el Instituto Wang Xuan de Tecnología Informática de la Universidad de Pekín, cuyo objetivo es la transformación anime estilizada de imágenes. El proyecto utiliza técnicas de aprendizaje profundo a través de la Traducción Calibrada por Dominio (Domain-Calibrat...

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto # AI Estilo de conversión de vídeo

hace 1 año

060.8K

Diffusers Image Outpaint：超强开源AI图像扩展工具，图像外绘（image outpainting）

Diffusers Image Outpaint: herramienta de extensión de imagen AI de código abierto súper potente, image outpainting (pintado de imágenes)

Introducción general Diffusers Image Outpaint es una potente herramienta de expansión de imágenes AI creada por fffiloni, miembro de la comunidad Hugging Face. La herramienta utiliza técnicas avanzadas de modelado de difusión para...

Últimos recursos sobre IA # AI Ampliación y restauración de imágenes # AI Java Proyecto de código abierto

hace 2 años

065.4K

Tap4 AI WebUI: proyecto de código abierto de navegación por herramientas ligeras de IA

Introducción completa Tap4 AI WebUI es un proyecto de sitio web de navegación de herramientas de IA de código abierto, diseñado para ayudar a los usuarios a construir fácilmente su propio catálogo de herramientas de IA. El proyecto utiliza Next.js y la pila de tecnología Supabase , soporte para la optimización SEO multi-idioma para proporcionar AI...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto

hace 1 año

054.9K

CodeFormer: restauración facial de imágenes y vídeos, restauración de fotos antiguas, ofrece una versión de despliegue con un solo clic

CodeFormer Introducción general CodeFormer es un código base para la reparación robusta de rostros ciegos, desarrollado por un equipo de investigadores del S-Lab de la Universidad Tecnológica de Nanyang y presentado en NeurIPS 2022. El proyecto utiliza un transformador de búsqueda de c...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Ampliación y restauración de imágenes # AI Java Proyecto de código abierto

hace 2 años

081.1K

GFPGAN: algoritmo de reparación facial de código abierto de Tencent

Introducción exhaustiva GFPGAN (Generative Facial Prior GAN) es un algoritmo de reparación facial de código abierto desarrollado por Tencent ARC (Applied Research Center). El algoritmo utiliza un GAN facial preentrenado...

Últimos recursos sobre IA # AI Ampliación y restauración de imágenes # AI Java Proyecto de código abierto

hace 2 años

075.6K

Curiosity：使用LangGraph构建类似 Perplexity 的AI搜索工具

Curiosidad: creación de una herramienta de búsqueda AI similar a Perplexity mediante LangGraph

Introducción general Curiosity es un proyecto orientado a la exploración y experimentación, principalmente utilizando las pilas de tecnología LangGraph y FastHTML, con el objetivo de construir un producto de búsqueda similar a Perplexity AI. En el corazón del proyecto es un simple...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de búsqueda de IA

hace 2 años

050.8K

Moshi: un marco de diálogo vocal en tiempo real compatible con múltiples idiomas y acentos para modelos de base de diálogo vocal

Introducción general Moshi Chat es un asistente de voz de IA en tiempo real de Kyutai, un laboratorio francés de IA sin ánimo de lucro. No solo escucha en tiempo real, sino que también participa en conversaciones naturales y admite interacciones multimodales, incluida la capacidad de ver, oír y hablar.Moshi Ch...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

066.9K

QAnything: Sistema de preguntas y respuestas de base de conocimientos local con flujo de procesamiento RAG altamente integrado

QAnything Introducción Completa QAnything (Question and Answer based on Anything) es un sistema de preguntas y respuestas de base de conocimiento local lanzado por NetEase, que admite todo tipo de formatos de archivo y bases de datos, y se puede instalar sin conexión para utilizar...

Últimos recursos sobre IA # AI Servicios abiertos # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 2 años

067.6K

StickerBaker: Crea pegatinas personalizadas con IA

Descripción general stickerbaker es un creador de pegatinas de código abierto que utiliza tecnología de inteligencia artificial para crear una gran variedad de pegatinas interesantes. Tanto si quieres una simple pegatina de un gato como si quieres hacer una serie de pegatinas diversas, stickerbaker puede satisfacer tus necesidades....

Últimos recursos sobre IA # AI generación de imágenes en línea # AI Java Proyecto de código abierto

hace 2 años

053.7K

ALog: aplicación portátil de diario vocal con inteligencia artificial y conversión de voz a texto.

Introducción general ALog es una aplicación de diario de voz basada en IA diseñada para ayudar a los usuarios a registrar su vida diaria por voz. Está desarrollada por duxins y de código abierto en GitHub. Los usuarios pueden grabar entradas de diario a través de la entrada de voz, y la aplicación convertirá automáticamente la voz en texto ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

059.8K

OpenSPG: motor de grafos de conocimiento de código abierto

Introducción OpenSPG es un motor de grafos de conocimiento de código abierto desarrollado por Ant Group en colaboración con OpenKG, basado en el marco SPG (Semantic Augmented Programmable Graph). El motor está diseñado para proporcionar características tales como la representación semántica explícita, la definición de reglas lógicas y el marco operativo para apoyar la construcción y gestión de grafos de conocimiento de dominio...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Gráfico del conocimiento

hace 2 años

086.6K

Mem0: proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de inteligencia artificial.

Introducción general Mem0 (pronunciado "mem-zero") es un proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de IA. Recuerda las preferencias del usuario, se adapta a las necesidades individuales y mejora con el tiempo, por lo que es ideal para chatbots asistidos por el cliente, asistentes de IA y sistemas autónomos....

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

078.4K

Void: alternativa de código abierto a Cursor basada en VSCode

Introducción general Void es una alternativa de código abierto a Cursor basada en una rama del repositorio vscode. Proporciona un potente entorno de desarrollo diseñado para proporcionar a los desarrolladores una experiencia de codificación más eficiente.El objetivo de Void es mejorar continuamente su funcionalidad y estabilidad a través de las contribuciones de la comunidad y la rápida iteración....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA

hace 1 año

093.4K

Nodo GaiaNet: instale y ejecute su propio modelo local de servicio proxy en línea

Introducción general GaiaNet-AI/gaianet-node es un proyecto de código abierto que permite a los usuarios instalar rápidamente la pila de software de nodos por defecto en Mac, Linux o Windows WSL con un solo comando. Los usuarios pueden inicializar nodos, personalizar configuraciones, descargar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de modelos de gran tamaño de código abierto desplegada localmente

hace 2 años

056.5K

LlamaCoder: Genera y Publica Rápidamente Pequeñas Aplicaciones Web Usando Prompt Words

Introducción general LlamaCoder es una herramienta de generación de código abierto basada en Llama 3.1 y Together AI. Puede generar pequeñas aplicaciones con indicaciones sencillas, adecuadas para que los desarrolladores realicen rápidamente ideas.LlamaCoder proporciona...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA # AI Diseño de página

hace 1 año

067.3K

Awesome CursorRules: un conjunto de reglas para mejorar la experiencia de la IA de Cursor

Descripción General awesome-cursorrules es un proyecto dedicado a proporcionar archivos de reglas personalizadas para Cursor AI.Cursor AI es un editor de código impulsado por AI, y los archivos .cursorrules pueden...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # PROMPTS Ayudas

hace 2 años

059.5K

MathTranslate: herramienta de traducción LaTeX para artículos científicos

Introducción general MathTranslate es una herramienta en línea dedicada a la traducción de documentos LaTeX, especialmente para artículos científicos. La herramienta es capaz de mantener inalteradas las expresiones LaTeX (por ejemplo, expresiones matemáticas) y finalmente compila los documentos LaTeX en...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción # Tesis

hace 1 año

073.1K

GOT-OCR2.0: basado en el modelo OCR multimodal de extremo a extremo QWen2 0.5B

Introducción exhaustiva GOT-OCR2.0 es un modelo de reconocimiento óptico de caracteres (OCR) de código abierto co-propuesto por StepStar, cuyo objetivo es impulsar la tecnología OCR hacia OCR-2.0 mediante un modelo unificado de extremo a extremo. El modelo soporta una amplia gama de tareas de OCR, incluyendo el reconocimiento de texto normal, gr...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 2 años

064.7K

TgWechat: complemento de chat cifrado de extremo a extremo para WeChat

Introducción general tgwechat es un plugin WeChat de código abierto, desarrollado por el desarrollador dplusec. Protege la privacidad del chat de WeChat con cifrado de extremo a extremo, permitiendo a los usuarios enviar mensajes de forma segura. El proyecto se puso en marcha en GitHub el 31 de agosto de 2019 bajo una licencia GPL v3....

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

059.6K

OpenSumi Lite: IDE de interfaz puro para ver y editar código fácilmente

Introducción general OpenSumi Lite es una solución IDE front-end pura basada en el proyecto OpenSumi, diseñada para proporcionar capacidades de visualización y edición de código sin necesidad de un entorno Node.js. El proyecto es co-desarrollado por Alibaba Group y Ant Group y utiliza...

AI Respuestas # AI Java Proyecto de código abierto

hace 1 año

056.2K

FiveThirtyNine: Predecir la probabilidad de acontecimientos futuros basándose en el conocimiento de las búsquedas

Introducción general Forecast AI es una magnífica plataforma de predicción basada en tecnología avanzada de inteligencia artificial. Utiliza potentes algoritmos de análisis de datos y aprendizaje automático para proporcionar a los usuarios predicciones muy precisas sobre acontecimientos futuros. Ya se trate de elecciones políticas, tendencias económicas o acontecimientos sociales, Forecast ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de búsqueda de IA

hace 2 años

060.9K

GPT SoVITS: revolucionarias herramientas de generación y clonación de voz

Introducción general GPT-SoVITS es una herramienta de conversión y síntesis de voz de código abierto que combina el modelo GPT y la tecnología de cambio de voz SoVITS. La herramienta admite la conversión de texto a voz sobre la marcha con cero y pocas muestras, y la migración de estilo de voz con sólo 5 segundos de muestras de audio. Entre sus funciones se incluyen la ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 2 años

081.8K

Habla de pez: clonación rápida y muy precisa del habla inglesa y china con pocas muestras

Introducción general Fish Speech es una herramienta de síntesis de texto a voz (TTS) de código abierto desarrollada por Fish Audio. La herramienta se basa en tecnologías de IA de vanguardia como VQ-GAN, Llama y VITS, y es capaz de convertir texto en habla realista.Fish S...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 1 año

082.9K

IMS Toucan: herramienta de conversión de texto a voz multilingüe (compatible con más de 7000 idiomas), rápida y controlable.

Introducción general IMS Toucan es un avanzado kit de herramientas de conversión de texto a voz (TTS) desarrollado por el Instituto de Procesamiento del Lenguaje Natural (IMS) de la Universidad de Stuttgart (Alemania). El kit de herramientas es compatible con más de 7000 idiomas y es rápido, controlable y requiere pocos recursos informáticos.IMS...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

056.9K

Genera automáticamente listas diarias de productos estrella de Product Hunt

Introducción general Product Hunt Daily Chinese Hotlist es una herramienta automatizada basada en GitHub Actions que genera una lista diaria de productos populares en Product Hunt a intervalos regulares, en forma de archivo Markdown....

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

043.3K

CrisperWhisper: herramienta de transcripción literal de discursos precisos

Descripción general CrisperWhisper es una herramienta avanzada de reconocimiento de voz basada en OpenAI Whisper que se centra en la transcripción de voz rápida, precisa y palabra por palabra. Proporciona marcas de tiempo precisas a nivel de palabra, incluso con rellenos y pausas del habla....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

070K

PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.

Introducción completa PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Admite el reconocimiento de más de 80 idiomas y proporciona herramientas de anotación y síntesis de datos para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 1 año

087.2K

Deep Live Cam：开源的实时AI换脸工具，一张照片就能实现实时换脸直播

Deep Live Cam: herramienta de código abierto para el intercambio de rostros en tiempo real con IA, una foto para el intercambio de rostros en tiempo real

Introducción general Deep Live Cam es una herramienta de inteligencia artificial de código abierto diseñada para permitir la sustitución de caras en tiempo real y la generación de vídeos falsos a partir de una sola foto. Utilizando algoritmos avanzados de aprendizaje profundo, la herramienta es capaz de reemplazar caras en tiempo real durante transmisiones en directo o videollamadas, protegiendo la privacidad del usuario y añadiendo diversión...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI video face swap

hace 1 año

083.8K

NarratoAI: herramienta de narración y edición automatizada generada por texto para cine y televisión

Introducción general NarratoAI es una herramienta totalmente automatizada que integra narración de películas y vídeos, edición automatizada, doblaje y generación de subtítulos. Se basa en la tecnología de modelado lingüístico a gran escala (LLM) para generar automáticamente copias y editar automáticamente vídeos con sus correspondientes locuciones y subtítulos, proporcionando a los usuarios un...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto # AI de texto a vídeo

hace 2 años

070.9K

Babelfish.ai: aplicación de transcripción y traducción de voz en tiempo real para navegadores

Introducción general Babelfish.ai es una aplicación de transcripción y traducción en tiempo real construida sobre Huggingface Transformer.js y Supabase Realtime. La aplicación puede cargar grandes modelos en el navegador y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 2 años

051.9K

Vector Vein: plataforma de creación de flujos de trabajo de IA sin código

Introducción completa Vector Vein es una plataforma de creación de flujos de trabajo de IA sin código diseñada para ayudar a los usuarios a crear fácilmente flujos de trabajo inteligentes y automatizados. Sin necesidad de conocimientos de programación, los usuarios pueden simplemente conectar varios módulos funcionales a través de operaciones de arrastrar y soltar para construir...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Flujo de trabajo de bajo código

hace 1 año

048.9K

LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos

Introducción general LivePortrait es una herramienta avanzada de animación dinámica de retratos AI desarrollada por Racer Technology. Utiliza una innovadora tecnología de IA para transformar imágenes fijas en vívidas animaciones de vídeo. Tanto si utiliza fotos reales, estilos de animación o retratos artísticos, LivePo...

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Java Proyecto de código abierto # AI Estilo de conversión de vídeo

hace 1 año

055.7K

PhiData: creación de inteligencias artificiales con memoria, conocimientos y herramientas

Introducción general PhiData es un marco de trabajo diseñado para desarrollar asistentes de IA inteligentes. Permite a los asistentes de IA entablar conversaciones a largo plazo, proporcionar un contexto empresarial preciso y realizar diversas operaciones mediante capacidades mejoradas de memoria, integración de conocimientos e invocación de herramientas.PhiData no solo mejora los asistentes de IA....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente

hace 1 año

059.3K

ChatTTS: un modelo de generación de voz que imita la voz de una persona real hablando (paquete de aceleración ChatTTS one-click)

Introducción general ChatTTS es un modelo generativo del habla diseñado para escenarios de diálogo. Genera un habla natural y expresiva, admite varios idiomas y varios hablantes, y es adecuado para diálogos interactivos. Para ello, el modelo predice y controla con precisión características rítmicas como la risa, las pausas y las interjecciones,...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

067.6K

MoneyPrinterPlus: herramienta de IA para generar vídeos cortos con un solo clic, mezcla por lotes gratuita

Introducción completa MoneyPrinterPlus es un proyecto de código abierto destinado a generar y mezclar todo tipo de vídeos cortos con un solo clic a través de la tecnología de IA y publicarlos automáticamente en múltiples plataformas de vídeo, como Jieyin, Shutterbugs, Xiaohongshu y Video Number. La herramienta admite modelos de voz locales y basados en la nube,...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto # Herramienta de generación de vídeo AI

hace 2 años

069K

TF-ID: herramienta de reconocimiento de formularios/imágenes de documentos académicos

Introducción exhaustiva TF-ID (Table/Figure IDentifier) es una familia de modelos de detección de objetos dedicados a extraer tablas e imágenes de artículos académicos. El proyecto fue creado por Yifei Hu y es de código abierto en GitHub.El modelo TF-ID fue desarrollado por...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

052.8K

Chatbot UI: una aplicación de chat con inteligencia artificial de código abierto que imita la interfaz y las funciones de ChatGPT.

Introducción general Chatbot UI es un proyecto de código abierto diseñado para ayudar a los desarrolladores a crear interfaces conversacionales personalizadas e inteligentes. El proyecto proporciona una serie de componentes de interfaz y funciones interactivas que pueden integrarse fácilmente en el sistema Chatbot existente para ofrecer a los usuarios un cuerpo de diálogo más fluido e inteligente....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

0103.6K

GLIGEN GUI: control preciso de la posición de los elementos de la imagen, interfaz gráfica intuitiva basada en ComfyUI

Introducción general GLIGEN GUI es una interfaz gráfica intuitiva basada en ComfyUI, diseñada para simplificar el uso del modelo GLIGEN, un novedoso modelo texto-imagen que permite especificar con precisión la posición de los objetos en una imagen. Con GLIGE...

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # AI Java Proyecto de código abierto

hace 2 años

051.2K

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 2 años

062.4K

FaceFusion: Video Face Swap Enhancement Tool | Voice Sync Video Mouth Moves

Descripción general FaceFusion es una plataforma en la nube de última generación con intercambio y mejora facial integrados, optimizada para el intercambio de imagen a vídeo e imagen a imagen, con 5 modelos profesionales para garantizar un resultado impecable. Además, realiza la mejora facial con 7 modelos utilizando 3...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI video face swap

hace 1 año

0151.1K

Kotaemon: una herramienta multimodal de código abierto para cuestionarios sobre documentos, fácil de implantar

Introducción general Kotaemon es una herramienta de código abierto de preguntas y respuestas sobre documentos diseñada para proporcionar a los usuarios finales y a los desarrolladores una funcionalidad de preguntas y respuestas basada en la Generación Aumentada de Recuperación (RAG). El proyecto fue desarrollado por Cinnamon y soporta una variedad de proveedores de API LLM (por ejemplo, OpenA...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Gráfico del conocimiento # Recuperación de conocimientos y marco RAG

hace 2 años

071.7K

HivisionIDPhotos: herramienta de código abierto para la creación de documentos de identidad inteligentes con IA

Introducción completa HivisionIDPhotos es una herramienta de producción de fotos de documentos AI ligera de código abierto, puede identificar de forma inteligente la escena de la foto del usuario y la clave, para generar una foto de documento estándar en línea con una variedad de especificaciones. La herramienta soporta colores de fondo y tamaños personalizados, y en el futuro también lanzará...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Teclado AI para cambiar fondos

hace 2 años

056.8K

Marker: herramientas de código abierto para convertir rápidamente PDF a Markdown

Introducción general Marker es una herramienta de procesamiento de documentos basada en aprendizaje profundo diseñada para convertir archivos PDF a formato Markdown de forma rápida y precisa. Es compatible con una amplia gama de tipos de documentos y está especialmente optimizado para la conversión de libros y artículos científicos.Marker es capaz de eliminar los encabezados...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 1 año

0124.6K

SadTalker: Haz Hablar a las Fotos | Audio Sincronizado con la Boca | Vídeo Sincronizado con la Boca Sintetizado | Gente Digital Gratis

Introducción general SadTalker es una herramienta de código abierto que combina una única foto de retrato estática con un archivo de audio para crear vídeos de avatares parlantes realistas para una amplia gama de escenarios, como mensajes personalizados, contenido educativo y mucho más. Utiliza de forma revolucionaria tecnologías de modelado 3D como ExpNet y PoseVA...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Digital Man Sincronización de puertos #

hace 1 año

069.4K

VideoReTalking: sistema de sincronización labial y edición de vídeo basado en audio

Introducción general VideoReTalking es un sistema innovador que permite al usuario generar vídeos faciales sincronizados con los labios a partir del audio de entrada, produciendo vídeos de salida de alta calidad y sincronizados con los labios incluso con diferentes emociones. El sistema divide este objetivo en tres tareas consecutivas: con expresiones típicas...

Últimos recursos sobre IA # AI Java Proyecto de código abierto Sincronización de puertos #

hace 1 año

054.5K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Marco completo de generación de vídeo humano digital | Retrato a vídeo | Pose a vídeo | Sincronización de labios

Introducción general MuseV es un proyecto público en GitHub cuyo objetivo es la generación de vídeo avatar de longitud ilimitada y alta fidelidad. Se basa en la tecnología de difusión y proporciona Image2Video, Text2Image2Video, Video2Video...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Digital Man Sincronización de puertos #

hace 1 año

086.4K

No estructurados: preprocesamiento de documentos no estructurados de código abierto, herramientas de tratamiento de datos no estructurados

Introducción completa Unstructured-IO proporciona un conjunto de componentes de código abierto para el procesamiento y preprocesamiento de imágenes y documentos de texto como PDF, HTML, documentos de Word, etc. Su principal objetivo es simplificar y optimizar los flujos de trabajo de procesamiento de datos, especialmente para grandes modelos de lenguaje (LL...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 2 años

072.5K

magic-html：从HTML网址中提取主体数据，输出纯文本/markdown

magic-html: extrae los datos del cuerpo de una URL HTML, salida texto plano/markdown

Introducción general magic-html es una biblioteca de Python diseñada para simplificar el proceso de extracción del contenido de la región del cuerpo a partir de HTML. Tanto si se trata de estructuras HTML complejas como de páginas web sencillas, esta biblioteca pretende proporcionar una interfaz cómoda y eficiente a los usuarios. Soporta la extracción multimodal...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

054.2K

WebPilot: herramienta inteligente de procesamiento de información web, API gratuita para la captura de contenidos web

WebPilot Introducción general Webpilot es un "asistente web" gratuito y de código abierto que le permite comunicarse libremente con cualquier página web o realizar tareas automatizadas. No es necesario cambiar de página o copiar y pegar, basta con seleccionar texto o introducir comandos, webpilot...

Últimos recursos sobre IA # AI Servicios abiertos # AI Java Proyecto de código abierto # Herramienta de búsqueda de IA

hace 2 años

063K

DB-GPT: Creación de un marco de desarrollo de aplicaciones de datos nativas de IA que integra la gestión multimodelo y el procesamiento inteligente de datos

Introducción general DB-GPT es un marco de desarrollo de aplicaciones de datos nativas de IA de código abierto construido utilizando AWEL (Agentic Workflow Expression Language) y tecnologías de cuerpo inteligente. El proyecto pretende crear una infraestructura en el ámbito de los grandes modelos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Análisis de datos de IA # Recuperación de conocimientos y marco RAG

hace 1 año

053.5K

DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

DreamTalk Introducción DreamTalk es un marco de generación de cabezas parlantes basado en modelos de difusión y expresión desarrollado conjuntamente por la Universidad Tsinghua, Alibaba Group y la Universidad Huazhong de Ciencia y Tecnología. Consta principalmente de tres partes: una red de reducción de ruido, un experto en labios consciente del estilo y un predictor de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Digital Man Sincronización de puertos #

hace 1 año

070.4K

InstantID: cargue una imagen y migre las funciones de retrato para generar diferentes estilos de imágenes

Introducción completa InstantID es una tecnología avanzada centrada en la generación de imágenes con estilos o poses personalizados en cuestión de segundos, al tiempo que garantiza un alto nivel de fidelidad utilizando una única imagen de identificación de referencia. La tecnología utiliza una solución basada en un modelo de difusión mediante la integración de imágenes faciales, mapas de puntos de referencia...

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto # AI Cambia la cara y vístete

hace 2 años

077.4K

ComfyUI Portrait Master 中文版：优化肖像生成的提示词工具

ComfyUI Portrait Master versión china: Herramienta de palabras clave para optimizar la generación de retratos

Introducción General ComfyUI Portrait Master versión China es una herramienta de generación de palabras clave para retratos diseñada para creadores de imágenes AI. La herramienta ayuda a los usuarios a generar retratos de alta calidad mediante la optimización de las palabras clave. Los usuarios pueden elegir diferentes lentes según la demanda...

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # AI Java Proyecto de código abierto # ComfyUI

hace 2 años

056.1K

IOPaint: Herramienta polivalente de tratamiento de imágenes AI, borrado, ampliación, sustitución de elementos y dibujo de texto.

Introducción general IOPaint es una herramienta de procesamiento de imágenes de IA gratuita y de código abierto que permite borrar, reparar y ampliar imágenes. Utiliza modelos de IA de última generación para ayudar a los usuarios a eliminar fácilmente objetos no deseados de las imágenes, reparar defectos, añadir nuevos contenidos e incluso expandir imágenes.IOPa...

Últimos recursos sobre IA # AI Ampliación y restauración de imágenes # AI Java Proyecto de código abierto # Teclado AI para cambiar fondos

hace 1 año

0107.5K

Más información