Proyecto AI de código abierto

Total 1020 artículos

ordenar

Servicio MCP para leer y modificar diseños Figma utilizando Cursor.

Introducción General Cursor Talk to Figma MCP es un proyecto de código abierto que conecta la herramienta de programación de IA Cursor con el software de diseño Figm...

hace 1 año

095.1K

FinRobot: un organismo inteligente para mejorar la eficacia del análisis de datos financieros y la investigación de inversiones

Introducción exhaustiva FinRobot es una plataforma de inteligencia de IA de código abierto desarrollada por AI4Finance Foundation y diseñada para el análisis financiero. No solo abarca los modelos lingüísticos tradicionales, sino que también incorpora diversas tecnologías de IA, con el objetivo de ofrecer una solución integral para el sector financiero.F...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Análisis de datos financieros

hace 1 año

095K

RoomGPT: ¡Sube una foto de una habitación y rediseña su diseño con IA!

Introducción general RoomGPT es un proyecto de código abierto desarrollado por el usuario de GitHub Nutlope que permite a los usuarios subir fotos de habitaciones y generar versiones rediseñadas de las mismas utilizando tecnología de inteligencia artificial. El objetivo del proyecto es ofrecer a los usuarios acceso a un diseño de interiores profesional sin tener que pagar...

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto

hace 2 años

095K

LangBot：开源大模型即时通信机器人，支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: robot de mensajería instantánea de código abierto de modelo grande, compatible con múltiples WeChat, QQ, Flybook y otros despliegues multiplataforma de robots de IA.

LangBot es una plataforma bot de mensajería instantánea basada en modelos de gran tamaño que admite múltiples plataformas de mensajería y modelos de gran tamaño. La plataforma se adapta a QQ, WeChat (WeChat empresarial, WeChat personal), Flybook, Discord, OneBot y otras plataformas de mensajería, y es compatible con Open...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

095K

Markdownify MCP Server：基于MCP协议将各种内容转换为Markdown格式

Servidor MCP de Markdownify: convierte diversos contenidos al formato Markdown basado en el protocolo MCP.

Introducción general Markdownify MCP Server es una herramienta de código abierto basada en el Model Context Protocol, alojada en GitHub por el desarrollador Zach Caceres ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto Servicios MCP ## Extracción y limpieza de documentos

hace 1 año

095K

Kotaemon: una herramienta multimodal de código abierto para cuestionarios sobre documentos, fácil de implantar

Introducción general Kotaemon es una herramienta de código abierto de preguntas y respuestas sobre documentos diseñada para proporcionar a los usuarios finales y a los desarrolladores una funcionalidad de preguntas y respuestas basada en la Generación Aumentada de Recuperación (RAG). El proyecto fue desarrollado por Cinnamon y soporta una variedad de proveedores de API LLM (por ejemplo, OpenA...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Gráfico del conocimiento # Recuperación de conocimientos y marco RAG

hace 2 años

094.7K

Aide: extensión de ayuda de IA que mejora la experiencia de desarrollo de VSCode, la anotación con un solo clic, la conversión y la generación de interfaz de usuario de código.

Introducción general AIDE (AI-assisted Development Extension) es una potente extensión de desarrollo asistido por IA para VSCode, centrada en proporcionar una asistencia de programación de IA única y útil. Es diferente de GitHu...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA

hace 2 años

094.6K

AnyText: Genera y edita texto de imagen multilingüe, altamente controlable para generar múltiples líneas de chino en la imagen.

Introducción AnyText es una revolucionaria herramienta de generación y edición de texto visual multilingüe desarrollada a partir del modelo de difusión. Genera texto multilingüe natural y de alta calidad en imágenes y admite funciones flexibles de edición de texto. Fue desarrollada por un equipo de investigadores y presentada en ICLR 2024....

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # AI Control de estilo de imagen # AI Java Proyecto de código abierto

hace 2 años

094.6K

Flying Paddle PP-TableMagic: extracción de información estructurada para tablas complejas

El objetivo del reconocimiento de tablas es analizar tablas en imágenes, identificar con precisión las estructuras de las tablas y la ubicación de las celdas, y reducirlas a formatos de tabla estructurados (por ejemplo, HTML). En la actual era de la información, una gran cantidad de datos tabulares importantes sigue existiendo en estado no estructurado (por ejemplo, documentos escaneados con imágenes de tablas estadísticas...).

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 1 año

094.6K

TxAgent: una herramienta de IA para ayudar a los médicos a analizar los efectos de los medicamentos y las opciones de tratamiento

Introducción completa TxAgent es una herramienta de IA de código abierto desarrollada por el Equipo de Inteligencia Artificial Médica y Científica (MIMS) de la Universidad de Harvard para ayudar a los médicos a analizar las interacciones entre medicamentos y elaborar planes de tratamiento personalizados. Combina situaciones específicas de cada paciente mediante el razonamiento en varios pasos y la recuperación en tiempo real de conocimientos biomédicos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente

hace 1 año

094.6K

PandasAI: una plataforma de diálogo de análisis de datos para consultas de datos y generación de gráficos en lenguaje natural

Introducción general PandasAI es una plataforma de código abierto basada en Python diseñada para simplificar el proceso de análisis de datos mediante técnicas de procesamiento del lenguaje natural. Permite a los usuarios trabajar en un diálogo con bases de datos (por ejemplo, SQL, CSV, pandas, polars, mongodb, n...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Análisis de datos de IA

hace 2 años

094.5K

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI # Producto interactivo multimodal en tiempo real

hace 2 años

094.4K

Eko: flujos de trabajo corporales inteligentes basados en lenguaje natural para la automatización de escritorios y navegadores

Introducción general Eko es un marco JavaScript de nivel de producción diseñado para construir flujos de trabajo de agentes inteligentes eficientes mediante descripciones en lenguaje natural. Está diseñado para permitir a los desarrolladores automatizar tareas cotidianas utilizando tecnologías de IA sin necesidad de programac...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Flujo de trabajo de bajo código # Aplicación de carrocería inteligente

hace 1 año

094.2K

R1-V: Aprendizaje por refuerzo de bajo coste para la capacidad de generalización de modelos de lenguaje visual

Introducción exhaustiva R1-V es un proyecto de código abierto cuyo objetivo es lograr avances en el modelado del lenguaje visual (VLM) mediante el aprendizaje por refuerzo (RL) de bajo coste. El proyecto utiliza mecanismos de recompensa verificables para motivar a los VLM a aprender habilidades genéricas de conteo. Sorprendentemente, R1-V's 2B ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

094.2K

HyperChat: un cliente de diálogo con IA que utiliza la inteligencia MCP para realizar tareas complejas.

Introducción general HyperChat es un cliente de chat de código abierto desarrollado por BigSweetPotatoStudio y alojado en GitHub, diseñado para proporcionar una visión global del modelo lingüístico de BigSweetPotatoStudio mediante la integración de API de varios grandes modelos lingüísticos (LLM) como OpenAI, Cla...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada # Aplicación de carrocería inteligente

hace 1 año

094.1K

AutoAgent: un marco para crear y desplegar rápidamente inteligencias de IA a través del lenguaje natural

Introducción general AutoAgent es un marco de inteligencias de IA de código abierto desarrollado por el Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong (HKUDS) y alojado en GitHub.Permite a los usuarios crear y desplegar rápidamente inteligencias de IA personalizadas describiendo sus requisitos en lenguaje puramente natural, sin ninguna base de programación....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Sin desarrollo de código # Marco de desarrollo del cuerpo inteligente

hace 1 año

094.1K

uni-api：轻量大模型API转换为OpenAI接口，YAML文件配置API渠道

uni-api: big model API ligera convertida en interfaz OpenAI, archivo YAML para configurar el canal API

Introducción completa No front-end , pura configuración de archivos de configuración del canal API . Sólo tienes que escribir un archivo puede ejecutar una estación de API de su propia , el documento tiene una guía de configuración detallada , blanco amigable. uni-api es una gestión unificada de gran proyecto API modelo , lo que permite una ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

094.1K

openapi-mcp-server: permite a la IA invocar directamente servicios MCP con API abiertas.

Introducción general openapi-mcp-server es una herramienta de código abierto diseñada para convertir APIs compatibles con OpenAPI v3.1 en recursos utilizables por AI. Está mantenida por janwilmake y se basa en el Modelo Contex...

Últimos recursos sobre IA # AI Java Proyecto de código abierto Servicios MCP #

hace 1 año

094K

VideoRAG: un marco RAG para la comprensión de vídeos ultralargos con soporte para la recuperación multimodal y la construcción de grafos de conocimiento

Introducción VideoRAG es un marco generativo de recuperación mejorado diseñado para procesar y comprender vídeos contextuales muy largos. La herramienta combina una base de conocimiento textual basada en grafos con la codificación jerárquica multimodal del contexto para procesar eficientemente en una sola GPU NVIDIA RTX 3090....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 1 año

094K

Perplexica：1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: un motor de búsqueda de IA de código abierto que reproduce 1 a 1 las características y la interfaz de Perplexity AI.

Introducción general Perplexica es un motor de búsqueda de código abierto basado en IA diseñado para proporcionar respuestas que profundizan en Internet. Utiliza algoritmos avanzados de aprendizaje automático, como la búsqueda por similitud y técnicas de incrustación, para optimizar los resultados de búsqueda y ofrecer respuestas claras con fuentes citadas.Perple...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de búsqueda de IA

hace 2 años

093.9K

Genesis: motor de física generativa de código abierto para la simulación de mundos dinámicos en 4D basados en la física real.

Introducción general Genesis es un mundo de física generativa diseñado para la robótica de propósito general y el aprendizaje de IA personificada. Proporciona una plataforma de simulación unificada que admite la simulación de una amplia gama de materiales y fenómenos físicos.Genesis tiene como objetivo desbloquear la IA generativa y la simulación física mediante la combinación...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Texto e Imagen a 3D

hace 2 años

093.8K

InfiniteYou: una herramienta de generación y edición de fotos que conserva los rasgos faciales

Introducción general InfiniteYou es un proyecto de código abierto desarrollado por el equipo de ByteDance Intelligent Creation. Se basa en la tecnología de Transformadores de Difusión (DiTs), utilizando el modelo FLUX.1-dev, la función principal es permitir a los usuarios subir una foto e introducir una descripción de texto, generando...

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto

hace 1 año

093.8K

Herramienta de código abierto para la conversión de voz a texto en tiempo real

Introducción general realtime-transcription-fastrtc es un proyecto de código abierto centrado en la conversión de voz a texto en tiempo real. Utiliza la tecnología FastRTC para procesar flujos de audio de baja latencia , combinada con un modelo Whisper local para lograr una eficiente...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

093.6K

LM Speed: Pruebas rápidas de rendimiento de API de modelos grandes

Introducción general LM Speed es una herramienta diseñada específicamente para desarrolladores de IA, y también está disponible como servicio en línea en lmspeed.net Su función principal es probar y analizar el rendimiento de las API de modelos lingüísticos, ayudando a los usuarios a identificar rápidamente los cuellos de botella de velocidad y optimizar las estrategias de llamada. Esta...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

093.5K

OpenAOE: Estructura de chat en grupo con modelos de gran tamaño: chatear con varios modelos lingüísticos de gran tamaño simultáneamente

Introducción general OpenAOE es un marco de chat de grupo de grandes modelos de código abierto, cuyo objetivo es resolver el problema de la falta de marcos de chat en el mercado actual con múltiples modelos respondiendo en paralelo. Con OpenAOE, los usuarios pueden hablar con múltiples Large Language Models (LLMs) al mismo tiempo y obtener una salida paralela. El marco soporta ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto Plataforma de diálogo multimodelo integrada # AI

hace 1 año

093.4K

Morphik Core: una plataforma RAG de código abierto para el tratamiento de datos multimodales

Introducción general Morphik Core es un proyecto de código abierto desarrollado por el equipo morphik-org y alojado en GitHub. Antes se llamaba DataBridge Core, pero ahora se llama Morphik Core.Este...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 1 año

093.4K

MegaParse：解析各类型文档为LLM可用数据，完整保留文档中的表格、图片等所有信息

MegaParse: analiza cada tipo de documento en datos disponibles en LLM, conservando toda la información del documento, como tablas e imágenes, en su totalidad.

Introducción general MegaParse es una potente y versátil herramienta de análisis sintáctico de documentos diseñada para optimizar el procesamiento de datos para el Large Language Model (LLM). Tanto si trabaja con texto, PDF, presentaciones de PowerPoint o documentos de Word, MegaParse...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 2 años

093.3K

AI Chatbot Supabase：开源的Next.js和Supabase构建的AI聊天机器人，快速部署到Vercel。

AI Chatbot Supabase: código abierto Next.js y Supabase construyeron AI chatbot para un rápido despliegue en Vercel.

Introducción general AI Chatbot Supabase es una plantilla de chatbot AI de código abierto construida sobre Next.js y Supabase. Desarrollado por Vercel, el proyecto tiene como objetivo proporcionar una solución de chatbot totalmente funcional y personalizable. Por ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 2 años

093.3K

LlamaCoder: Genera y Publica Rápidamente Pequeñas Aplicaciones Web Usando Prompt Words

Introducción general LlamaCoder es una herramienta de generación de código abierto basada en Llama 3.1 y Together AI. Puede generar pequeñas aplicaciones con indicaciones sencillas, adecuadas para que los desarrolladores realicen rápidamente ideas.LlamaCoder proporciona...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA # AI Diseño de página

hace 2 años

093.2K

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 1 año

093.2K

Oliva: un asistente de búsqueda de productos con inteligencia múltiple controlado por voz

Introducción general Oliva es una herramienta de asistente multi-inteligencia de código abierto desarrollada por Deluxer en GitHub. Ayuda a los usuarios a buscar información sobre productos en la base de datos Qdrant mediante la colaboración de múltiples inteligencias IA. Su principal característica es que soporta la operación por voz....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente # Recuperación de conocimientos y marco RAG

hace 1 año

093.2K

X-Kit: rastreo de datos de Twitter y análisis de datos de usuarios X y tweets

Introducción general X-Kit es una herramienta de código abierto diseñada para rastrear y analizar datos y tweets de usuarios de X (antes Twitter). Desarrollada por el usuario de GitHub xiaoxiunique, la herramienta está diseñada para ayudar a los usuarios a automatizar el proceso de obtención de información básica y tweets sobre un determinado usuario de X y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

093.2K

CapsWriter-Offline: Herramienta de entrada de voz y transcripción de subtítulos para PC

Introducción general CapsWriter-Offline es una herramienta de entrada de voz y transcripción de subtítulos para PC, alojada en GitHub y creada por el desarrollador HaujetZhao. Se ejecuta completamente fuera de línea y no requiere una conexión a Internet para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 1 año

093.1K

MyCoder: Herramienta de IA de línea de comandos para corregir código y generar casos de prueba automáticamente

Introducción general MyCoder es un proyecto de código abierto desarrollado por el equipo drivecore y alojado en GitHub, cuyo objetivo es proporcionar a los desarrolladores asistencia de programación inteligente a través de una interfaz de línea de comandos. Se basa en la tecnología Claude AP...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA

hace 1 año

093.1K

修复无效JSON字符串，解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Corrige las cadenas JSON no válidas y resuelve posibles errores de formato en los datos JSON generados por los LLM.

Descripción general Un módulo para reparar archivos JSON no válidos, especialmente para analizar datos JSON incorrectos generados por Large Language Models (LLMs). El módulo corrige errores comunes de sintaxis JSON, como la falta de comillas, comas incorrectas, caracteres sin...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

093.1K

Vercel AI SDK: creación de aplicaciones basadas en IA con los marcos de trabajo frontales más conocidos

Introducción general Vercel AI SDK es una herramienta de código abierto desarrollada por el equipo de Vercel para ayudar a los desarrolladores a crear aplicaciones de IA utilizando marcos como React, Svelte, Vue y Solid. Soporta múltiples proveedores de modelos de lenguaje...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

093.1K

Tarsier: un modelo de comprensión de vídeo de código abierto para generar descripciones de vídeo de alta calidad

Introducción general Tarsier es una familia de modelos de videolenguaje de código abierto desarrollada por ByteDance para generar descripciones de vídeo de alta calidad. Consta de una estructura sencilla: el CLIP-ViT procesa los fotogramas de vídeo, combinado con un Large Language Model (LLM) para analizar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

093K

DeepClaude：融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude: una interfaz de chat que fusiona el razonamiento en cadena R1 de DeepSeek con la creatividad de Claude

Introducción exhaustiva DeepClaude es una API de inferencia e interfaz de chat de alto rendimiento de Large Language Model (LLM) que integra las capacidades de inferencia encadenada (CoT) de DeepSeek R1 con la creatividad y generación de código del modelo antrópico Claude....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

093K

Kolors: modelo texto-imagen para generar imágenes de alta calidad, con soporte para generar carteles chinos

Introducción exhaustiva Kolors es un modelo de generación de texto a imagen a gran escala desarrollado por el equipo Racer, basado en técnicas de difusión de potencial. El modelo se ha entrenado con miles de millones de pares de datos de texto-imagen y es capaz de generar imágenes complejas de alta calidad y precisión semántica con soporte para entradas en chino e inglés.Kolors en calidad visual...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Herramienta de generación de imágenes de autodespliegue

hace 2 años

092.9K

AgentGPT: un proyecto de código abierto para crear y ejecutar inteligencias artificiales automatizadas

Introducción general AgentGPT es un proyecto de código abierto desarrollado por el equipo Reworkd y alojado en GitHub, diseñado para permitir a los usuarios crear, configurar y desplegar de forma autónoma inteligencias AI a través de un navegador. Los usuarios simplemente establecen un objetivo, y AgentGPT puede...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

092.9K

Probly: una herramienta tabular de código abierto para que la IA analice datos y genere gráficos

Introducción Probly es una herramienta de hoja de cálculo desarrollada por el equipo PragmaticMachineLearning y de código abierto en GitHub que combina la funcionalidad de las hojas de cálculo tradicionales con potentes capacidades de análisis de datos de IA. No sólo admite el uso de ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Análisis de datos de IA

hace 1 año

092.9K

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 1 año

092.8K

AI2SRT: Creación de vídeos narrados breves o resúmenes de vídeos largos en un solo clic mediante modelos Gemini

Introducción general AI2SRT es un proyecto de código abierto que utiliza el gran modelo GeminiAI para generar vídeos narrados cortos y resúmenes de vídeo para vídeos largos con un solo clic, a la vez que admite subtítulos de transcripción de audio y vídeo. El proyecto pretende simplificar el proceso de creación de contenidos de vídeo y proporcionar funciones eficaces de generación y traducción de subtítulos. Los usuarios pueden pasar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI editor de audio/vídeo

hace 2 años

092.8K

Uso de ordenadores abiertos E2B: ejecución segura de un sistema operativo de inteligencia artificial en el espacio aislado E2B

Introducción general E2B Open Computer Use es un proyecto de código abierto cuyo objetivo es proporcionar una experiencia segura de uso de ordenadores Linux basada en la nube a través de E2B Desktop Sandbox.E2B Sandbox proporciona un entorno gráfico de escritorio que los usuarios...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Inteligencia de automatización de escritorio

hace 2 años

092.8K

MockingBird：快速克隆声音与模型训练，基于 xtts v2 实现的文本转语音

MockingBird: clonación de voz rápida y formación de modelos, conversión de texto a voz basada en xtts v2

Introducción completa MockingBird es un proyecto de código abierto que pretende conseguir una rápida clonación de voz y conversión de texto a voz mediante tecnología de IA. Los usuarios sólo tienen que proporcionar 5 segundos de muestras de voz, puede generar cualquier contenido de voz. El proyecto admite una gran variedad de conjuntos de datos chinos ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 2 años

092.7K

LazyLLM: herramienta de desarrollo de código abierto de Shangtang para crear aplicaciones corporales multiinteligentes

Introducción exhaustiva LazyLLM es una herramienta de código abierto desarrollada por el equipo LazyAGI, centrada en simplificar el proceso de desarrollo de aplicaciones de grandes modelos de inteligencia múltiple. Ayuda a los desarrolladores a construir rápidamente aplicaciones complejas de IA a través de la implementación con un solo clic y mecanismos de puerta de enlace ligeros, ahorrando la tediosa configuración de ingeniería....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

092.7K

Orate: una API unificada para integrar la generación de voz bien conocida, la transcripción de voz y el modelado de voz

Introducción general Orate es un conjunto de herramientas de IA centrado en la generación y transcripción de voz. Proporciona una API unificada que se integra a la perfección con los principales proveedores de IA, como OpenAI, ElevenLabs y AssemblyAI, para ayudar a...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # AI Voz a texto

hace 2 años

092.7K

Implementación de la api gratuita de hugging face en cloudflare para soportar el reenvío de interfaces

Debido a que el despliegue doméstico no puede acceder a abrazar la cara, por lo que en el programa de despliegue de gran hermano basado en la transformación para poder desplegar a los trabajadores cloudflare. Preparación 1, cloudflare registro 2, abrazar fac...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Libre Modelo Grande API

hace 2 años

092.7K

OmniGen: un modelo unificado de generación de imágenes con entradas multimodales para generar imágenes coherentes con los caracteres

Introducción general OmniGen es un modelo "universal" de generación de imágenes desarrollado por VectorSpaceLab que permite a los usuarios crear efectos visuales diversos y contextualmente ricos con simples indicaciones de texto o entradas multimodales. Es especialmente adecuado para aplicaciones que necesitan reconocer...

Últimos recursos sobre IA # AI generación de imágenes en línea # AI Java Proyecto de código abierto

hace 2 años

092.7K

TheoremExplainAgent：利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Genera vídeos explicativos de matemáticas animados de más de 5 minutos con Manim

Introducción general TheoremExplainAgent es un proyecto innovador desarrollado por TIGER AI Lab para transformar complejos teoremas matemáticos y científicos en animaciones de vídeo fáciles de entender utilizando técnicas de inteligencia artificial. La herramienta se basa en el Large Language Model (LLM...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Herramientas educativas

hace 1 año

092.6K

PhotoDoodle: herramienta de AI para añadir garabatos artísticos a fotos con comandos de texto

Introducción general PhotoDoodle es una herramienta de edición de imágenes de código abierto, desarrollada por ShowLab, centrada en la edición artística de fotos mediante tecnología de inteligencia artificial. Los usuarios pueden añadir un estilo de dibujos animados, efecto 3D, luz a fotos reales con sólo escribir...

Últimos recursos sobre IA # Editor de imágenes AI # AI Java Proyecto de código abierto

hace 1 año

092.6K

Devika: inteligencia artificial de código abierto que comprende, divide instrucciones en subtareas y escribe código

Introducción general Devika es un ingeniero de software de IA avanzada que entiende instrucciones humanas de alto nivel, las descompone en pasos, estudia la información relevante y escribe código para lograr un objetivo determinado. Desarrolla software de forma inteligente utilizando modelos lingüísticos a gran escala, algoritmos de planificación y razonamiento y capacidades de navegación web.D...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA # Aplicación de carrocería inteligente

hace 1 año

092.5K

ell: Marco de ingeniería de palabras con claves funcionales ligeras

Introducción general ell es una biblioteca de programación de modelos de lenguaje funcional ligero desarrollada por el antiguo investigador de OpenAI William Guss. Está diseñada con la idea de tratar las claves como programas, no sólo como cadenas. ell proporciona control de versiones y serialización automatizados....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # PROMPTS Ayudas

hace 1 año

092.5K

MarkItDown: Herramienta de conversión inteligente de documentos de Microsoft para convertir varios archivos al formato Markdown

Introducción general MarkItDown es una herramienta Python desarrollada por Microsoft diseñada para convertir diversos archivos y documentos ofimáticos al formato Markdown. La herramienta admite una amplia gama de tipos de archivo, como PDF, PowerPoint, Word, Excel, diagramas...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 2 años

092.4K

QAnything: Sistema de preguntas y respuestas de base de conocimientos local con flujo de procesamiento RAG altamente integrado

QAnything Introducción Completa QAnything (Question and Answer based on Anything) es un sistema de preguntas y respuestas de base de conocimiento local lanzado por NetEase, que admite todo tipo de formatos de archivo y bases de datos, y se puede instalar sin conexión para utilizar...

Últimos recursos sobre IA # AI Servicios abiertos # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 2 años

092.4K

Weebo: un chatbot de voz en tiempo real que ofrece una experiencia de diálogo en lenguaje natural

Introducción general Weebo es un chatbot de voz en tiempo real de código abierto que utiliza Whisper Small para el reconocimiento de voz, Llama 3.2 para la generación de lenguaje natural y Kokoro-82M para la síntesis de voz. El proyecto fue desarrollado por Aman...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Producto interactivo multimodal en tiempo real

hace 2 años

092.4K

PantoMatrix（EMAGE）：全身手势生成框架，从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): marco de generación de gestos de cuerpo entero, marco de animación 3D para generar gestos de cuerpo entero a partir de audio.

Introducción exhaustiva PantoMatrix es un marco avanzado de generación de gestos de cuerpo completo capaz de generar movimientos humanos completos a partir de audio y gestos parciales, incluidos movimientos faciales, corporales parciales, de manos y de cuerpo completo. El marco utiliza los últimos conjuntos de datos multimodales y técnicas de aprendizaje profundo para proporcionar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

092.4K

NodeRAG: una herramienta basada en grafos heterogéneos para la recuperación y generación de información precisa

Una introducción completa NodeRAG es un sistema de código abierto de Generación Aumentada de Recuperación (RAG) alojado en GitHub y desarrollado por Terry-Xu-666. Optimiza la recuperación y generación de información a través de estructuras de grafos heterogéneos, mejorando significativamente la precisión de la recuperación y la relevancia contextual.Nod...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 1 año

092.4K

Langui: una biblioteca de código abierto de componentes de interfaz de usuario de IA

Introducción general Langui de LangbaseInc es una biblioteca de componentes de interfaz de usuario de código abierto diseñada para proyectos de IA generativa y modelado de grandes lenguajes (LLM). La biblioteca se basa en Tailwind CSS y proporciona una colección de componentes de interfaz de usuario...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Diseño de página

hace 2 años

092.3K

Flow (Laminar): un motor de tareas ligero para construir inteligencias que simplifica y gestiona con flexibilidad las tareas.

Introducción general Flow es un motor de tareas ligero diseñado para construir agentes de IA con un énfasis en la simplicidad y la flexibilidad. A diferencia de los flujos de trabajo tradicionales basados en nodos y bordes, Flow utiliza un sistema dinámico de colas de tareas que admite la ejecución paralela, la programación dinámica y la gestión inteligente de dependencias. Su concepto central es ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Flujo de trabajo de bajo código

hace 2 años

092.2K

Memary: un proyecto de código abierto para mejorar la memoria a largo plazo del Agente mediante grafos de conocimiento

Introducción general Memary es un innovador proyecto de código abierto centrado en proporcionar soluciones de gestión de memoria a largo plazo para inteligencias autónomas. El proyecto ayuda a las inteligencias a superar las limitaciones de las ventanas contextuales tradicionales para lograr experiencias de interacción más inteligentes mediante grafos de conocimiento y módulos de memoria especializados.Memary adopta...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente # Gráfico del conocimiento

hace 2 años

092.1K

Gemini Cursor：基于Gemini构建的AI桌面智能助手，能看、能听、能说

Gemini Cursor: un asistente inteligente de sobremesa basado en Gemini que puede ver, oír y hablar.

Introducción general Gemini Cursor es un asistente inteligente de escritorio basado en el modelo Gemini 2.0 Flash (experimental) de Google. Permite interacciones visuales, auditivas y de voz a través de una API multimodal, proporcionando un uso en tiempo real de baja latencia....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Producto interactivo multimodal en tiempo real

hace 1 año

092.1K

VoiceCraft: herramienta de código abierto de clonación de voz sin muestras y conversión de texto a voz

Introducción completa VoiceCraft es una herramienta de código abierto para la edición del habla y la síntesis del habla sin muestras basada en el modelo de lenguaje del códec neural. Emplea un innovador método de generación de secuencias codificadas que permite realizar operaciones de inserción, eliminación y sustitución en secuencias de habla existentes para generar un habla editada natural y coherente....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 2 años

092K

ANP: un protocolo de código abierto para la comunicación segura y eficiente entre agentes inteligentes

Introducción general AgentNetworkProtocol (ANP para abreviar) es un proyecto de protocolo de código abierto, alojado en GitHub, centrado en proporcionar soluciones de comunicación seguras y eficientes para agentes inteligentes (AI Agents). Funciona mediante una arquitectura de tres capas: identidad y cifrado...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

091.9K

FlashMLA：优化Hopper GPU的MLA解码内核（DeepSeek 开源周第一天）

FlashMLA: optimización de los núcleos de descodificación MLA para las GPU Hopper (Día 1 de la Semana del Código Abierto de DeepSeek)

Introducción general FlashMLA es un eficiente núcleo de descodificación MLA (Multi-head Latent Attention) desarrollado por DeepSeek AI, optimizado para GPUs de arquitectura NVIDIA Hopper....

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

091.9K

Fast-Agent: gramática declarativa e integración con MCP para crear rápidamente flujos de trabajo corporales multiinteligentes

Introducción general Fast-Agent es una herramienta de código abierto mantenida por el equipo evalstate en GitHub, diseñada para ayudar a los desarrolladores a definir, probar y construir rápidamente flujos de trabajo multiinteligencia. Se basa en una sintaxis declarativa sencilla y admite el uso de MCP (Modo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

091.8K

Bots de atención al cliente con inteligencia artificial que son atendidos automáticamente por los vendedores de Idle Fish a lo largo del día.

Introducción completa XianyuAutoAgent es un sistema robótico de atención al cliente inteligente diseñado para la plataforma Idlefish, de código abierto por el desarrollador shaxiu en GitHub. Utiliza la tecnología de IA para lograr 7×24 horas de servicio automático para ayudar a los vendedores de pescado...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # Robot AI de atención al cliente # AI Java Proyecto de código abierto

hace 1 año

091.8K

DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

DreamTalk Introducción DreamTalk es un marco de generación de cabezas parlantes basado en modelos de difusión y expresión desarrollado conjuntamente por la Universidad Tsinghua, Alibaba Group y la Universidad Huazhong de Ciencia y Tecnología. Consta principalmente de tres partes: una red de reducción de ruido, un experto en labios consciente del estilo y un predictor de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Digital Man Sincronización de puertos #

hace 2 años

091.7K

Zonos: herramientas de síntesis y clonación de voz de alta calidad

Introducción general Zonos es una herramienta de código abierto para la síntesis y clonación del habla desarrollada por Zyphra. La versión Zonos-v0.1 utiliza un Transformador avanzado y un modelo de mezcla para generar voz de alta calidad. La herramienta soporta múltiples idiomas...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 1 año

091.7K

Easy Voice Toolkit: kit de herramientas de voz AI para implantación local

Introducción exhaustiva Easy-Voice-Toolkit es un conjunto de herramientas multifuncionales basado en el Open Source Speech Project, que proporciona una amplia gama de herramientas de audio automatizadas para el reconocimiento del habla, la transcripción del habla, la conversión del habla, la creación de conjuntos de datos y el entrenamiento de modelos. Los usuarios pueden utilizar estas herramientas de forma selectiva según sus necesidades...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz # Clonación de voz AI

hace 2 años

091.6K

Parler-TTS: generación de modelos de conversión de texto en voz específicos para cada hablante a partir de un texto de entrada

Introducción general Parler-TTS es una biblioteca de modelos de texto a voz (TTS) de código abierto desarrollada por Hugging Face, diseñada para generar habla de alta calidad y sonido natural. El modelo es capaz de generar habla a partir de un texto de entrada con un estilo de locutor específico (por ejemplo, género, tono, estilo de habla...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

091.6K

ModelBest: el líder mundial en modelos grandes ligeros y de alto rendimiento de extremo a extremo

Introducción general ModelBest es una empresa centrada en el desarrollo de grandes modelos ligeros y de alto rendimiento, y se dedica a aplicar tecnologías avanzadas de IA a la electrónica de consumo convencional y a todo tipo de dispositivos finales de la vida cotidiana. Su serie MiniCPM de modelos finales con extrema potencia aritmética y eficiencia en el uso de la memoria...

Últimos recursos sobre IA # AI Big Model Herramienta de diálogo nativa # AI Java Proyecto de código abierto

hace 2 años

091.6K

Ichigo (llama3-s): asistente de voz local en tiempo real, versión de código abierto de Siri.

Introducción general Ichigo es un proyecto de IA de voz en tiempo real de código abierto que pretende ampliar los modelos de lenguaje basados en texto con capacidades de "escucha" nativa. El proyecto utiliza técnicas de fusión temprana inspiradas en el documento Chameleon de Meta.El objetivo de Ichigo es convertirse...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Producto interactivo multimodal en tiempo real

hace 2 años

091.6K

OWL: una herramienta automatizada para la colaboración multiinteligencia en tareas realistas

Introducción general OWL (Optimized Workforce Learning) es un marco de código abierto desarrollado por el equipo CAMEL-AI centrado en la optimización de la colaboración multiinteligencia para la automatización de tareas del mundo real. Basado en el marco CAMEL-AI ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

091.5K

Research Rabbit：使用本地LLM进行网页研究和报告撰写，自动深入用户指定主题并生成总结。

Research Rabbit: investigación web y redacción de informes utilizando LLM nativo, profundizando automáticamente en temas especificados por el usuario y generando resúmenes.

Introducción general Research Rabbit es un asistente nativo de investigación y resumen web basado en LLM (Large Language Model). Después de que el usuario proporcione un tema de investigación, Research Rabbit genera una consulta de búsqueda, obtiene resultados web relevantes y resume estos resultados....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Generar un informe de investigación en profundidad

hace 1 año

091.5K

Audiblez: Generar audiolibros, convertir libros electrónicos en audiolibros con Kokoro

Introducción general Audiblez es un proyecto de código abierto diseñado para convertir libros electrónicos (por ejemplo, en formato .epub) en audiolibros (por ejemplo, en formato .m4b). El proyecto utiliza la tecnología de síntesis de voz de alta calidad de Kokoro para soportar múltiples idiomas y múltiples voces. Los usuarios pueden...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 2 años

091.5K

Flock: orquestación de flujos de trabajo de bajo código para la creación rápida de chatbots

Introducción general Flock es una plataforma de código abierto para flujos de trabajo, alojada en GitHub y desarrollada por el equipo Onelevenvy. Se basa en las tecnologías LangChain y LangGraph y se centra en ayudar a los usuarios a construir rápidamente máquinas de chat....

Últimos recursos sobre IA # Robot AI de atención al cliente # AI Java Proyecto de código abierto # Flujo de trabajo de bajo código

hace 1 año

091.5K

OASIS: simulación multiinteligente de las interacciones en redes sociales de millones de usuarios para estudiar fenómenos sociales complejos

Introducción general OASIS (Open Agent Social Interaction Simulations) es un simulador de redes sociales de código abierto capaz de simular el comportamiento de hasta un millón de usuarios. La plataforma combina un modelo lingüístico a gran escala con un...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente

hace 1 año

091.5K

Ant Design X：快速构建AI聊天界面的工具包，支持模型集成和数据流管理。

Ant Design X: un conjunto de herramientas para construir rápidamente interfaces de chat de IA con soporte para la integración de modelos y la gestión del flujo de datos.

Introducción Ant Design X es un conjunto de herramientas de código abierto de Ant Group, diseñado para ayudar a los desarrolladores a crear rápidamente interfaces de diálogo basadas en IA. Proporciona un amplio conjunto de componentes y plantillas, soporta la integración de modelos compatibles con los estándares OpenAI, y es adecuado para una variedad de aplicaciones tales como servicio al cliente inteligente, asistentes de IA, y otros...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

091.4K

Data Formulator: una herramienta de visualización de datos basada en IA

Introducción general Data Formulator es una herramienta de código abierto de visualización de datos basada en IA desarrollada por Microsoft Research. La herramienta combina una interfaz gráfica de usuario (GUI) y la entrada de lenguaje natural (NL) para permitir a los usuarios crear e iterar rápidamente a través de interacciones y comandos sencillos....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Análisis de datos de IA

hace 1 año

091.2K

G-Search-MCP: Servidor MCP para la búsqueda gratuita en Google

Introducción general G-Search-MCP es una herramienta de búsqueda de Google de código abierto alojada en GitHub y modificada por el desarrollador jae-jae basada en google-search. Pasa MCP (Modelo de Contexto...

Últimos recursos sobre IA # AI Java Proyecto de código abierto Servicios MCP #

hace 1 año

091.2K

Leffa：高保真模特虚拟试穿与人物姿势调整，Meta开源的可控人物图像生成模型

Leffa: ajuste virtual de modelos de alta fidelidad y ajuste de la pose de los personajes, Meta modelo de generación de imágenes de personajes controlable de código abierto

Introducción exhaustiva Leffa es un marco unificado para generar imágenes de personajes controlables, que permite la manipulación precisa de la apariencia del personaje (por ejemplo, ajuste virtual) y la pose (por ejemplo, transferencia de pose). El marco reduce significativamente la distorsión de detalles finos dirigiendo la consulta de destino para centrarse en la clave de referencia correcta en la capa de atención, con...

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto # AI Cambia la cara y vístete

hace 2 años

091.2K

Optexity: un proyecto de código abierto para entrenar a la IA a realizar acciones web con demostraciones humanas

Introducción general Optexity es un proyecto de código abierto en GitHub, desarrollado por el equipo de Optexity. Su núcleo es utilizar datos de demostración humana para entrenar a la IA a completar tareas informáticas, especialmente operaciones de páginas web. El proyecto contiene tres bibliotecas de código: Compute...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande # Inteligencia de automatización de escritorio

hace 1 año

091.2K

MiniMind-V: 1 hora de entrenamiento de un modelo de lenguaje visual de 26 millones de parámetros

Introducción general MiniMind-V es un proyecto de código abierto, alojado en GitHub, diseñado para ayudar a los usuarios a entrenar un modelo de lenguaje visual (VLM) ligero con solo 26 millones de parámetros en menos de una hora. Se basa en el modelo de lenguaje MiniMind, con nuevos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 1 año

091.2K

Insanely Fast Whisper: proyecto de código abierto para la transcripción rápida y eficaz de voz a texto

Introducción completa insanely-fast-whisper es una transferencia de audio que combina el modelo Whisper de OpenAI con diversas técnicas de optimización (por ejemplo, Transformers, Optimum, Flash Attention...)

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 2 años

091.1K

Ruyi-Models: Genera modelos de código abierto de imagen a vídeo que admiten el control de la lente y el control de la amplitud de movimiento.

Introducción general Ruyi-Models es un proyecto de código abierto diseñado para generar vídeos de alta calidad a partir de imágenes. Desarrollado por el equipo IamCreateAI, el proyecto soporta la generación de vídeo cinemático a 768 de resolución, 24 fotogramas por segundo, 120 fotogramas en 5 segundos...

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Java Proyecto de código abierto

hace 2 años

091K

OrionChat: Interfaz de chat web sencilla con modelos de IA multiplataforma integrados (sin implantación)

Introducción general OrionChat es una interfaz de chat de IA basada en web que proporciona a los usuarios una plataforma unificada para interactuar con múltiples modelos de IA de corriente principal. El proyecto es compatible con una amplia gama de modelos de IA, incluidos Ollama (que se ejecuta localmente), OpenAI GPT, Google Gemi...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

090.9K

RapBank：根据歌词和伴奏直接生成说唱(Rap)人声的模型（目前开放了数据集）

RapBank: modelo de generación directa de voces de rap a partir de letras y pistas de acompañamiento (conjunto de datos abierto actualmente).

Introducción general RapBank es un conjunto de datos y herramientas diseñado para la generación de letras de rap. El proyecto fue creado por NZqian para proporcionar a investigadores y desarrolladores datos de alta calidad sobre letras de rap mediante la recopilación y el procesamiento de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Música

hace 2 años

090.9K

SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo

Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Teclado AI para cambiar fondos # Detección visual de objetivos

hace 1 año

090.8K

Cambiador de voz: ¡Un cambiador de voz en tiempo real para hacer cantar a tus personajes de anime favoritos!

Introducción general Voice Changer es una herramienta de transformación de voz en tiempo real de código abierto que admite una amplia gama de modelos de voz AI, como MMVC, so-vits-svc, RVC, DDSP-SVC y Beatrice.La herramienta es compatible con múltiples plataformas...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 2 años

090.8K

Bilingual Book Maker：使用AI翻译制作双语电子书，全书自动化翻译工具

Bilingual Book Maker: Utiliza la traducción automática para crear libros electrónicos bilingües.

Introducción general Bilingual Book Maker es un proyecto de código abierto diseñado para ayudar a los usuarios a crear versiones multilingües de libros electrónicos utilizando tecnología de IA. La herramienta utiliza principalmente ChatGPT para la traducción y soporta múltiples formatos de archivo, incluyendo epub, txt y srt....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción

hace 1 año

090.7K

Fullmoon: aplicación iOS para chatear con modelos nativos en idiomas grandes

Descripción general Fullmoon es una aplicación diseñada para dispositivos iOS cuyo objetivo es ofrecer la posibilidad de chatear en privado con modelos nativos de gran tamaño. La aplicación está optimizada para Apple Silicon y es compatible con iPhone, iPad y Mac. Los usuarios del chat...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

090.7K

TripoSG: generación de activos digitales modelados en 3D de alta resolución a partir de una sola imagen

Introducción general TripoSG es un proyecto de código abierto desarrollado por el equipo de investigación VAST AI para generar modelos 3D de alta calidad a partir de una sola imagen. El proyecto utiliza tecnología de convertidor rectificador-flujo a gran escala, combinada con entrenamiento híbrido supervisado y conjuntos de datos de alta calidad, para permitir que los modelos 3D generados tengan...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Texto e Imagen a 3D

hace 1 año

090.7K

NodeTool: un cliente de visualización de flujos de trabajo para modelos de IA basado en la orquestación de nodos

Introducción general NodeTool es una innovadora plataforma de creación de IA diseñada para proporcionar una interfaz sencilla e intuitiva para entusiastas de la IA, desarrolladores, científicos de datos y creativos. Tanto si eres un artista, desarrollador o principiante, NodeTool te ayuda a crear rápidamente prototipos creativos....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Flujo de trabajo de bajo código

hace 2 años

090.6K

SVFR: un marco unificado para implementar la reparación de rostros en vídeo, reparar vídeos en blanco y negro, retratos borrosos y antiguos

Introducción exhaustiva SVFR (Stable Video Face Restoration) es un marco unificado para la restauración de rostros en vídeo que admite tareas de restauración básica de rostros (BFR), coloreado, reparación y su combinación. El marco utiliza priors generativos y cinemáticos unificando...

Últimos recursos sobre IA # AI Ampliación y restauración de imágenes # AI Java Proyecto de código abierto

hace 2 años

090.5K

MIDI-3D: herramienta de código abierto para generar rápidamente escenas 3D multiobjeto a partir de una sola imagen

Introducción general MIDI-3D es un proyecto de código abierto desarrollado por el equipo VAST-AI-Research para generar rápidamente escenas 3D con múltiples objetos a partir de una sola imagen para desarrolladores, investigadores y creadores. Esta herramienta se basa en la técnica de modelado de difusión multi-instancia...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Texto e Imagen a 3D

hace 1 año

090.5K

E2M: Convierte múltiples formatos de archivo a Markdown, consigue fácilmente un formato de documento uniforme.

Introducción general E2M (Everything to Markdown) es una biblioteca Python de código abierto diseñada para convertir una amplia gama de formatos de archivo al formato Markdown. La herramienta soporta formatos como doc, docx, epub, html, htm, u...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 2 años

090.5K

Explorar la IA: extraer y supervisar datos estructurados sin código

Presentación de Browse Browse AI es un software de automatización web sin codificación basado en la nube diseñado para ayudar a los usuarios a extraer y supervisar datos de cualquier sitio web sin necesidad de programación. Puede entrenar a un bot para que realice tareas de extracción, supervisión y automatización de datos con solo...

Últimos recursos sobre IA # AI Servicios abiertos # AI Java Proyecto de código abierto # Sin desarrollo de código

hace 2 años

090.5K

ALog: aplicación portátil de diario vocal con inteligencia artificial y conversión de voz a texto.

Introducción general ALog es una aplicación de diario de voz basada en IA diseñada para ayudar a los usuarios a registrar su vida diaria por voz. Está desarrollada por duxins y de código abierto en GitHub. Los usuarios pueden grabar entradas de diario a través de la entrada de voz, y la aplicación convertirá automáticamente la voz en texto ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 2 años

090.3K

Más información