Proyecto AI de código abierto

Total 1020 artículos

ordenar

FantasyTalking: una herramienta de código abierto para generar retratos hablados realistas

Introducción general FantasyTalking es un proyecto de código abierto desarrollado por el equipo Fantasy-AMAP, centrado en la generación de realismo hablando videos retrato a través de la unidad de audio. El proyecto se basa en el modelo avanzado de difusión de vídeo Wan2.1 , combinado con el codificador de audio Wa...

hace 1 año

081.4K

Ortlin: una interfaz gráfica web para interactuar con todos los modelos y API de OpenAI.

Introducción general Ortlin es una interfaz gráfica de usuario basada en web diseñada para ayudar a cualquier persona, usuarios técnicos y no técnicos por igual, a interactuar fácilmente con las API de OpenAI y los modelos subyacentes. Es completamente gratuita y de código abierto, lo que permite a los usuarios aprovechar las ventajas de OpenAI sin complicaciones...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

081.4K

Social Media Agent：社交媒体智能助手，自动生成和管理社交媒体内容

Social Media Agent: un asistente inteligente para las redes sociales que genera y gestiona automáticamente los contenidos de las mismas.

Introducción general Social Media Agent (Agente de Medios Sociales) es un proyecto de código abierto que gestiona la información de interacción mediante el nuevo Agent Inbox, diseñado para ayudar a los usuarios a automatizar la generación y gestión de contenidos de medios sociales. El proyecto está desarrollado por el equipo LangChain...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Redes sociales

hace 2 años

081.4K

Agent-Wiz: análisis de los flujos de trabajo y los riesgos de seguridad de AI Intelligentsia

Introducción general Agent-Wiz es una herramienta de línea de comandos Python de código abierto diseñada para desarrolladores, investigadores y equipos de seguridad. Puede extraer flujos de trabajo complejos de los principales marcos de inteligencia artificial como LangGraph, CrewAI, AutoGen, etc., para generar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

081.2K

Feeds.Fun: feeds RSS que etiquetan y filtran automáticamente las noticias

Introducción general Feeds.Fun es una herramienta que ayuda a los usuarios a leer noticias de forma eficiente, con funciones básicas como el etiquetado automático de noticias y el filtrado de contenidos en función de las preferencias del usuario. Fue creada por el desarrollador Aliaksei Yaletski (nombre de usuario Tiendil) y está alojada en ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital

hace 1 año

081.2K

Memobase: una solución de memoria a largo plazo basada en el perfil del usuario para aplicaciones de IA

Introducción general Memobase es un sistema de memoria basado en el perfil del usuario diseñado para soportar una memoria de usuario duradera para aplicaciones de IA generativa. Tanto si estás construyendo un compañero virtual, una herramienta educativa o un asistente personalizado, Memobase ayuda a tu IA a recordar, comprender y crecer con el uso de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

081.2K

MemFree: un motor de búsqueda de inteligencia artificial para mezclar bases de conocimiento local e información de búsqueda

Introducción general MemFree es un avanzado motor de búsqueda híbrido de IA capaz de buscar y hacer preguntas a través de texto, imágenes, documentos y páginas web. Proporciona acceso con un solo clic a los resultados de búsqueda de texto, mapas mentales, imágenes y vídeos.MemFree pretende extraer información de la base de conocimientos del usuario y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de búsqueda de IA

hace 2 años

081.2K

AutoGPT: plataforma inteligente de carrozado para la automatización de flujos de trabajo y la ejecución autónoma de tareas

Descripción general AutoGPT es una potente plataforma diseñada para ayudar a los usuarios a crear, desplegar y gestionar agentes de IA en ejecución continua y automatizar flujos de trabajo complejos. Desarrollada por Significant Gravitas, la plataforma ofrece una amplia gama de herramientas y funciones que permiten a los usuarios centrarse...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Flujo de trabajo de bajo código # Marco de desarrollo del cuerpo inteligente

hace 2 años

081.1K

Lumina-mGPT-2.0: un modelo autorregresivo de generación de imágenes para gestionar múltiples tareas de generación de imágenes

Introducción general Lumina-mGPT-2.0 es un proyecto de código abierto desarrollado conjuntamente por el Laboratorio de Inteligencia Artificial de Shanghai (Shanghai AI Laboratory), la Universidad China de Hong Kong (CUHK) y otras organizaciones, alojado en GitHub por Alpha...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

081.1K

MuseGAN: un modelo de código abierto para generar música/bandas sonoras multipista y crear fácilmente clips musicales para varios instrumentos.

Introducción general MuseGAN es un proyecto de generación musical basado en redes generativas adversariales (GAN) diseñado para generar música multipista (multiinstrumento). El proyecto es capaz de generar música desde cero o acompañada de pistas suministradas por el usuario.MuseGAN utiliza Lakh Pianor...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Música

hace 2 años

081.1K

X-Dyna: Vídeo de generación de poses para hacer bailar las fotos de Missy

Introducción general X-Dyna es un proyecto de código abierto desarrollado por ByteDance para generar animaciones dinámicas de retratos utilizando técnicas de difusión de muestra cero. El proyecto utiliza expresiones faciales y movimientos corporales en vídeo de unidad para animar imágenes de retratos individuales, generando efectos de movimiento realistas y conscientes del contexto.X-D...

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Java Proyecto de código abierto

hace 2 años

081.1K

Knowledge Table: una herramienta de código abierto para la extracción y exploración eficientes de datos estructurados

Introducción exhaustiva Knowledge Table (Tabla de conocimientos) es un proyecto de código abierto diseñado para simplificar el proceso de extracción y exploración de datos estructurados a partir de documentos no estructurados. Los usuarios pueden crear representaciones estructuradas del conocimiento, como tablas y gráficos, mediante una interfaz de consulta en lenguaje natural. La herramienta permite personalizar la extracción ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Gráfico del conocimiento

hace 2 años

081.1K

OmniParser: capturas de pantalla de la interfaz de usuario convertidas en elementos estructurados para facilitar la comprensión y manipulación de modelos de gran tamaño.

Introducción general OmniParser es una herramienta desarrollada por Microsoft para analizar capturas de pantalla de la interfaz de usuario y convertirlas en elementos estructurados y fáciles de entender. Esta herramienta mejora significativamente la capacidad de GPT-4V para generar acciones precisas en el área de interfaz correspondiente.OmniParser no sólo admite...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

081K

AI Hive: una versátil plataforma de integración de chat de IA basada en Java

Introducción completa AI Beehive (ai-beehive) es una plataforma de IA multifuncional construida en lenguaje Java con Spring Boot 3 y JDK 17. El proyecto integra múltiples tecnologías de IA, incluyendo ChatGPT...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

081K

Hoarder：开源 AI 书签管理工具，支持多种格式文件，智能标签分类、全文检索

Hoarder: herramientas de gestión de marcadores AI de código abierto, compatible con múltiples formatos, clasificación inteligente de etiquetas, búsqueda de texto completo

Descripción general Hoarder es una herramienta de gestión de marcadores autoalojada que permite almacenar enlaces, notas, PDF e imágenes. Utiliza tecnología de IA para el etiquetado automático y ofrece funciones de búsqueda de texto completo. Los usuarios pueden utilizar el plugin de Chrome y el plugin de Firefox...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital

hace 2 años

081K

TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.

Introducción general TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle su ordenador a través de la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Inteligencia de automatización de escritorio

hace 2 años

081K

Asistente Deepseek AI "Always-On": creación de un sistema inteligente de interacción por voz basado en Deepseek-V3

Introducción completa Always-On AI Assistant es un innovador proyecto de asistente de IA que crea un potente sistema de asistente de IA permanentemente en línea mediante la integración de tecnologías avanzadas como Deepseek-V3, RealtimeSTT y Typer...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Producto interactivo multimodal en tiempo real

hace 2 años

080.9K

Agentes atómicos: un marco para construir inteligencias de IA modulares y ligeras

Introducción general Atomic Agents es un framework extremadamente ligero y modular diseñado en torno al concepto de atomicidad para construir pipelines y aplicaciones de IA con agentes. El marco proporciona un conjunto de herramientas y agentes que pueden combinarse para crear potentes aplicaciones. Se basa en Instruc...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 2 años

080.8K

ChatGPT Box: Complemento del navegador para que ChatGPT funcione en otras páginas web

Introducción general ChatGPT Box es una extensión de navegador de código abierto diseñada para integrar profundamente ChatGPT en el navegador de un usuario. Desarrollada por josStorer, la herramienta soporta múltiples idiomas y proporciona una variedad de características tales como llamar a pares de chat en cualquier página...

Últimos recursos sobre IA # AI Java Proyecto de código abierto Plataforma de diálogo multimodelo integrada # AI # Navegador Asistente AI

hace 1 año

080.8K

Minima: contenedor RAG de código abierto que admite el despliegue local o la integración en ChatGPT, Claude

Introducción general Minima es una solución RAG (Retrieval-Augmented Generation) de código abierto que admite el despliegue local y la integración con ChatGPT. El proyecto está mantenido por dmayboroda y tiene como objetivo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 1 año

080.8K

Audio-Reasoner: un modelo lingüístico a gran escala para el razonamiento profundo de audio

Introducción completa Audio-Reasoner es un proyecto de código abierto desarrollado por un equipo de la Universidad de Tsinghua y alojado en GitHub, centrado en la construcción de modelos lingüísticos a gran escala que soportan la inferencia profunda en audio. El modelo se basa en Qwen2-Audio-Instruct, introduciendo ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

080.7K

LivePortrait: herramienta de animación para generar retratos dinámicos a partir de imágenes fijas y vídeos

Introducción general LivePortrait es una herramienta avanzada de animación dinámica de retratos AI desarrollada por Racer Technology. Utiliza una innovadora tecnología de IA para transformar imágenes fijas en vívidas animaciones de vídeo. Tanto si utiliza fotos reales, estilos de animación o retratos artísticos, LivePo...

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Java Proyecto de código abierto # AI Estilo de conversión de vídeo

hace 2 años

080.6K

PiT: herramienta para unir imágenes completas a partir de partes de imágenes (no abierta)

Introducción general PiT (Piece it Together) es una herramienta de código abierto alojada en GitHub y desarrollada por investigadores como Elad Richardson, de la Universidad de Tel Aviv. Permite a los usuarios introducir partes de imágenes fragmentadas, como alas...

Últimos recursos sobre IA # Editor de imágenes AI # AI Control de estilo de imagen # AI Java Proyecto de código abierto

hace 1 año

080.6K

DB-GPT: Creación de un marco de desarrollo de aplicaciones de datos nativas de IA que integra la gestión multimodelo y el procesamiento inteligente de datos

Introducción general DB-GPT es un marco de desarrollo de aplicaciones de datos nativas de IA de código abierto construido utilizando AWEL (Agentic Workflow Expression Language) y tecnologías de cuerpo inteligente. El proyecto pretende crear una infraestructura en el ámbito de los grandes modelos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Análisis de datos de IA # Recuperación de conocimientos y marco RAG

hace 1 año

080.5K

Robo Blogger：基于LangGraph将语音内容生成博客文章，自动化写作博客

Robo Blogger: generación de entradas de blog a partir de contenidos de voz basados en LangGraph, blogs de redacción automatizada

Introducción general Robo Blogger es una innovadora herramienta de creación de blogs diseñada para simplificar el proceso de generación de contenidos mediante la tecnología de voz a texto. Los usuarios pueden grabar ideas a través de cualquier aplicación de voz a texto, y Robo Blogger convierte esas ideas en contenido de blog estructurado....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta AI de resumen de texto y audio/vídeo

hace 2 años

080.5K

EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli

Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto

hace 1 año

080.5K

par_scrape: una herramienta de rastreo para la extracción inteligente de datos web

Introducción general par_scrape es una herramienta de rastreo web de código abierto basada en Python, lanzada en GitHub por el desarrollador Paul Robello, diseñada para ayudar a los usuarios a extraer datos de páginas web de forma inteligente. Integra Selenium...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 1 año

080.5K

Nodo GaiaNet: instale y ejecute su propio modelo local de servicio proxy en línea

Introducción general GaiaNet-AI/gaianet-node es un proyecto de código abierto que permite a los usuarios instalar rápidamente la pila de software de nodos por defecto en Mac, Linux o Windows WSL con un solo comando. Los usuarios pueden inicializar nodos, personalizar configuraciones, descargar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de modelos de gran tamaño de código abierto desplegada localmente

hace 2 años

080.5K

DragGAN: herramienta interactiva de edición de imágenes, control de la posición de las imágenes mediante apuntar y hacer clic y arrastrar y soltar.

Introducción general DragGAN es una herramienta interactiva de edición de imágenes basada en Redes Generativas Adversariales (GAN). Fue lanzada por Xingang Pan et al. en SIGGRAPH 2023 y tiene como objetivo permitir a los usuarios manipular intuitivamente a través de simples operaciones de apuntar y hacer clic y arrastrar y soltar....

Últimos recursos sobre IA # Editor de imágenes AI # AI Java Proyecto de código abierto

hace 2 años

080.4K

Mahilo: una plataforma integrada para conectar diferentes marcos de inteligencia artificial y colaborar en tiempo real

Introducción general Mahilo es una plataforma de integración multi-inteligencia de código abierto, publicada en GitHub por el desarrollador Jayesh Sharma, diseñada para ayudar a los usuarios a conectar inteligencias de IA de diferentes marcos para apoyar la comunicación en tiempo real, la interacción persona-ordenador y la colaboración inteligente. La ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

080.4K

AI Video Starter Kit: Creación y edición fluidas de vídeos de IA en el navegador

Introducción general Video Starter Kit (Kit de inicio de vídeo) es un proyecto de código abierto publicado por fal-ai-community para mostrar cómo utilizar modelos de IA para la producción de vídeo en el navegador. Proporciona herramientas para convertir imágenes a vídeo de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI editor de audio/vídeo

hace 2 años

080.4K

IMS Toucan: herramienta de conversión de texto a voz multilingüe (compatible con más de 7000 idiomas), rápida y controlable.

Introducción general IMS Toucan es un avanzado kit de herramientas de conversión de texto a voz (TTS) desarrollado por el Instituto de Procesamiento del Lenguaje Natural (IMS) de la Universidad de Stuttgart (Alemania). El kit de herramientas es compatible con más de 7000 idiomas y es rápido, controlable y requiere pocos recursos informáticos.IMS...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

080.3K

Open-Reasoner-Zero: plataforma de código abierto para el aprendizaje por refuerzo del razonamiento a gran escala

Introducción general Open-Reasoner-Zero es un proyecto de código abierto centrado en la investigación del aprendizaje por refuerzo (RL), desarrollado por el equipo Open-Reasoner-Zero en GitHub. Su objetivo es proporcionar un entrenamiento eficiente, escalable y fácil de usar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 1 año

080.2K

R1-Onevision: un modelo de lenguaje visual de código abierto para el razonamiento multimodal

Introducción exhaustiva R1-Onevision es un modelo de macrolenguaje multimodal de código abierto desarrollado por el equipo Fancy-MLLM, centrado en la combinación profunda de visión y lenguaje, capaz de procesar entradas multimodales como imágenes y texto, y de actuar en los campos del razonamiento visual, la comprensión de imágenes, la resolución matemática, etc. ....

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

080.2K

Agentes Cloudflare: creación de inteligencias interactivas en tiempo real en redes periféricas

Introducción general Cloudflare Agents es un marco de desarrollo de código abierto de Cloudflare diseñado para ayudar a los desarrolladores a crear agentes de inteligencia artificial en la red global. Proporciona a los agentes la capacidad de persistir en el estado, comunicarse en tiempo real y ejecutarse de forma autónoma....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 1 año

080.2K

Reactive Resume: creador de currículos gratuito y de código abierto con soporte multilingüe y multiplantilla

Descripción general Reactive Resume es un creador de currículums gratuito y de código abierto diseñado para simplificar el proceso de crear, actualizar y compartir currículums. La plataforma se centra en la privacidad del usuario, sin seguimiento ni publicidad. Los usuarios pueden autoalojar la aplicación en menos de 30 segundos, tomando el control total de su...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital

hace 2 años

080.1K

Gaze-LLE: herramienta de predicción de la mirada de una persona en vídeo

Synthesis Gaze-LLE es una herramienta de predicción del objetivo de la mirada basada en un codificador de aprendizaje a gran escala. Fue desarrollada por Fiona Ryan, Ajay Bati, Sangmin Lee, Daniel Bolya, Judy Hoffman y J...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

080.1K

$XDOllama：适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。$

XDOllama: Interfaz del modelo AI para llamadas rápidas a Ollama\Dify\Xinference en MacOS.

Descripción general XDOllama es una aplicación de escritorio diseñada para que los usuarios de MacOS invoquen rápidamente modelos de IA como Ollama, Dify y Xinference. Con una interfaz y un flujo de trabajo simplificados, la aplicación permite a los usuarios...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

080.1K

Scraperr: herramienta autoalojada de raspado de datos web

Introducción general Scraperr es una herramienta autoalojada de rastreo de datos web que permite a los usuarios rastrear datos web especificando elementos XPath. El usuario envía la URL y el elemento de rastreo correspondiente y los resultados se muestran en una tabla y pueden descargarse como archivo Excel.Sc...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

080.1K

self.so: ¡Genera una bonita página de CV con un solo clic!

Introducción general self.so es una herramienta de código abierto diseñada para convertir rápidamente un CV o un perfil de LinkedIn en un sitio web personal. Los usuarios simplemente cargan un CV en PDF o introducen un enlace de LinkedIn, y el sistema lo convierte en un sitio web personal utilizando tecnología de IA (basada en Tog...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital

hace 1 año

080K

JoyGen: herramienta de edición de vídeo sonoro 3D con profundidad de campo para retratos hablados

Introducción general JoyGen es un innovador marco de generación de vídeo en dos fases para rostros parlantes, centrado en resolver el problema de la generación de expresiones faciales basada en audio. Desarrollado por un equipo de Jingdong Technology, utiliza técnicas avanzadas de reconstrucción 3D y métodos de extracción de características de audio para capturar con precisión las características de identidad del hablante y la expresión...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Digital Man

hace 2 años

080K

OmAgent: un marco corporal inteligente para construir dispositivos inteligentes multimodales

Introducción general OmAgent es un marco de cuerpo inteligente multimodal desarrollado por Om AI Lab, con el objetivo de proporcionar potentes funciones impulsadas por IA para dispositivos inteligentes. Mediante la integración de modelos base multimodales de última generación y algoritmos de cuerpo inteligente, el proyecto permite a los desarrolladores crear dispositivos inteligentes eficientes en una variedad de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Producto interactivo multimodal en tiempo real # Marco de desarrollo del cuerpo inteligente

hace 2 años

080K

Rankify: un conjunto de herramientas de Python para la recuperación y reordenación de la información

Introducción general Rankify es un conjunto de herramientas Python de código abierto desarrollado por el Data Science Group de la Universidad de Innsbruck, Austria. Se centra en la recuperación de información, la reordenación y la generación de aumento de la recuperación (RAG), proporcionando un marco unificado. El conjunto de herramientas incluye 40 puntos de referencia...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 1 año

080K

Bonsai: un modelo lingüístico ponderado de tres valores apto para funcionar en dispositivos de borde

Introducción general Bonsai es un modelo lingüístico de código abierto desarrollado por deepgrove-ai con un tamaño de parámetros de 500 millones, que utiliza pesos ternarios. Se basa en la arquitectura Llama y el clasificador Mistral....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 1 año

079.9K

PDF to Podcast: Utilidad para convertir PDF en Podcast

Introducción General Inspirado por las características de generación de podcast de Notebook LM y la reciente implementación de código abierto de Open Notebook LM. En esta receta, vamos a implementar una guía detallada paso a paso sobre cómo construir un PDF a podcast pipeline. Dado cualquier PDF...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

079.9K

AI Podcast Generator: Captura automática de noticias para generar podcasts de audio

Introducción general AI Podcast Generator es una herramienta inteligente de generación de podcasts que utiliza tecnología avanzada de IA para crear automáticamente contenidos de audio atractivos a partir de fuentes web. El sistema genera narraciones de flujo natural capturando contenidos de noticias y convirtiéndolos en podcasts de audio. El proyecto se basa en la...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta AI de resumen de texto y audio/vídeo

hace 2 años

079.9K

Confident AI：自动化大语言模型评估框架，对比不同大模型提示词输出质量

Confident AI: a framework for automated large language model evaluation, comparing the quality of output of different large model cue words (en inglés)

Introducción completa DeepEval es un marco de evaluación LLM de código abierto fácil de usar para evaluar y probar grandes sistemas de modelado del lenguaje. Es similar a Pytest, pero se centra en las pruebas unitarias de los resultados LLM. DeepEval combina los últimos resultados de la investigación...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # PROMPTS Ayudas

hace 1 año

079.9K

Telegram GPT Worker：部署在Cloudflare Workers上的多模型AI Telegram机器人

Telegram GPT Worker: un bot de Telegram con IA multimodelo desplegado en Cloudflare Workers

Introducción General GPT-Telegram-Worker es un bot AI Telegram multi-modelo basado en Cloudflare Workers con soporte para múltiples APs como OpenAI, Claude, Azure, y más...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente

hace 1 año

079.8K

SuperWeChatPC: herramienta informática de código abierto para mejorar la función de microcrédito, apoyo al desarrollo secundario

Introducción completa SuperWeChatPC es una herramienta de mejora de WeChat de código abierto para ordenadores, cuyo núcleo es proporcionar comodidad a los usuarios y desarrolladores. Inicialmente resuelve el problema de que WeChat sólo se puede abrir solo, y más tarde añadió WeChatSDK, para que los desarrolladores puedan llamar a las funciones de WeChat, como el envío de mensajes....

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

079.8K

OpenAlternative：精选常用SaaS产品的开源软件替代方案，寻找最佳开源替代方案

OpenAlternative: una selección de alternativas de software de código abierto a los productos SaaS más utilizados, para encontrar las mejores alternativas de código abierto.

Introducción general OpenAlternative es una plataforma centrada en proporcionar alternativas de software de código abierto, con el objetivo de ayudar a los usuarios a encontrar herramientas de código abierto adecuadas para sustituir a los productos SaaS comerciales que utilizan a diario. El sitio ayuda a los usuarios a ahorrar dinero y mejorar a través de una cuidada colección de herramientas de código abierto...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

079.7K

LLManager: una herramienta de gestión que combina la aprobación automatizada inteligente de procesos con auditorías humanas.

Introducción general LLManager es una herramienta de gestión de aprobación inteligente de código abierto, desarrollada en base al marco LangGraph de LangChain, centrada en la automatización del procesamiento de las solicitudes de aprobación al tiempo que optimiza la toma de decisiones con revisión humana. Lo hace a través de la búsqueda semántica, el aprendizaje...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramientas de productividad profesional

hace 1 año

079.7K

CogView3: modelo de generación de imágenes por difusión de texto en cascada de código abierto de Wisdom Spectrum

Introducción CogView3 es un sistema avanzado de generación de imágenes de texto desarrollado por la Universidad de Tsinghua y Think Tank Team (Chi Spectrum Qingyan). Se basa en un modelo de difusión en cascada y genera imágenes de alta resolución a través de múltiples etapas.Las características clave de CogView3 incluyen la generación en múltiples etapas, una arquitectura innovadora y un rendimiento eficiente....

Últimos recursos sobre IA # AI generación de imágenes en línea # AI Java Proyecto de código abierto

hace 2 años

079.7K

LiberSonora: Extracción de subtítulos de audiolibros y traducción multilingüe, transcripción de audiolibros a varios idiomas

Introducción LiberSonora, que significa "sonido libre", es un potente conjunto de herramientas de código abierto para audiolibros. Es compatible con la extracción inteligente de subtítulos, la generación de títulos AI, traducción multi-idioma, etc., y es capaz de procesamiento por lotes fuera de línea bajo GPU acceleration.LiberSo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Traducción # AI Voz a texto

hace 1 año

079.7K

ai-gradio: integra fácilmente múltiples modelos de IA y crea aplicaciones multimodales basadas en Gradio

Introducción general ai-gradio es un conjunto de herramientas Python de código abierto diseñado para ayudar a los desarrolladores a integrar y utilizar fácilmente múltiples modelos de IA. Construido sobre Gradio, el proyecto proporciona una interfaz unificada para soportar múltiples modelos y servicios de IA. Ya sea texto, voz o vídeo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

079.6K

Dynamiq: Marco de orquestación de cuerpos inteligentes con soporte de agentes RAG y LLM para simplificar el desarrollo de aplicaciones de IA

Introducción general Dynamiq es un marco de orquestación de IA de código abierto diseñado para aplicaciones de IA de agentes y Large Language Modelling (LLM). Su objetivo es simplificar el desarrollo de aplicaciones basadas en IA, especialmente en el área de la Generación Aumentada de Recuperación (RAG) y la orquestación de agentes LLM.Dynamiq propone...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 2 años

079.5K

Ejemplos DSPy: Ejemplos prácticos que demuestran la funcionalidad de DSPy

Introducción general La base de código de ejemplos DSPy es una base de código GitHub mantenida por el equipo de IA de Langtrace que muestra una variedad de programas de IA de ejemplo construidos con DSPy. La base de código está diseñada para demostrar las muchas características de DSPy a través de ejemplos del mundo real para ayudar a los...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

079.5K

LangWatch: una herramienta de visualización para supervisar y optimizar los procesos de LLM basada en el marco DSPy

Introducción completa LangWatch es una plataforma completa diseñada para las operaciones de grandes modelos lingüísticos (LLM), que proporciona supervisión, análisis, evaluación, gestión de conjuntos de datos y optimización de pistas. La plataforma se basa en el marco DSPy de la Universidad de Stanford y está diseñada para ayudar a los usuarios a gestionar y optimizar mejor...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

079.5K

LuminaBrush: Iluminación de imágenes con herramientas de pintura inteligentes

Introducción general LuminaBrush es una innovadora herramienta interactiva de edición de imágenes para efectos de iluminación, impulsada por tecnología de inteligencia artificial. El proyecto utiliza un marco de dos etapas para procesar imágenes: la primera etapa transforma la imagen de entrada en un aspecto "uniformemente iluminado", mientras que la segunda genera...

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto

hace 2 años

079.4K

StickerBaker: Crea pegatinas personalizadas con IA

Descripción general stickerbaker es un creador de pegatinas de código abierto que utiliza tecnología de inteligencia artificial para crear una gran variedad de pegatinas interesantes. Tanto si quieres una simple pegatina de un gato como si quieres hacer una serie de pegatinas diversas, stickerbaker puede satisfacer tus necesidades....

Últimos recursos sobre IA # AI generación de imágenes en línea # AI Java Proyecto de código abierto

hace 2 años

079.4K

LLM API Engine: generación y despliegue rápidos de API mediante lenguaje natural

Introducción general LLM API Engine es un proyecto de código abierto diseñado para ayudar a los desarrolladores a crear y desplegar rápidamente API impulsadas por IA.El proyecto aprovecha el Large Language Model (LLM) y las tecnologías de rastreo web inteligente para permitir a los usuarios crear API personalizadas a través de descripciones en lenguaje natural.Su principal...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

079.3K

Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Introducción completa Vision Parse es una revolucionaria herramienta de procesamiento de documentos, que combina inteligentemente la tecnología más avanzada de modelos de lenguaje visual (Vision Language Models), la capacidad de convertir inteligentemente documentos PDF a formato Markdown de alta calidad...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 2 años

079.2K

DocsGPT: Asistente de Chat de Documentos, obtenga respuestas fiables a partir de documentos individuales, fuentes web, soporte a la implantación local.

Introducción general DocsGPT es un asistente de documentación de código abierto diseñado para simplificar el proceso de consulta de la documentación del proyecto. Mediante la integración de un potente modelo GPT , los desarrolladores pueden hacer fácilmente preguntas sobre el proyecto y obtener respuestas precisas.DocsGPT soporta el despliegue local para garantizar la privacidad de los datos mientras...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta AI de resumen de texto y audio/vídeo

hace 2 años

079.2K

Goku: Genera vídeos detallados y coherentes, ideales para crear vídeos publicitarios con personajes y objetos detallados.

Introducción exhaustiva Goku es un modelo federado de generación de imágenes y vídeos basado en técnicas de transformación de flujos y diseñado para alcanzar un rendimiento de nivel industrial. Integra técnicas avanzadas de generación visual de alta calidad, como la recopilación de datos detallados, el diseño de modelos y la formulación de transformaciones de flujo.

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Java Proyecto de código abierto # AI de texto a vídeo

hace 1 año

079.1K

OneFileLLM: Integración de múltiples fuentes de datos en un único archivo de texto

Introducción completa OneFileLLM es una herramienta de línea de comandos de código abierto diseñada para consolidar múltiples fuentes de datos en un único archivo de texto para facilitar la entrada en grandes modelos lingüísticos (LLM). Permite procesar repositorios de GitHub, artículos de ArXiv, transcripciones de vídeos de YouTube,...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Extracción y limpieza de documentos

hace 1 año

079K

Vector Vein: plataforma de creación de flujos de trabajo de IA sin código

Introducción completa Vector Vein es una plataforma de creación de flujos de trabajo de IA sin código diseñada para ayudar a los usuarios a crear fácilmente flujos de trabajo inteligentes y automatizados. Sin necesidad de conocimientos de programación, los usuarios pueden simplemente conectar varios módulos funcionales a través de operaciones de arrastrar y soltar para construir...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Flujo de trabajo de bajo código

hace 2 años

079K

HiOllama: una interfaz de chat limpia para interactuar con los modelos nativos de Ollama

Introducción general HiOllama es una interfaz fácil de usar basada en Python y Gradio, diseñada para interactuar con los modelos de Ollama. Proporciona una interfaz web sencilla e intuitiva que admite la generación de texto en tiempo real y funciones de gestión de modelos. Los usuarios pueden ajustar parámetros como la temperatura y la mayoría...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

079K

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast: Herramienta de IA para convertir PDF en Podcast mediante la configuración de palabras guía

Introducción general NVIDIA AI Blueprint: PDF to Podcast es un proyecto de código abierto desarrollado por NVIDIA para convertir documentos PDF en atractivos contenidos de audio. El proyecto aprovecha NVIDIA NIM (NVID...

Noticias AI # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

078.9K

XiaoYuanKouSuan_Auto：小猿口算自动答题工具，高效解决口算题目

XiaoYuanKouSuan_Auto: Herramienta automática de preguntas y respuestas XiaoYuanKouSuan, que resuelve eficazmente temas de aritmética oral.

Introducción completa Ape Mouth Calculator Automatic Question Answer Tool es un proyecto de código abierto basado en Python diseñado para resolver eficientemente las preguntas de la aplicación Ape Mouth Calculator a través de scripts de reconocimiento OCR y automatización. La herramienta hace uso de tecnologías como OpenCV y Tesseract para poder identificar las preguntas en la pantalla en tiempo real....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Herramientas educativas

hace 2 años

078.9K

Cloud Document Converter：飞书文档下载插件，飞书云文档转换为本地Markdown格式文档

Conversor de documentos en la nube: complemento de descarga de documentos Flying Book, conversión de documentos Flying Book en la nube a documentos locales en formato Markdown.

Introducción general Cloud Document Converter es una extensión de Chrome diseñada para convertir documentos en la nube de Flying Book al formato Markdown. Los usuarios pueden descargar o copiar fácilmente documentos en la nube de Flying Book en formato Markdo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

078.9K

DeepSeek Engineer：基于DeepSeek API的实验性编码助手,附提示词

DeepSeek Engineer: un asistente de codificación experimental basado en la API DeepSeek, con palabras clave.

Descripción general DeepSeek Engineer es una potente herramienta asistente de programación basada en la API DeepSeek, capaz de interactuar con el usuario a través de una intuitiva interfaz de línea de comandos para ayudarle en diversas tareas de desarrollo de software. La herramienta combina la potencia del modelado de lenguajes a gran escala con...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

078.8K

Bambo: un marco ligero y flexible para organismos inteligentes, con una sencilla configuración de roles y herramientas para gestionar múltiples cargas de tareas.

Introducción general Bambo es un nuevo tipo de framework proxy, que es más ligero y flexible que los frameworks convencionales y puede manejar una gran variedad de tareas de carga.Bambo consigue una funcionalidad proxy eficiente definiendo todas las herramientas del catálogo de herramientas y utilizando funciones personalizadas asíncronas. Los usuarios pueden...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Marco de desarrollo del cuerpo inteligente

hace 2 años

078.8K

Azure TTS Importer: integración de servicios de síntesis de voz en el software de lectura

Introducción general TTS Importer es un proyecto de código abierto diseñado para importar fácilmente los servicios de síntesis de voz Azure TTS (Text-to-Speech) en una variedad de software de lectura. La herramienta es compatible con varios software de lectura populares, incluyendo Read (legado...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

078.8K

AigoTools: inclusión automática de sitios web y compatibilidad con el sitio de navegación multilingüe de herramientas de IA de código abierto

Introducción general AigoTools es un código abierto AI navegación de sitios web diseñado para ayudar a los usuarios a crear y gestionar rápidamente los sitios de navegación. Se ha incorporado en la gestión del sitio y las características de auto-inclusión basada en AI , soporte para multi-idioma , cambio de tema oscuro / claro , y la optimización SEO.AigoTools propone...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # AI Java Proyecto de código abierto

hace 2 años

078.8K

OneLine: una herramienta de IA para generar cronologías de acontecimientos candentes

Introducción general OneLine es una herramienta de código abierto para generar cronologías de eventos alojada en GitHub y desarrollada por el usuario chengtx809. Genera rápidamente una línea de tiempo de eventos por palabras clave introducidas por el usuario, mostrando la hora, título, descripción y personas relacionadas del evento....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta de búsqueda de IA

hace 1 año

078.7K

OpenPromptStudio：可视化编辑、管理图像提示词，同步自己的Notion提示词表

OpenPromptStudio: edita y gestiona visualmente avisos de imagen, sincroniza tus propias listas de avisos de Notion.

Introducción general OpenPromptStudio (OPS) es un editor visual de código abierto para palabras clave AIGC, desarrollado por el equipo Moonvy. Está diseñado para simplificar el proceso de creación y gestión de palabras de aviso, apoyando modelos de IA como Midjourney.OPS soporta modelos de IA a través de No...

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # AI Java Proyecto de código abierto

hace 2 años

078.7K

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

WebGPU de razonamiento de Llama 3.2: ejecución de Llama-3.2 en un navegador

Introducción general Transformers.js es una biblioteca JavaScript proporcionada por Hugging Face diseñada para ejecutar modelos de aprendizaje automático de última generación directamente en el navegador, sin soporte de servidor. La librería funciona conjuntamente con la plataforma Hugging Fa...

Noticias AI # AI Java Proyecto de código abierto # Herramienta de modelos de gran tamaño de código abierto desplegada localmente

hace 2 años

078.7K

Xata Agent: un asistente de IA para monitorizar y optimizar bases de datos PostgreSQL

Descripción general Xata Agent es una herramienta de IA de código abierto diseñada específicamente para bases de datos PostgreSQL. Supervisa automáticamente el estado operativo de la base de datos, encuentra la causa raíz de los problemas de rendimiento o fallos y ofrece recomendaciones para solucionarlos. El equipo de desarrollo xAI lo posiciona como un...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Análisis de datos de IA

hace 1 año

078.6K

SongGen: un transformador autorregresivo de una etapa para la generación automática de canciones

Introducción SongGen es un modelo autorregresivo de Transformación de una sola etapa, de código abierto, diseñado para tareas de generación de texto a canción. El modelo es capaz de generar canciones que contienen voces y pistas de acompañamiento de entrada de texto.SongGen proporciona un control de grano fino sobre una amplia gama de atributos musicales ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Música

hace 1 año

078.6K

CleverBee: asistente de investigación de código abierto que genera estudios de citas

Introducción general CleverBee es un asistente de investigación de IA de código abierto alojado en GitHub y desarrollado por SureScaleAI. Ayuda a los usuarios combinando tecnología de navegación web con grandes modelos lingüísticos (como Gemini y Claude)....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Generar un informe de investigación en profundidad

hace 1 año

078.5K

Vídeo MOFA: la tecnología de adaptación del campo de movimiento convierte imágenes fijas en vídeo

Introducción general MOFA-Video es una herramienta de generación de animación de imágenes de última generación que utiliza técnicas generativas de adaptación de campos de movimiento para convertir imágenes estáticas en vídeos dinámicos. Se ha desarrollado en colaboración con la Universidad de Tokio y Tencent AI Lab, y se presentará en la Conferencia Europea de Visión por Computador de 2024 (E...

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Java Proyecto de código abierto

hace 2 años

078.4K

Potpie AI: un asistente de ingeniería de IA para crear rápidamente bases de código propias

Introducción completa Potpie AI es una plataforma de código abierto centrada en proporcionar a los desarrolladores asistentes de ingeniería de IA personalizados. Permite a los agentes de IA comprender en profundidad la estructura y la lógica del código y automatizar tareas como la depuración, las pruebas y la generación de código mediante la construcción de un grafo de conocimiento de la base de código. Los usuarios pueden...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Programación de IA

hace 1 año

078.4K

MM-EUREKA: una herramienta multimodal de aprendizaje por refuerzo para explorar el razonamiento visual

Introducción general MM-EUREKA es un proyecto de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai, la Universidad Jiao Tong de Shanghai y otras partes. Amplía las capacidades de razonamiento textual a escenarios multimodales mediante técnicas de aprendizaje por refuerzo basadas en reglas para ayudar a los modelos a procesar información de imágenes y texto. El núcleo de esta herramienta...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 1 año

078.3K

Babelfish.ai: aplicación de transcripción y traducción de voz en tiempo real para navegadores

Introducción general Babelfish.ai es una aplicación de transcripción y traducción en tiempo real construida sobre Huggingface Transformer.js y Supabase Realtime. La aplicación puede cargar grandes modelos en el navegador y...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Voz a texto

hace 2 años

078.2K

Pyramid Flow: una versión de código abierto de "Kringle" lanzada por Racer, basada en SD3 y que funciona en GPU de menos de 8 GB (versión de despliegue con un solo clic).

Introducción exhaustiva Pyramid Flow es un eficaz método autorregresivo de generación de vídeo basado en la técnica Flow Matching. El método consigue una mayor eficiencia computacional en la generación y descompresión de contenidos de vídeo interpolando entre diferentes resoluciones y niveles de ruido....

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Java Proyecto de código abierto

hace 2 años

078.2K

Gemini Next Chat: ¡Despliegue gratis su aplicación privada multimodal Gemini con un solo clic!

Introducción general Gemini Next Chat es un proyecto de código abierto diseñado para ayudar a los usuarios a desplegar fácilmente aplicaciones Gemini privadas. El proyecto soporta los modelos multimodales Gemini 1.5 y Gemini 2.0 , los usuarios pueden desplegar con un click en Vercel...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 2 años

078.2K

Laboratorio de agentes: asistente automatizado de codificación y redacción de estudios para investigadores

Introducción completa Agent Laboratory es un flujo de trabajo de investigación autónomo de extremo a extremo diseñado para ayudar a los investigadores a hacer realidad sus ideas de investigación. El sistema se compone de agentes dedicados controlados por modelos lingüísticos a gran escala que dan soporte a todo el flujo de trabajo de investigación, desde la realización de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Generar un informe de investigación en profundidad

hace 1 año

078.2K

Audibit: convertir artículos tecnológicos populares en podcasts de audio listos para escuchar

Introducción general Audibit es un proyecto de código abierto, la función principal es Hacker News, TechCrunch y otros artículos populares de tecnología convertidos automáticamente en podcasts de audio, para que los usuarios en el viaje, la aptitud, u ocupado al escuchar la información a través de la Web o móvil. El proyecto hace ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI texto a voz

hace 1 año

078K

Skywork-R1V: un modelo gráfico híbrido de razonamiento multimodal de código abierto por Kunlun Wanwen

Introducción general Skywork-R1V es un modelo de razonamiento multimodal de código abierto desarrollado por el equipo SkyworkAI (Kunlun Wanwei) y publicado en GitHub.Es capaz de procesar imágenes y texto simultáneamente, realizar razonamientos lógicos multipaso, y es particularmente bueno analizando problemas complejos de imágenes. Este...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

078K

LaWGPT: modelización de los conocimientos jurídicos chinos, apoyo a los cuestionarios jurídicos y formación para los exámenes judiciales.

Introducción general LaWGPT es un proyecto de código abierto apoyado por el Grupo de Investigación de Aprendizaje Automático y Minería de Datos de la Universidad de Nanjing, que se dedica a construir un gran modelo lingüístico basado en el conocimiento jurídico chino. Se basa en modelos chinos genéricos (como Chinese-LLaMA y ChatGLM)...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Herramientas educativas

hace 1 año

078K

Devin Cursor Rules：让Cursor和Windsurf 强化为 Devin

Reglas del Cursor Devin: Hacer Cursor y Windsurf Mejorado para Devin

Introducción General Devin Cursor Rules es un proyecto de código abierto que pretende mejorar el Entorno de Desarrollo Integrado (IDE) de Cursor y Windsurf con archivos de configuración y herramientas para habilitar capacidades avanzadas de IA similares a Devin. El proyecto proporciona más de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 2 años

078K

VideoGrain: proyecto de código abierto de indicaciones de texto para la edición local de vídeo

Introducción general VideoGrain es un proyecto de código abierto centrado en la edición de vídeo multigranular, desarrollado por el equipo xAI y alojado en GitHub. Este proyecto surge del artículo "VideoGrain: Modulating Space-Tim...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI editor de audio/vídeo

hace 1 año

078K

Una-Propuesta-Una-Historia: Las Propuestas de Texto Generan Imágenes Coherentes con la Identidad de los Personajes

Synthesis One-Prompt-One-Story (1Prompt1Story) es una innovadora herramienta de generación de texto a imagen diseñada para permitir la generación coherente de imágenes a partir de una sola pregunta. Fue presentada por Tao Liu et al. en el ICLR 2025....

Últimos recursos sobre IA # AI Control de estilo de imagen # AI Java Proyecto de código abierto

hace 1 año

078K

CHRONOS: Herramienta de resumen de cronologías de noticias para mejorar la recuperación de noticias y la eficacia en la generación de cronologías

Introducción general CHRONOS es una herramienta de resumen cronológico de noticias desarrollada por el equipo de PNL de Alibaba. CHRONOS no solo es capaz de gestionar tareas de resumen cronológico de dominio abierto, sino que también es eficiente y escalable....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Herramienta AI de resumen de texto y audio/vídeo

hace 2 años

077.9K

Chitu (Red Rabbit): el equipo de Tsinghua lanza un marco de razonamiento de alto rendimiento basado en grandes modelos lingüísticos

Chitu es un marco de razonamiento de código abierto desarrollado por el equipo PACMAN de la Universidad de Tsinghua, llamado "Red Rabbit", que está especialmente diseñado para ejecutar grandes modelos lingüísticos. Se centra en la eficiencia, la flexibilidad y la practicidad , lo que permite a las empresas desplegar rápidamente grandes modelos en diferentes dispositivos . Chitu soporta una variedad de hardware ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

077.9K

Construcción basada en el GAR de un miniasistente que proporcione asesoramiento sanitario (proyecto piloto)

Introducción general LLM-RAG-Longevity-Coach es un chatbot basado en las tecnologías Large Language Modelling (LLM) y Retrieval Augmented Generation (RAG) diseñado para proporcionar consejos personalizados sobre salud y longevidad a los usuarios. El proyecto fue desarrollado por Tyler Burle...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital

hace 1 año

077.9K

GLIGEN GUI: control preciso de la posición de los elementos de la imagen, interfaz gráfica intuitiva basada en ComfyUI

Introducción general GLIGEN GUI es una interfaz gráfica intuitiva basada en ComfyUI, diseñada para simplificar el uso del modelo GLIGEN, un novedoso modelo texto-imagen que permite especificar con precisión la posición de los objetos en una imagen. Con GLIGE...

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # AI Java Proyecto de código abierto

hace 2 años

077.9K

LangManus: un marco de automatización de IA de código abierto que admite la colaboración multiinteligencia

Introducción general LangManus es un marco de automatización de IA de código abierto alojado en GitHub. Desarrollado por un grupo de antiguos compañeros en su tiempo libre, se trata de un proyecto de orientación académica con el objetivo de combinar modelos lingüísticos y herramientas especializadas para la búsqueda web, el rastreo de datos y la ejecución de código....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente

hace 1 año

077.8K

NoneBot DeepSeek 插件：基于 NoneBot&DeepSeek 实现客服智能对话

Plugin NoneBot DeepSeek: Diálogo inteligente para el servicio de atención al cliente basado en NoneBot y DeepSeek.

Introducción General El plugin DeepSeek de NoneBot es un plugin de NoneBot que integra el modelo DeepSeek y está diseñado para proporcionar diálogo inteligente y funcionalidad de preguntas y respuestas. Al acceder al modelo DeepSeek, los usuarios pueden utilizar el plugin NoneBot...

Últimos recursos sobre IA # Robot AI de atención al cliente # AI Java Proyecto de código abierto

hace 1 año

077.8K

Quanta Quest：端侧大模型与面向个人数据的本地化AI搜索平台（预览版）

Quanta Quest: plataforma de búsqueda de grandes modelos y AI localizada para datos personales (avance)

Introducción Quanta Quest es el primer producto del mundo con "end-side big model + C-side data localisation" como dirección de evolución central. Ayuda a los usuarios a almacenar todos los datos de Gmail, Notion, Dropbox, etc. localmente, y procesarlos a través de la base de datos vectorial para garantizar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

hace 2 años

077.8K

Más información