Círculo de intercambio de inteligencia artificial

¡Día arqueando un peón y compartiendo por el rey!
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)

1-2-1-MNVTON: imágenes eficaces, pruebas virtuales de ropa por personas en vídeos (por abrir)

Introducción general 1-2-1-MNVTON es un proyecto de código abierto basado en GitHub cuyo objetivo es proporcionar la tecnología "Modality-specific Normalization for Virtual Try-On" (MNVTON) mediante...
hace 1 año
048.9K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: eficaz herramienta de conversión de texto en voz con soporte multilingüe y multivoz

Introducción completa Kokoro-ONNX es una herramienta de texto a voz (TTS) de código abierto basada en el tiempo de ejecución ONNX. Desarrollado por thewh1teagle , el proyecto tiene como objetivo proporcionar soluciones de síntesis de voz eficientes y rápidas.Kokoro-ONNX soporta...
hace 1 año
0103K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversión de imágenes a Markdown, modelo visual OCR de alta precisión

Introducción general Zerox es un proyecto de código abierto diseñado para convertir PDF, DOCX, imágenes y otros documentos a formato Markdown a través de modelos visuales. El proyecto ha sido desarrollado por el equipo getomni-ai y proporciona una solución OCR (Reconocimiento Óptico de Caracteres) sencilla y eficiente.
hace 1 año
074.6K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: Edita automáticamente los vídeos más destacados, crea fácilmente vlogs profesionales

Introducción completa AIVLOG es una herramienta de edición de vídeo AI diseñado para creadores de Vlog. Puede analizar automáticamente el contenido del vídeo y editar de forma inteligente los aspectos más destacados, ahorrando a los usuarios 95% tiempo de edición. Ya se trate de un vídeo de la vida cotidiana, registros de viajes o conversaciones, AIVLOG puede...
hace 1 año
063.6K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Descripción general Charla es una aplicación de chat basada en endpoints diseñada para entablar diálogos con modelos lingüísticos nativos. La aplicación se integra con el backend Ollama, admite diálogos contextuales y guarda las sesiones de chat como archivos Markdown. Los usuarios pueden...
hace 1 año
059.3K
Windsurf Wave 2 重大更新:引入网页搜索和自动化记忆功能,并提供企业级混合部署版本

Actualización importante de Windsurf Wave 2: introduce la búsqueda web y la memoria automatizada con la versión de despliegue híbrido para empresas

Codeium acaba de lanzar la actualización Windsurf Wave 2, que aporta varias mejoras importantes a los desarrolladores, como la búsqueda web, las memorias automatizadas y la optimización de la ejecución de código. Como herramienta Top 2 AI Coding, estas actualizaciones están diseñadas para proporcionar 20...
hace 1 año
050.1K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

Google lanza el motor Vertex AI RAG: una ventanilla única para crear aplicaciones generativas fiables mejoradas mediante búsquedas

La IA generativa y el modelado de grandes lenguajes (LLM) están transformando las industrias, pero dos retos clave pueden dificultar su adopción por parte de las empresas: la desilusión (generar información incorrecta o sin sentido) y el conocimiento limitado más allá de sus datos de entrenamiento. La generación aumentada por recuperación (RAG) y la ...
hace 1 año
050.7K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: Marco de Generación Mejorada de Recuperación Simplificada, Índice de Grafos de Entidades Recupera Bloques de Texto Relevantes

Una introducción exhaustiva MiniRAG es un marco de trabajo de Generación Aumentada de Recuperación (RAG) extremadamente sencillo que pretende permitir un buen rendimiento de la RAG incluso para modelos pequeños mediante la indexación de grafos heterogéneos y la recuperación mejorada por topología ligera. Ha sido desarrollado por el Laboratorio de Ciencia de Datos de la Universidad de Hong Kong (HKUDS) para ...
hace 1 año
061.4K
Perplexity AI 提出与美国 TikTok 合并(收购)的竞标方案

Perplexity AI presenta una oferta para fusionarse con (adquirir) la estadounidense TikTok

Lo esencial: Perplexity AI presentó una oferta a la empresa matriz de TikTok, ByteDance, el sábado proponiendo que Perplexity se fusione con las operaciones de TikTok en EE.UU., según ha sabido CNBC. Una fuente familiarizada con la situación reveló...
hace 1 año
040.8K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: un gran modelo multimodal de comprensión regional de imágenes y vídeos para mejorar el análisis del contenido visual

Introducción exhaustiva Omni-RGPT es un modelo de lenguaje multimodal de gran tamaño diseñado para permitir la comprensión a nivel de región de imágenes y vídeos. Mediante la introducción de la técnica Token Mark, Omni-RGPT es capaz de resaltar la región objetivo en el espacio de características visuales e indicar la región objetivo mediante pistas de región (por ejemplo, recuadros o...
hace 1 año
061.9K