Círculo de intercambio de inteligencia artificial

Puesta en común diaria de los últimos productos, proyectos, marcos, interpretaciones de documentos, etc.~ sobre IA.
GLM-4.1V-Thinking - 智谱AI推出的开源视觉语言模型系列

GLM-4.1V-Thinking - una familia de modelos de lenguaje visual de código abierto de Smart Spectrum AI

GLM-4.1V-Thinking es un modelo de lenguaje visual de código abierto introducido por Smart Spectrum AI, diseñado para tareas cognitivas complejas.GLM-4.1V-Thinking admite entradas multimodales, que abarcan imágenes, vídeos y documentos. Basado en la arquitectura GLM-4V, el modelo introduce una cadena de pensamiento...
hace 1 mes
02.1K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - Modelado de generación de audio de Ali Tongyi

ThinkSound es el primer modelo de generación de audio CoT (Chain Thinking) introducido por el equipo de discurso de Ali Tongyi. El modelo puede generar efectos de sonido adaptados con precisión a imágenes de vídeo, basándose en la introducción del razonamiento CoT, para resolver el problema de que la tecnología tradicional es difícil de captar los detalles dinámicos de la pantalla y las relaciones espaciales.
hace 1 mes
01.7K
Qwen-TTS - 阿里通义千问推出的语音合成模型

Qwen-TTS - Modelo de síntesis de voz lanzado por Ali Tongyi Qianqian

Qwen-TTS es un modelo avanzado de síntesis de voz introducido por Ali Tongyi. El modelo puede convertir eficazmente texto en habla natural y fluida, y es compatible con varios idiomas y dialectos, como el mandarín, el inglés, el dialecto de Pekín, etc., para satisfacer las necesidades de distintas regiones y escenas. Gracias a la formación de corpus masivos, el modelo produce un discurso de alta calidad,...
hace 1 mes
02.1K
MultiAgentPPT - 开源的AI演示文稿生成系统

MultiAgentPPT - Sistema de generación de presentaciones de IA de código abierto

MultiAgentPPT es un sistema de generación de presentaciones AI multi-inteligente de código abierto. Los usuarios sólo tienen que introducir el tema , el sistema se basa en la colaboración multi-inteligente , completar automáticamente la generación esquema , la división tema , la investigación paralela y resumen de contenido y otros pasos para generar rápidamente PPT.... de alta calidad.
hace 1 mes
02.4K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1: un modelo multimodal de IA unificada lanzado por Ali

Ovis-U1 es un modelo unificado multimodal introducido por el equipo Ovis de Alibaba Group con una escala de parámetros de 3.000 millones. El modelo cuenta con tres capacidades básicas de comprensión multimodal, generación de texto a imagen y edición de imágenes, y con un diseño arquitectónico avanzado y métodos de formación colaborativos y unificados, apoya la realización de...
hace 1 mes
02K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl: aplicación de Google para pruebas virtuales con inteligencia artificial

Doppl es una aplicación de pruebas virtuales de inteligencia artificial de Google. Después de que el usuario sube una foto de cuerpo entero, la aplicación admite la imagen de la ropa o la captura de pantalla "desgaste" en la versión digital de su propio cuerpo, y se puede convertir de imágenes estáticas a vídeo generado por IA, por lo que los usuarios pueden sentir más verdaderamente el efecto de la ropa en el cuerpo.
hace 2 meses
01.7K
迅雷MCP - 迅雷推出的AI自动下载服务

Xunlei MCP - Xunlei lanza un servicio de descarga automática de inteligencia artificial

Xunlei MCP es lanzado por Xunlei, un servicio de descarga automática basado en la tecnología de IA. Los usuarios en la aplicación de AI que soporta el servicio, con la voz o la demanda de descarga de entrada de texto, AI puede buscar automáticamente los recursos de red y comenzar la descarga. Xunlei MCP soporta la versión PC de Xunlei y NAS Xunlei, rompiendo el modo de descarga tradicional, permitiendo...
hace 2 meses
01.6K
咔皮记账 - 商汤科技推出的智能AI记账应用

Kapi Bookkeeping - Aplicación inteligente de contabilidad por IA de ShangTech

Kapi Bookkeeping es una aplicación inteligente de contabilidad basada en IA lanzada por Shangtang Technology. La aplicación toma la contabilidad automática como su función principal, identifica automáticamente las cantidades y categorías, y soporta la entrada de voz, por lo que la contabilidad fácil y conveniente. Kapi Bookkeeping puede analizar de forma inteligente los datos de facturación y enviar periódicamente resúmenes de consumo personalizados y consejos financieros para...
hace 2 meses
02K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Agente de programación de código abierto de Google

Gemini CLI es la herramienta de programación de IA de código abierto de Google basada en la incorporación del Gemini Big Model en el punto final del desarrollador para proporcionar a los desarrolladores potentes capacidades de IA. La herramienta entiende el código, manipula archivos, ejecuta comandos y soluciona problemas de forma dinámica para ayudar a los desarrolladores a escribir de forma eficiente la generación...
hace 2 meses
01.5K
AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - Un modelo cuadrático de generación de imágenes de Toast AI y otros

AnimaTensor es un modelo cuadrático de generación de imágenes del equipo CagliostroLab en colaboración con TensorArt, basado en una innovadora técnica V-Prediction que optimiza la programación del ruido mediante la predicción de la "velocidad" del proceso de generación de imágenes....
hace 2 meses
01.5K