GLM-4.1V-Thinking - una familia de modelos de lenguaje visual de código abierto de Smart Spectrum AI
GLM-4.1V-Thinking es un modelo de lenguaje visual de código abierto introducido por Smart Spectrum AI, diseñado para tareas cognitivas complejas.GLM-4.1V-Thinking admite entradas multimodales, que abarcan imágenes, vídeos y documentos. Basado en la arquitectura GLM-4V, el modelo introduce una cadena de pensamiento...
ThinkSound - Modelado de generación de audio de Ali Tongyi
ThinkSound es el primer modelo de generación de audio CoT (Chain Thinking) introducido por el equipo de discurso de Ali Tongyi. El modelo puede generar efectos de sonido adaptados con precisión a imágenes de vídeo, basándose en la introducción del razonamiento CoT, para resolver el problema de que la tecnología tradicional es difícil de captar los detalles dinámicos de la pantalla y las relaciones espaciales.
Qwen-TTS - Modelo de síntesis de voz lanzado por Ali Tongyi Qianqian
Qwen-TTS es un modelo avanzado de síntesis de voz introducido por Ali Tongyi. El modelo puede convertir eficazmente texto en habla natural y fluida, y es compatible con varios idiomas y dialectos, como el mandarín, el inglés, el dialecto de Pekín, etc., para satisfacer las necesidades de distintas regiones y escenas. Gracias a la formación de corpus masivos, el modelo produce un discurso de alta calidad,...
MultiAgentPPT - Sistema de generación de presentaciones de IA de código abierto
MultiAgentPPT es un sistema de generación de presentaciones AI multi-inteligente de código abierto. Los usuarios sólo tienen que introducir el tema , el sistema se basa en la colaboración multi-inteligente , completar automáticamente la generación esquema , la división tema , la investigación paralela y resumen de contenido y otros pasos para generar rápidamente PPT.... de alta calidad.
Ovis-U1: un modelo multimodal de IA unificada lanzado por Ali
Ovis-U1 es un modelo unificado multimodal introducido por el equipo Ovis de Alibaba Group con una escala de parámetros de 3.000 millones. El modelo cuenta con tres capacidades básicas de comprensión multimodal, generación de texto a imagen y edición de imágenes, y con un diseño arquitectónico avanzado y métodos de formación colaborativos y unificados, apoya la realización de...
Doppl: aplicación de Google para pruebas virtuales con inteligencia artificial
Doppl es una aplicación de pruebas virtuales de inteligencia artificial de Google. Después de que el usuario sube una foto de cuerpo entero, la aplicación admite la imagen de la ropa o la captura de pantalla "desgaste" en la versión digital de su propio cuerpo, y se puede convertir de imágenes estáticas a vídeo generado por IA, por lo que los usuarios pueden sentir más verdaderamente el efecto de la ropa en el cuerpo.
Xunlei MCP - Xunlei lanza un servicio de descarga automática de inteligencia artificial
Xunlei MCP es lanzado por Xunlei, un servicio de descarga automática basado en la tecnología de IA. Los usuarios en la aplicación de AI que soporta el servicio, con la voz o la demanda de descarga de entrada de texto, AI puede buscar automáticamente los recursos de red y comenzar la descarga. Xunlei MCP soporta la versión PC de Xunlei y NAS Xunlei, rompiendo el modo de descarga tradicional, permitiendo...
Kapi Bookkeeping - Aplicación inteligente de contabilidad por IA de ShangTech
Kapi Bookkeeping es una aplicación inteligente de contabilidad basada en IA lanzada por Shangtang Technology. La aplicación toma la contabilidad automática como su función principal, identifica automáticamente las cantidades y categorías, y soporta la entrada de voz, por lo que la contabilidad fácil y conveniente. Kapi Bookkeeping puede analizar de forma inteligente los datos de facturación y enviar periódicamente resúmenes de consumo personalizados y consejos financieros para...
Gemini CLI - Agente de programación de código abierto de Google
Gemini CLI es la herramienta de programación de IA de código abierto de Google basada en la incorporación del Gemini Big Model en el punto final del desarrollador para proporcionar a los desarrolladores potentes capacidades de IA. La herramienta entiende el código, manipula archivos, ejecuta comandos y soluciona problemas de forma dinámica para ayudar a los desarrolladores a escribir de forma eficiente la generación...
AnimaTensor - Un modelo cuadrático de generación de imágenes de Toast AI y otros
AnimaTensor es un modelo cuadrático de generación de imágenes del equipo CagliostroLab en colaboración con TensorArt, basado en una innovadora técnica V-Prediction que optimiza la programación del ruido mediante la predicción de la "velocidad" del proceso de generación de imágenes....