Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

VoxCPM 1.5 - Modelado de texto a voz de código abierto de extremo a extremo de Faceted Intelligence

VoxCPM 1.5 es un modelo de generación de voz de código abierto publicado por Facade Intelligence, basado en la tecnología de conversión de texto a voz (TTS) sin necesidad de divisor, con varias innovaciones y mejoras. Adoptando una arquitectura autorregresiva de difusión de extremo a extremo, genera formas de onda de habla continua directamente a partir del texto, evitando las limitaciones de los métodos tradicionales de segmentación...
hace 5 meses
041.8K
Mistral Vibe - Mistral AI推出的开源命令行编码助手

Mistral Vibe - Asistente de código de línea de comandos de código abierto de Mistral AI

Mistral Vibe es un asistente de codificación de línea de comandos de código abierto de Mistral AI, desarrollado basado en el modelo Devstral, que soporta la interacción del lenguaje natural para completar la búsqueda de código, manipulación de archivos, control de versiones y otras tareas. Puede escanear automáticamente la estructura del proyecto y el estado de Git a través del símbolo @...
hace 5 meses
032.7K
GLM-TTS - 智谱AI推出的开源工业级语音合成系统

GLM-TTS - Sistema de síntesis de voz industrial de código abierto de Smart Spectrum AI

GLM-TTS es un sistema de síntesis de voz industrial de código abierto con potentes funciones de síntesis de voz. Adopta una arquitectura de generación en dos etapas: la primera convierte el texto en secuencias de tokens de voz y la segunda convierte las secuencias de tokens en audio de alta calidad. El sistema admite sólo 3 segundos de muestras de voz para completar la...
hace 5 meses
032.6K
Devstral 2 - Mistral AI 推出的新一代编程模型家族

Devstral 2 - La nueva generación de modelos de programación de Mistral AI

Devstral 2 es una familia de modelos de programación de nueva generación diseñados para tareas de ingeniería de software de Mistral AI, que consta de las versiones Devstral 2 (parámetro 123B) y Devstral Small 2 (parámetro 24B).D...
hace 5 meses
031.4K
GLM-ASR - 智谱AI开源的高性能语音识别模型系列

GLM-ASR - Serie de modelos de reconocimiento del habla de alto rendimiento y código abierto de Wisdom Spectrum AI

GLM-ASR es una familia de modelos de reconocimiento del habla de alto rendimiento de código abierto de Smart Spectrum AI, que incluye el modelo basado en la nube GLM-ASR-2512 y el modelo de código abierto GLM-ASR-Nano-2512.GLM-ASR-2512 es el modelo de reconocimiento del habla basado en la nube...
hace 5 meses
038.4K
OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM - Modelo de agente de IA de código abierto para teléfonos móviles de Smart Spectrum AI

OpenAutoGLM es un modelo corporal inteligente de código abierto con capacidad de "uso del teléfono móvil", que puede comprender el contenido de la pantalla del teléfono móvil mediante la percepción multimodal, y generar automáticamente el flujo de operaciones para completar las tareas especificadas por el usuario. Los usuarios sólo tienen que utilizar el lenguaje natural para describir las necesidades, como "abrir Meituan para buscar una olla caliente cercana...".
hace 5 meses
033.4K
SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

SurfSense - Herramientas de código abierto para la investigación en IA y la gestión del conocimiento, Las pintas más fuertes de NotebookLM

SurfSense es una herramienta de investigación y gestión del conocimiento de IA de código abierto. Altamente personalizable, puede conectarse a motores de búsqueda, Slack, Jira, Notion, YouTube, GitHub y muchas otras fuentes de datos externas para facilitar la integración de la información. Los usuarios pueden cargar...
hace 5 meses
031.3K
GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - Serie de modelos multilingües multimodales de código abierto Wisdom Spectrum AI

GLM-4.6V es una serie de grandes modelos lingüísticos multimodales de código abierto de Smart Spectrum AI. La serie contiene dos versiones: GLM-4.6V (106B-A12B), la versión base para escenarios de nube y clúster de alto rendimiento, con la arquitectura Mixed Expert (MoE), un total de unos 106.000 millones de referencias y una activación...
hace 5 meses
028.9K
InkSight - Google开源的AI手写识别工具

InkSight - Herramienta de Google de código abierto para el reconocimiento de la escritura a mano con inteligencia artificial

InkSight es la herramienta de reconocimiento de escritura AI de código abierto de Google que convierte notas manuscritas en papel en archivos digitales editables con tinta (por ejemplo, en formato SVG). A diferencia de OCR tradicional , puede reconocer el contenido del texto , puede restaurar el estilo de escritura a mano , la estructura del párrafo y la marca de enfoque , soporte para el procesamiento multi-idioma .
hace 5 meses
028K
NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab modelos gráficos experimentales alfabetizados en anime de código abierto

NewBie-image-Exp0.1 es el primer modelo gráfico experimental de anime nacido de texto y de código abierto del equipo NewBieAI-Lab, que utiliza la arquitectura Next-DiT con parámetros 3.5B, optimizada para el estilo secundario. El modelo está optimizado para el estilo secundario mediante un codificador de texto dual (GEMMA3-4B...
hace 6 meses
031.1K