MAI-UI - Modelo de base corporal inteligente GUI universal de código abierto de Ali Tongyi Labs
MAI-UI es un modelo base de cuerpo inteligente GUI universal de código abierto de Alibaba Tongyi Labs, con cuatro capacidades principales: funcionamiento entre aplicaciones, comprensión semántica difusa, interacción activa con el usuario y coordinación de procesos en varios pasos. Adoptando una arquitectura de colaboración extremo-nube, el modelo ligero reside en el dispositivo para gestionar las tareas diarias, y las tareas complejas pueden llamar a la nube big...
MiniMax M2.1 - Código abierto MiniMax y modelos de agentes
MiniMax M2.1 es el modelo de codificación y agente de código abierto de MiniMax con 10.000 millones de activaciones y soporte para muchos de los principales lenguajes de programación como Rust, Java, Golang, C++, Kotlin, Objective-C, TypeS...
InstanceAssemble - Tecnología de generación de control de diseño de código abierto de Little Red Book y la Universidad de Fudan
InstanceAssemble es una tecnología de generación de control de disposición de código abierto desarrollada conjuntamente por Xiaohongshu y la Universidad de Fudan, que consigue una generación de imágenes precisa de disposiciones simples a complejas y de dispersas a densas mediante el mecanismo de "Instance Assemble Attention". Adoptando una arquitectura en cascada de dos etapas , primero en el fondo de la imagen , y luego uno a uno ...
Zen Browser - Navegador web de IA de código abierto basado en el núcleo de Firefox
Zen Browser es un navegador de código abierto basado en el núcleo de Firefox, centrado en una experiencia de navegación sencilla y eficiente, con características básicas como la barra de pestañas vertical y el aislamiento del espacio de trabajo. Con el diseño de barra lateral, puede mostrar claramente el título completo de más de 50 pestañas y soportar la navegación multi-ventana en pantalla dividida.
QwenLong-L1.5 - Modelo de inferencia de texto largo de código abierto de Ali Tongyi Lab
QwenLong-L1.5 es un modelo de inferencia de texto largo de código abierto de Alibaba Tongyi Lab, centrado en la resolución de problemas de inferencia complejos con contextos ultra largos (por ejemplo, 1M-4M de tokens). El principal avance radica en tres innovaciones importantes en la fase de post-entrenamiento: a través del grafo de conocimiento, el análisis sintáctico SQL y la multiinteligencia...
Infografía - Marco de generación de infografías de código abierto del equipo Ali AntV
Infographic es una nueva generación de marco de código abierto del equipo Ali AntV , basado en el desarrollo G2 y Ant Design , centrándose en la rápida generación de infografías de alta calidad , proporcionando 30 + plantillas de diseño , 120 + temas preestablecidos y capacidades de generación inteligente AI .
opcode - aplicación gráfica de escritorio de código abierto diseñada para Claude Code
opcode está diseñado para Claude Code de código abierto aplicación gráfica de escritorio , el desarrollador winfunc basado en Tauri 2 + React 18 + Rust desarrollo . Proporciona una interfaz visual para gestionar proyectos Claude Code , soporte para la creación de...
TurboDiffusion - Raw Digital Technology, Tsinghua y otros marcos de aceleración de generación de vídeo de código abierto
TurboDiffusion es un marco de aceleración de generación de vídeo de código abierto desarrollado conjuntamente por la Universidad de Tsinghua, BioDigital Technology y UC Berkeley, capaz de mejorar la velocidad de generación de vídeo entre 100 y 200 veces manteniendo una calidad de imagen casi sin pérdidas. Mediante la atención lineal dispersa, la destilación por pasos de...
MedASR - Modelo de reconocimiento médico del habla de código abierto de Google
MedASR es un modelo de reconocimiento del habla médica con 105 millones de parámetros, de código abierto de Google, perfeccionado con un corpus clínico desensibilizado de 5.000 horas, optimizado para la terminología de fármacos, dosis y anatomía, con un modelo de lenguaje médico integrado de 6 gramos y una tasa de error de palabra de sólo el 4,6 en el conjunto de datos privados de radiología RAD-DICT...
Fun-Audio-Chat-8B: el macromodelo de código abierto de Ali Tongyi para la interacción verbal de extremo a extremo
Fun-Audio-Chat-8B es un gran modelo de voz integral de 8.000 millones de parámetros de código abierto creado por el equipo de Ali Tongyi, con entrada directa de voz y salida de voz, sin necesidad de empalme ASR+LLM+TTS, bilingüe fluido en chino e inglés, con baja latencia y timbre natural. Utiliza LLM compartido de doble resolución con 25 Hz...









