Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
MAI-UI - 阿里通义实验室开源的通用GUI智能体基座模型

MAI-UI - Modelo de base corporal inteligente GUI universal de código abierto de Ali Tongyi Labs

MAI-UI es un modelo base de cuerpo inteligente GUI universal de código abierto de Alibaba Tongyi Labs, con cuatro capacidades principales: funcionamiento entre aplicaciones, comprensión semántica difusa, interacción activa con el usuario y coordinación de procesos en varios pasos. Adoptando una arquitectura de colaboración extremo-nube, el modelo ligero reside en el dispositivo para gestionar las tareas diarias, y las tareas complejas pueden llamar a la nube big...
hace 5 meses
037.4K
MiniMax M2.1 - MiniMax开源的编码和代理模型

MiniMax M2.1 - Código abierto MiniMax y modelos de agentes

MiniMax M2.1 es el modelo de codificación y agente de código abierto de MiniMax con 10.000 millones de activaciones y soporte para muchos de los principales lenguajes de programación como Rust, Java, Golang, C++, Kotlin, Objective-C, TypeS...
hace 5 meses
024.8K
InstanceAssemble - 小红书联合复旦大学开源的布局控制生成技术

InstanceAssemble - Tecnología de generación de control de diseño de código abierto de Little Red Book y la Universidad de Fudan

InstanceAssemble es una tecnología de generación de control de disposición de código abierto desarrollada conjuntamente por Xiaohongshu y la Universidad de Fudan, que consigue una generación de imágenes precisa de disposiciones simples a complejas y de dispersas a densas mediante el mecanismo de "Instance Assemble Attention". Adoptando una arquitectura en cascada de dos etapas , primero en el fondo de la imagen , y luego uno a uno ...
hace 5 meses
021.4K
Zen Browser - 基于Firefox内核的开源AI网页浏览器

Zen Browser - Navegador web de IA de código abierto basado en el núcleo de Firefox

Zen Browser es un navegador de código abierto basado en el núcleo de Firefox, centrado en una experiencia de navegación sencilla y eficiente, con características básicas como la barra de pestañas vertical y el aislamiento del espacio de trabajo. Con el diseño de barra lateral, puede mostrar claramente el título completo de más de 50 pestañas y soportar la navegación multi-ventana en pantalla dividida.
hace 5 meses
033.3K
QwenLong-L1.5 - 阿里通义实验室开源的长文本推理模型

QwenLong-L1.5 - Modelo de inferencia de texto largo de código abierto de Ali Tongyi Lab

QwenLong-L1.5 es un modelo de inferencia de texto largo de código abierto de Alibaba Tongyi Lab, centrado en la resolución de problemas de inferencia complejos con contextos ultra largos (por ejemplo, 1M-4M de tokens). El principal avance radica en tres innovaciones importantes en la fase de post-entrenamiento: a través del grafo de conocimiento, el análisis sintáctico SQL y la multiinteligencia...
hace 5 meses
026.4K
Infographic - 阿里AntV团队开源的信息图生成框架

Infografía - Marco de generación de infografías de código abierto del equipo Ali AntV

Infographic es una nueva generación de marco de código abierto del equipo Ali AntV , basado en el desarrollo G2 y Ant Design , centrándose en la rápida generación de infografías de alta calidad , proporcionando 30 + plantillas de diseño , 120 + temas preestablecidos y capacidades de generación inteligente AI .
hace 5 meses
030.8K
opcode - 专为Claude Code设计的开源图形化桌面应用

opcode - aplicación gráfica de escritorio de código abierto diseñada para Claude Code

opcode está diseñado para Claude Code de código abierto aplicación gráfica de escritorio , el desarrollador winfunc basado en Tauri 2 + React 18 + Rust desarrollo . Proporciona una interfaz visual para gestionar proyectos Claude Code , soporte para la creación de...
hace 5 meses
029K
TurboDiffusion - 生数科技联合清华等开源的视频生成加速框架

TurboDiffusion - Raw Digital Technology, Tsinghua y otros marcos de aceleración de generación de vídeo de código abierto

TurboDiffusion es un marco de aceleración de generación de vídeo de código abierto desarrollado conjuntamente por la Universidad de Tsinghua, BioDigital Technology y UC Berkeley, capaz de mejorar la velocidad de generación de vídeo entre 100 y 200 veces manteniendo una calidad de imagen casi sin pérdidas. Mediante la atención lineal dispersa, la destilación por pasos de...
hace 5 meses
033.3K
MedASR - 谷歌开源的医疗语音识别模型

MedASR - Modelo de reconocimiento médico del habla de código abierto de Google

MedASR es un modelo de reconocimiento del habla médica con 105 millones de parámetros, de código abierto de Google, perfeccionado con un corpus clínico desensibilizado de 5.000 horas, optimizado para la terminología de fármacos, dosis y anatomía, con un modelo de lenguaje médico integrado de 6 gramos y una tasa de error de palabra de sólo el 4,6 en el conjunto de datos privados de radiología RAD-DICT...
hace 5 meses
033.9K
Fun-Audio-Chat-8B - 阿里通义开源的端到端语音交互大模型

Fun-Audio-Chat-8B: el macromodelo de código abierto de Ali Tongyi para la interacción verbal de extremo a extremo

Fun-Audio-Chat-8B es un gran modelo de voz integral de 8.000 millones de parámetros de código abierto creado por el equipo de Ali Tongyi, con entrada directa de voz y salida de voz, sin necesidad de empalme ASR+LLM+TTS, bilingüe fluido en chino e inglés, con baja latencia y timbre natural. Utiliza LLM compartido de doble resolución con 25 Hz...
hace 5 meses
030.7K