Mistral actualiza la interfaz de usuario de Le Chat y entra oficialmente en el mercado de consumo para competir con ChatGPT
Mistral Anoche se lanzaron de golpe dos importantes actualizaciones de producto: la herramienta de chat - Le Chat y el modelo multimodal - Pixtral Large.

El nuevo Le Chat
Nuevas funciones añadidas: lienzo, búsqueda web, generación de imágenes, comprensión de imágenes, aún como su base API Mistral El servicio es el mismo, que siga siendo gratuito.
Le Chat Canvas
El nuevo contenido puede generarse seleccionando partes del contenido generado y sugiriendo cambios. A la derecha se encuentra el registro de modificación y la versión etiquetada, y en el lienzo de la izquierda está el contenido principal generado.

Le Chat Búsqueda web
Confíe en el motor de búsqueda Brave para obtener las URL de origen de las citas de respuesta

Le Chat Reconocimiento de imágenes
Contenido de la imagen y la calibración de reconocimiento de significado, mientras que el reconocimiento único chino inexacta, si la longitud de los chinos, puede ser el reconocimiento más preciso, pero los caracteres chinos complejos individuales todavía identificar errores o salida significado similar a la palabra única no es lo mismo. Esto es similar al modelo openai, no esperes demasiado.

El siguiente ejemplo de un OCR puede ser una buena ilustración de la situación: la imagen sólo señala el error de reconocimiento de texto, el texto original en la figura es "inductor", lo que indica que la imagen de reconocimiento de texto o se basan en "adivinar", el chino en comparación con el Inglés ligeramente adivinar no sucede.

Le Chat Generación de imágenes
Seleccione Generación de imágenes, introduzca una instrucción con las palabras crear, dibujar, generar, etc., y el modelo Flux Pro se invocará automáticamente para generar una imagen.

Despertador
Esta es una característica lanzada hace tiempo... Mucha gente no se da cuenta de que puede seleccionar todos los modelos liberados de Mistral para personalizar el asistente inteligente para el diálogo, y se puede escribir en el cuadro de diálogo@
Evoque al asistente inteligente. En la mayoría de las tareas, el modelo de gran tamaño de Mistral completar todo tipo de tareas es excelente.

Presentamos el nuevo modelo grande multimodal Pixtral Large.
- Rendimiento multimodal a nivel de frontera
- Estado del arte en MathVista, DocVQA, VQAv2
- Amplía la funcionalidad de Mistral Large 2 sin afectar al rendimiento del texto.
- 123B decodificador multimodal, 1B codificador visual paramétrico
- Ventana contextual de 128K: admite al menos 30 imágenes de alta resolución
- Uso:
- Intentos de le Chat
- en nuestro API ha dado en el clavo
pixtral-large-latest
- disponible en aquí (literario) descargando
Hoy lanzamos Pixtral Large, un modelo multimodal de 124B de ponderación abierta basado en Mistral Large 2. Pixtral Large es el segundo modelo de nuestra serie multimodal que demuestra capacidades punteras de comprensión de imágenes. En concreto, el modelo es capaz de comprender documentos, diagramas e imágenes naturales, al tiempo que mantiene las capacidades líderes de comprensión de texto de Mistral Large 2.
El modelo está abierto a la investigación y el uso educativo bajo la Licencia de Investigación Mistral (MRL); para uso experimental, de prueba y de producción con fines comerciales, puede utilizarse bajo la Licencia Comercial Mistral.

actuaciones
Evaluamos el rendimiento de Pixtral Large con el modelo Frontier en un conjunto estándar de puntos de referencia multimodales utilizando una herramienta de pruebas de uso general. En MathVista, nuestro modelo alcanza 69,4%, superando a todos los demás modelos y demostrando su capacidad para razonar sobre matemáticas complejas a partir de datos visuales. Para evaluar su capacidad de razonamiento sobre gráficos y documentos complejos, lo evaluamos utilizando ChartQA y DocVQA, donde Pixtral Large superó a GPT-4o y Gemini-1.5 Pro.
Por último, el Pixtral Large se muestra competitivo en el MM-MT-Bench, superando al Claude-3.5 Sonnet (nuevo), al Gemini-1.5 Pro y al GPT-4o (más nuevo).El MM-MT-Bench es un ampliar los propios recursos financieros Una evaluación basada en revisiones diseñada para reflejar los escenarios de aplicación en el mundo real de los grandes modelos lingüísticos multimodales (para más información, véase Informe técnico Pixtral 12B).

ejemplo cualitativo
OCR multilingüe e inferencia...

Palabra clave:
He comprado café y salchichas. ¿Cuánto debo pagar? Más 18% por la propina.
Contesta:
Para calcular el importe total, incluida la propina 18%, siga los pasos que se indican a continuación:
- Calcula el coste del café y las salchichas:
- 2 Latte Macchiato: 2 * 4,50 CHF = 9,00 CHF
- 1x Schweinschnitzel: 22,00 CHF
- Coste total del café y la salchicha: 9,00 CHF + 22,00 CHF = 31,00 CHF
- Calcular la punta para 18%:
- Propina: 31,00 CHF * 0,18 = 5,58 CHF
- Añade la propina al coste total:
- Total a pagar: 31,00 CHF + 5,58 CHF = 36,58 CHF
Por lo tanto, pagará un total de 36,58 CHF.
Comprensión gráfica...

Palabra clave:
¿Cuándo empezó a tener problemas el modelo Dark Dragon?
Contesta:
La pérdida de entrenamiento para el modelo "dark-dragon-50" empieza a mostrar una inestabilidad significativa en torno a los 10.000 pasos. En este punto se produce un claro pico en los valores de pérdida, y otro pico importante en torno a los 20.000 pasos. Estos picos indican que el proceso de entrenamiento del modelo "dark-dragon-50" empieza a tener problemas a partir de unos 10.000 pasos.
Más ejemplos...

Palabra clave:
Qué empresas utilizan Mistral AI ¿El modelo?
Contesta:
El gráfico muestra las empresas que utilizan el modelo Mistral AI:
- BNP Paribas
- Valiente
- Cloudflare
- CMA CGM (Duffy Shipping Group, Francia)
- frente
Una cosa más...
Con el lanzamiento de Pixtral LargeMistral GrandeTambién se ha actualizado nuestro modelo de texto de última generación. El modelo se ha actualizado en nuestro API integrado en pixtral-large-latest
El uso también está disponible para la investigación de HuggingFace bajo una Licencia de Investigación de Mistral (MRL) o para uso comercial a través de una licencia comercial de Mistral AI.
Este último modelo supone una importante mejora respecto al anterior Mistral Large 24.07, con avances significativos en la comprensión de contextos largos, nuevas sugerencias del sistema y llamadas a funciones más precisas. Este modelo es ideal para RAG y flujos de trabajo corporales inteligentes que pueden utilizarse en escenarios de aplicaciones empresariales como la exploración y el intercambio de conocimientos, la comprensión semántica de documentos, la automatización de tareas y la mejora de la experiencia del cliente.
Mistral Large 24.11 se lanzará en breve a través de nuestros socios proveedores de servicios en la nube, empezando por Google Cloud y Microsoft Azure, y se espera que esté disponible en una semana.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...