Mistral actualiza la interfaz de usuario de Le Chat y entra oficialmente en el mercado de consumo para competir con ChatGPT

Noticias AIPublicado hace 1 año Círculo de intercambio de inteligencia artificial

53.1K 00

Mistral Anoche se lanzaron de golpe dos importantes actualizaciones de producto: la herramienta de chat - Le Chat y el modelo multimodal - Pixtral Large.

Le Chat 用户界面功能大升级，Mistral 正式打入消费市场与ChatGPT火拼

El nuevo Le Chat

Nuevas funciones añadidas: lienzo, búsqueda web, generación de imágenes, comprensión de imágenes, aún como su base API Mistral El servicio es el mismo, que siga siendo gratuito.

Le Chat Canvas

El nuevo contenido puede generarse seleccionando partes del contenido generado y sugiriendo cambios. A la derecha se encuentra el registro de modificación y la versión etiquetada, y en el lienzo de la izquierda está el contenido principal generado.

Le Chat Búsqueda web

Confíe en el motor de búsqueda Brave para obtener las URL de origen de las citas de respuesta

Le Chat Reconocimiento de imágenes

Contenido de la imagen y la calibración de reconocimiento de significado, mientras que el reconocimiento único chino inexacta, si la longitud de los chinos, puede ser el reconocimiento más preciso, pero los caracteres chinos complejos individuales todavía identificar errores o salida significado similar a la palabra única no es lo mismo. Esto es similar al modelo openai, no esperes demasiado.

El siguiente ejemplo de un OCR puede ser una buena ilustración de la situación: la imagen sólo señala el error de reconocimiento de texto, el texto original en la figura es "inductor", lo que indica que la imagen de reconocimiento de texto o se basan en "adivinar", el chino en comparación con el Inglés ligeramente adivinar no sucede.

Le Chat Generación de imágenes

Seleccione Generación de imágenes, introduzca una instrucción con las palabras crear, dibujar, generar, etc., y el modelo Flux Pro se invocará automáticamente para generar una imagen.

Despertador

Esta es una característica lanzada hace tiempo... Mucha gente no se da cuenta de que puede seleccionar todos los modelos liberados de Mistral para personalizar el asistente inteligente para el diálogo, y se puede escribir en el cuadro de diálogo@ Evoque al asistente inteligente. En la mayoría de las tareas, el modelo de gran tamaño de Mistral completar todo tipo de tareas es excelente.

Presentamos el nuevo modelo grande multimodal Pixtral Large.

Rendimiento multimodal a nivel de frontera
Estado del arte en MathVista, DocVQA, VQAv2
Amplía la funcionalidad de Mistral Large 2 sin afectar al rendimiento del texto.
123B decodificador multimodal, 1B codificador visual paramétrico
Ventana contextual de 128K: admite al menos 30 imágenes de alta resolución
Uso:
- Intentos de le Chat
- en nuestro API ha dado en el clavo pixtral-large-latest
- disponible en aquí (literario) descargando

Hoy lanzamos Pixtral Large, un modelo multimodal de 124B de ponderación abierta basado en Mistral Large 2. Pixtral Large es el segundo modelo de nuestra serie multimodal que demuestra capacidades punteras de comprensión de imágenes. En concreto, el modelo es capaz de comprender documentos, diagramas e imágenes naturales, al tiempo que mantiene las capacidades líderes de comprensión de texto de Mistral Large 2.

El modelo está abierto a la investigación y el uso educativo bajo la Licencia de Investigación Mistral (MRL); para uso experimental, de prueba y de producción con fines comerciales, puede utilizarse bajo la Licencia Comercial Mistral.

actuaciones

Evaluamos el rendimiento de Pixtral Large con el modelo Frontier en un conjunto estándar de puntos de referencia multimodales utilizando una herramienta de pruebas de uso general. En MathVista, nuestro modelo alcanza 69,4%, superando a todos los demás modelos y demostrando su capacidad para razonar sobre matemáticas complejas a partir de datos visuales. Para evaluar su capacidad de razonamiento sobre gráficos y documentos complejos, lo evaluamos utilizando ChartQA y DocVQA, donde Pixtral Large superó a GPT-4o y Gemini-1.5 Pro.

Por último, el Pixtral Large se muestra competitivo en el MM-MT-Bench, superando al Claude-3.5 Sonnet (nuevo), al Gemini-1.5 Pro y al GPT-4o (más nuevo).El MM-MT-Bench es un ampliar los propios recursos financieros Una evaluación basada en revisiones diseñada para reflejar los escenarios de aplicación en el mundo real de los grandes modelos lingüísticos multimodales (para más información, véase Informe técnico Pixtral 12B).

ejemplo cualitativo

OCR multilingüe e inferencia...

Palabra clave:

He comprado café y salchichas. ¿Cuánto debo pagar? Más 18% por la propina.

Contesta:

Para calcular el importe total, incluida la propina 18%, siga los pasos que se indican a continuación:

Calcula el coste del café y las salchichas:
- 2 Latte Macchiato: 2 * 4,50 CHF = 9,00 CHF
- 1x Schweinschnitzel: 22,00 CHF
- Coste total del café y la salchicha: 9,00 CHF + 22,00 CHF = 31,00 CHF
Calcular la punta para 18%:
- Propina: 31,00 CHF * 0,18 = 5,58 CHF
Añade la propina al coste total:
- Total a pagar: 31,00 CHF + 5,58 CHF = 36,58 CHF

Por lo tanto, pagará un total de 36,58 CHF.

Comprensión gráfica...

Palabra clave:

¿Cuándo empezó a tener problemas el modelo Dark Dragon?

Contesta:

La pérdida de entrenamiento para el modelo "dark-dragon-50" empieza a mostrar una inestabilidad significativa en torno a los 10.000 pasos. En este punto se produce un claro pico en los valores de pérdida, y otro pico importante en torno a los 20.000 pasos. Estos picos indican que el proceso de entrenamiento del modelo "dark-dragon-50" empieza a tener problemas a partir de unos 10.000 pasos.

Más ejemplos...

Palabra clave:

Qué empresas utilizan Mistral AI ¿El modelo?

Contesta:

El gráfico muestra las empresas que utilizan el modelo Mistral AI:

BNP Paribas
Valiente
Cloudflare
CMA CGM (Duffy Shipping Group, Francia)
frente

Una cosa más...

Con el lanzamiento de Pixtral LargeMistral GrandeTambién se ha actualizado nuestro modelo de texto de última generación. El modelo se ha actualizado en nuestro API integrado en pixtral-large-latest El uso también está disponible para la investigación de HuggingFace bajo una Licencia de Investigación de Mistral (MRL) o para uso comercial a través de una licencia comercial de Mistral AI.

Este último modelo supone una importante mejora respecto al anterior Mistral Large 24.07, con avances significativos en la comprensión de contextos largos, nuevas sugerencias del sistema y llamadas a funciones más precisas. Este modelo es ideal para RAG y flujos de trabajo corporales inteligentes que pueden utilizarse en escenarios de aplicaciones empresariales como la exploración y el intercambio de conocimientos, la comprensión semántica de documentos, la automatización de tareas y la mejora de la experiencia del cliente.

Mistral Large 24.11 se lanzará en breve a través de nuestros socios proveedores de servicios en la nube, empezando por Google Cloud y Microsoft Azure, y se espera que esté disponible en una semana.