L'interface utilisateur de Le Chat a été améliorée, Mistral fait officiellement son entrée sur le marché des consommateurs pour concurrencer ChatGPT

Nouvelles de l'IAPosté il y a 10 mois Cercle de partage de l'IA

9.1K 00

Mistral Deux importantes mises à jour de produits ont été publiées d'un seul coup hier soir : l'outil de chat - Le Chat et le modèle multimodal - Pixtral Large.

Le Chat 用户界面功能大升级，Mistral 正式打入消费市场与ChatGPT火拼

Le nouveau Le Chat

Nouvelles fonctionnalités ajoutées : canvas, recherche web, génération d'images, compréhension d'images, toujours comme leur base Mistral API Le service est le même, il faut le garder gratuit.

Le Chat Canvas

Le nouveau contenu peut être généré en sélectionnant des parties du contenu généré et en suggérant des modifications. Sur le côté droit se trouve l'enregistrement de la modification et la version étiquetée, et sur le canevas de gauche se trouve le contenu principal généré.

Le Chat Web Search

S'appuyer sur le moteur de recherche Brave pour obtenir les URL de sources de citations de réponses

Le Chat Reconnaissance d'images

Le contenu de l'image et l'étalonnage de la reconnaissance du sens, bien que la reconnaissance d'un seul caractère chinois soit imprécise, si la longueur du chinois, la reconnaissance peut être plus précise, mais les caractères chinois complexes individuels continueront à identifier des erreurs ou à produire un sens similaire à celui d'un seul mot n'est pas le même. Ceci est similaire au modèle openai, n'en attendez pas trop.

L'exemple suivant d'un OCR illustre bien la situation : l'image ne montre que l'erreur de reconnaissance du texte, le texte original de l'image est l'"inducteur", ce qui indique que la reconnaissance du texte par l'image repose toujours sur une "supposition", le chinois comparé à l'anglais n'est pas une supposition.

Le Chat Génération d'images

Sélectionnez Génération d'images, entrez une invite avec les mots créer, dessiner, générer, etc., et le modèle Flux Pro sera automatiquement appelé pour générer une image.

Agent de réveil

Il s'agit d'une fonctionnalité disponible depuis longtemps... Beaucoup de gens ne remarquent pas qu'il peut sélectionner tous les modèles d'assistants intelligents personnalisés de Mistral pour leur parler, et qu'il est possible de taper dans la boîte de dialogue@ Evoquer l'assistant intelligent. Dans la plupart des tâches, le modèle de grande taille de Mistral accomplit tous les types de tâches est excellent.

Le nouveau modèle multimodal de grande taille, Pixtral Large, vient d'être lancé.

Performance multimodale au niveau des frontières
Etat des lieux sur MathVista, DocVQA, VQAv2
Étend la fonctionnalité de Mistral Large 2 sans affecter la performance du texte.
123B décodeur multimodal, 1B codeur visuel paramétrique
Fenêtre contextuelle de 128K : prend en charge au moins 30 images haute résolution
Utilisation :
- Tentatives de le Chat
- dans notre API a fait mouche pixtral-large-latest
- disponible à l'adresse suivante ici (littéraire) téléchargement

Aujourd'hui, nous avons publié Pixtral Large, un modèle multimodal à pondération ouverte de 124B construit sur Mistral Large 2. Pixtral Large est le deuxième modèle de notre série multimodale qui démontre des capacités de compréhension d'images de pointe. En particulier, le modèle est capable de comprendre des documents, des diagrammes et des images naturelles tout en conservant les capacités de compréhension de texte de Mistral Large 2.

Le modèle est ouvert à la recherche et à l'enseignement dans le cadre de la licence de recherche Mistral (MRL) ; pour l'expérimentation, les essais et la production à des fins commerciales, il peut être utilisé dans le cadre de la licence commerciale Mistral.

représentations

Nous avons évalué la performance de Pixtral Large avec le modèle Frontier sur un ensemble de repères multimodaux standards en utilisant un outil de test à usage général. Sur MathVista, notre modèle atteint 69,4%, surpassant tous les autres modèles et démontrant sa capacité à raisonner sur des mathématiques complexes à partir de données visuelles. Pour évaluer sa capacité à raisonner sur des graphiques et des documents complexes, nous l'avons évalué en utilisant ChartQA et DocVQA, où Pixtral Large a surpassé GPT-4o et Gemini-1.5 Pro.

Enfin, le Pixtral Large se montre compétitif sur le MM-MT-Bench, surpassant le Claude-3.5 Sonnet (nouveau), le Gemini-1.5 Pro et le GPT-4o (nouveau). accroître ses ressources financières Une évaluation basée sur l'examen et conçue pour refléter les scénarios d'application réels des grands modèles linguistiques multimodaux (pour plus d'informations, voir Rapport technique Pixtral 12B).

exemple qualitatif

OCR et inférence multilingue...

Mot de repère :

J'ai acheté du café et des saucisses. Combien dois-je payer ? Plus 18% pour le pourboire.

Réponse :

Pour calculer le montant total incluant le pourboire 18%, suivez les étapes ci-dessous :

Calculer le coût du café et des saucisses :
- 2x Latte Macchiato : 2 * 4.50 CHF = 9.00 CHF
- 1x Schweinschnitzel : 22.00 CHF
- Coût total du café et de la saucisse : 9.00 CHF + 22.00 CHF = 31.00 CHF
Calculez la pointe pour 18% :
- Pourboire : 31,00 CHF * 0,18 = 5,58 CHF
Ajoutez le pourboire au coût total :
- Total dû : 31.00 CHF + 5.58 CHF = 36.58 CHF

Vous paierez donc un total de 36,58 CHF.

Compréhension graphique...

Mot de repère :

Quand le modèle Dark Dragon a-t-il commencé à avoir des problèmes ?

Réponse :

La perte d'entraînement pour le modèle "dark-dragon-50" commence à montrer une instabilité significative à environ 10 000 pas. Il y a un pic clair dans les valeurs de perte à ce moment-là, et un autre pic important à environ 20 000 pas. Ces pics indiquent que le processus d'apprentissage du modèle "dark-dragon-50" commence à poser des problèmes à partir d'environ 10 000 pas.

Plus d'exemples...

Mot de repère :

Quelles sont les entreprises qui utilisent Mistral AI Le modèle ?

Réponse :

Les entreprises qui utilisent le modèle Mistral AI sont indiquées dans le graphique :

BNP Paribas
Courageux
Cloudflare
CMA CGM (Duffy Shipping Group, France)
avant

Une dernière chose...

Avec la sortie de Pixtral LargeMistral LargeNotre modèle de texte de pointe a également été mis à jour. Le modèle a été mis à jour dans notre API intégré dans pixtral-large-latest L'utilisation est également disponible pour la recherche sur HuggingFace dans le cadre d'une licence de recherche Mistral (MRL) ou pour un usage commercial grâce à une licence commerciale de Mistral AI.

Ce dernier modèle est une mise à jour significative du précédent Mistral Large 24.07, avec des avancées significatives dans la compréhension des contextes longs, de nouvelles astuces système et des appels de fonction plus précis. Ce modèle est idéal pour RAG et des flux de travail corporels intelligents qui peuvent être utilisés dans des scénarios d'application au niveau de l'entreprise, tels que l'exploration et le partage des connaissances, la compréhension sémantique des documents, l'automatisation des tâches et l'amélioration de l'expérience des clients.

Mistral Large 24.11 sera bientôt disponible auprès de nos partenaires fournisseurs de cloud, à commencer par Google Cloud et Microsoft Azure, et devrait être disponible d'ici une semaine.

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

L'analyste Alberto Romero spécule : le GPT-5 d'OpenAI est attendu depuis longtemps.

Nouvelles de l'IA

Il y a 7 mois

09K

La dernière version V1 de ComfyUI est disponible ! Une nouvelle interface et une version de bureau entièrement packagée sont disponibles !

Nouvelles de l'IA

Il y a 10 mois

012.3K

MiniMax 首次开源MiniMax-01，4M超长上下文，全新架构，挑战Transformer

MiniMax Première source ouverte MiniMax-01, 4M contexte super long, nouvelle architecture, défi Transformer

Nouvelles de l'IA

Il y a 6 mois

09.9K

L'ancien chef de l'équipe de post-formation d'OpenAI explique les méthodes et les défis de la post-formation, le PPT devient viral !

Nouvelles de l'IA

Il y a 6 mois

08.2K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

L'interface utilisateur de Le Chat a été améliorée, Mistral fait officiellement son entrée sur le marché des consommateurs pour concurrencer ChatGPT

Le nouveau Le Chat

Le Chat Canvas

Le Chat Web Search

Le Chat Reconnaissance d'images

Le Chat Génération d'images

Agent de réveil

Le nouveau modèle multimodal de grande taille, Pixtral Large, vient d'être lancé.

représentations

exemple qualitatif

OCR et inférence multilingue...

Compréhension graphique...

Plus d'exemples...

Une dernière chose...

Utilisation gratuite du nouveau modèle Gemini Experimental 1114 !

Copilot for PowerPoint subit des changements majeurs, voici les points clés à voir : réécrire, traduire, illustrer, annoter...

Articles connexes

L'analyste Alberto Romero spécule : le GPT-5 d'OpenAI est attendu depuis longtemps.

La dernière version V1 de ComfyUI est disponible ! Une nouvelle interface et une version de bureau entièrement packagée sont disponibles !

MiniMax Première source ouverte MiniMax-01, 4M contexte super long, nouvelle architecture, défi Transformer

L'ancien chef de l'équipe de post-formation d'OpenAI explique les méthodes et les défis de la post-formation, le PPT devient viral !

Pas de commentaires

Dernières collections

Derniers articles

L'interface utilisateur de Le Chat a été améliorée, Mistral fait officiellement son entrée sur le marché des consommateurs pour concurrencer ChatGPT

Le nouveau Le Chat

Le Chat Canvas

Le Chat Web Search

Le Chat Reconnaissance d'images

Le Chat Génération d'images

Agent de réveil

Le nouveau modèle multimodal de grande taille, Pixtral Large, vient d'être lancé.

représentations

exemple qualitatif

OCR et inférence multilingue...

Compréhension graphique...

Plus d'exemples...

Une dernière chose...

Utilisation gratuite du nouveau modèle Gemini Experimental 1114 !

Copilot for PowerPoint subit des changements majeurs, voici les points clés à voir : réécrire, traduire, illustrer, annoter...

Articles connexes

L'analyste Alberto Romero spécule : le GPT-5 d'OpenAI est attendu depuis longtemps.

La dernière version V1 de ComfyUI est disponible ! Une nouvelle interface et une version de bureau entièrement packagée sont disponibles !

MiniMax Première source ouverte MiniMax-01, 4M contexte super long, nouvelle architecture, défi Transformer

L'ancien chef de l'équipe de post-formation d'OpenAI explique les méthodes et les défis de la post-formation, le PPT devient viral !

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles