L'interface utilisateur de Le Chat a été améliorée, Mistral fait officiellement son entrée sur le marché des consommateurs pour concurrencer ChatGPT
Mistral Deux importantes mises à jour de produits ont été publiées d'un seul coup hier soir : l'outil de chat - Le Chat et le modèle multimodal - Pixtral Large.

Le nouveau Le Chat
Nouvelles fonctionnalités ajoutées : canvas, recherche web, génération d'images, compréhension d'images, toujours comme leur base Mistral API Le service est le même, il faut le garder gratuit.
Le Chat Canvas
Le nouveau contenu peut être généré en sélectionnant des parties du contenu généré et en suggérant des modifications. Sur le côté droit se trouve l'enregistrement de la modification et la version étiquetée, et sur le canevas de gauche se trouve le contenu principal généré.

Le Chat Web Search
S'appuyer sur le moteur de recherche Brave pour obtenir les URL de sources de citations de réponses

Le Chat Reconnaissance d'images
Le contenu de l'image et l'étalonnage de la reconnaissance du sens, bien que la reconnaissance d'un seul caractère chinois soit imprécise, si la longueur du chinois, la reconnaissance peut être plus précise, mais les caractères chinois complexes individuels continueront à identifier des erreurs ou à produire un sens similaire à celui d'un seul mot n'est pas le même. Ceci est similaire au modèle openai, n'en attendez pas trop.

L'exemple suivant d'un OCR illustre bien la situation : l'image ne montre que l'erreur de reconnaissance du texte, le texte original de l'image est l'"inducteur", ce qui indique que la reconnaissance du texte par l'image repose toujours sur une "supposition", le chinois comparé à l'anglais n'est pas une supposition.

Le Chat Génération d'images
Sélectionnez Génération d'images, entrez une invite avec les mots créer, dessiner, générer, etc., et le modèle Flux Pro sera automatiquement appelé pour générer une image.

Agent de réveil
Il s'agit d'une fonctionnalité disponible depuis longtemps... Beaucoup de gens ne remarquent pas qu'il peut sélectionner tous les modèles d'assistants intelligents personnalisés de Mistral pour leur parler, et qu'il est possible de taper dans la boîte de dialogue@
Evoquer l'assistant intelligent. Dans la plupart des tâches, le modèle de grande taille de Mistral accomplit tous les types de tâches est excellent.

Le nouveau modèle multimodal de grande taille, Pixtral Large, vient d'être lancé.
- Performance multimodale au niveau des frontières
- Etat des lieux sur MathVista, DocVQA, VQAv2
- Étend la fonctionnalité de Mistral Large 2 sans affecter la performance du texte.
- 123B décodeur multimodal, 1B codeur visuel paramétrique
- Fenêtre contextuelle de 128K : prend en charge au moins 30 images haute résolution
- Utilisation :
- Tentatives de le Chat
- dans notre API a fait mouche
pixtral-large-latest
- disponible à l'adresse suivante ici (littéraire) téléchargement
Aujourd'hui, nous avons publié Pixtral Large, un modèle multimodal à pondération ouverte de 124B construit sur Mistral Large 2. Pixtral Large est le deuxième modèle de notre série multimodale qui démontre des capacités de compréhension d'images de pointe. En particulier, le modèle est capable de comprendre des documents, des diagrammes et des images naturelles tout en conservant les capacités de compréhension de texte de Mistral Large 2.
Le modèle est ouvert à la recherche et à l'enseignement dans le cadre de la licence de recherche Mistral (MRL) ; pour l'expérimentation, les essais et la production à des fins commerciales, il peut être utilisé dans le cadre de la licence commerciale Mistral.

représentations
Nous avons évalué la performance de Pixtral Large avec le modèle Frontier sur un ensemble de repères multimodaux standards en utilisant un outil de test à usage général. Sur MathVista, notre modèle atteint 69,4%, surpassant tous les autres modèles et démontrant sa capacité à raisonner sur des mathématiques complexes à partir de données visuelles. Pour évaluer sa capacité à raisonner sur des graphiques et des documents complexes, nous l'avons évalué en utilisant ChartQA et DocVQA, où Pixtral Large a surpassé GPT-4o et Gemini-1.5 Pro.
Enfin, le Pixtral Large se montre compétitif sur le MM-MT-Bench, surpassant le Claude-3.5 Sonnet (nouveau), le Gemini-1.5 Pro et le GPT-4o (nouveau). accroître ses ressources financières Une évaluation basée sur l'examen et conçue pour refléter les scénarios d'application réels des grands modèles linguistiques multimodaux (pour plus d'informations, voir Rapport technique Pixtral 12B).

exemple qualitatif
OCR et inférence multilingue...

Mot de repère :
J'ai acheté du café et des saucisses. Combien dois-je payer ? Plus 18% pour le pourboire.
Réponse :
Pour calculer le montant total incluant le pourboire 18%, suivez les étapes ci-dessous :
- Calculer le coût du café et des saucisses :
- 2x Latte Macchiato : 2 * 4.50 CHF = 9.00 CHF
- 1x Schweinschnitzel : 22.00 CHF
- Coût total du café et de la saucisse : 9.00 CHF + 22.00 CHF = 31.00 CHF
- Calculez la pointe pour 18% :
- Pourboire : 31,00 CHF * 0,18 = 5,58 CHF
- Ajoutez le pourboire au coût total :
- Total dû : 31.00 CHF + 5.58 CHF = 36.58 CHF
Vous paierez donc un total de 36,58 CHF.
Compréhension graphique...

Mot de repère :
Quand le modèle Dark Dragon a-t-il commencé à avoir des problèmes ?
Réponse :
La perte d'entraînement pour le modèle "dark-dragon-50" commence à montrer une instabilité significative à environ 10 000 pas. Il y a un pic clair dans les valeurs de perte à ce moment-là, et un autre pic important à environ 20 000 pas. Ces pics indiquent que le processus d'apprentissage du modèle "dark-dragon-50" commence à poser des problèmes à partir d'environ 10 000 pas.
Plus d'exemples...

Mot de repère :
Quelles sont les entreprises qui utilisent Mistral AI Le modèle ?
Réponse :
Les entreprises qui utilisent le modèle Mistral AI sont indiquées dans le graphique :
- BNP Paribas
- Courageux
- Cloudflare
- CMA CGM (Duffy Shipping Group, France)
- avant
Une dernière chose...
Avec la sortie de Pixtral LargeMistral LargeNotre modèle de texte de pointe a également été mis à jour. Le modèle a été mis à jour dans notre API intégré dans pixtral-large-latest
L'utilisation est également disponible pour la recherche sur HuggingFace dans le cadre d'une licence de recherche Mistral (MRL) ou pour un usage commercial grâce à une licence commerciale de Mistral AI.
Ce dernier modèle est une mise à jour significative du précédent Mistral Large 24.07, avec des avancées significatives dans la compréhension des contextes longs, de nouvelles astuces système et des appels de fonction plus précis. Ce modèle est idéal pour RAG et des flux de travail corporels intelligents qui peuvent être utilisés dans des scénarios d'application au niveau de l'entreprise, tels que l'exploration et le partage des connaissances, la compréhension sémantique des documents, l'automatisation des tâches et l'amélioration de l'expérience des clients.
Mistral Large 24.11 sera bientôt disponible auprès de nos partenaires fournisseurs de cloud, à commencer par Google Cloud et Microsoft Azure, et devrait être disponible d'ici une semaine.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...