Anthropic lance les nouveaux modèles Claude 3.5 et les "fonctions d'utilisation informatique".
Anthropic annonce aujourd'hui la sortie d'une version améliorée de l'applicationClaude 3.5 Sonnetet de nouveaux modèlesClaude 3.5 Haiku. Cette mise à jour ne se contente pas d'améliorer les capacités de codage, elle introduit également une fonctionnalité révolutionnaire : la fonctionUtilisation de l'ordinateurqui est actuellement en phase de test public.
mis à jour Claude Le Claude 3.5 Sonnet s'améliore sur tous les fronts par rapport à son prédécesseur, et fait en particulier des progrès significatifs dans le domaine de l'encodage, où il était déjà un leader.Le Claude 3.5 Haiku a des performances comparables à celles de notre plus grand modèle précédent, le Claude 3 Opus, atteignant le même coût et des vitesses similaires à la génération précédente de Haiku dans de nombreuses évaluations.

Mise à jour majeure pour Claude 3.5 Sonnet
Le Sonnet Claude 3.5 mis à jour excelle dans un certain nombre de domaines, en particulier dans l'encodage, où sa performance s'améliore de 33.41 TP3T à 49.01 TP3T dans le benchmark SWE-bench Verified, surpassant tous les modèles publiquement disponibles. En outre, la performance de Sonnet dans les domaines de la vente au détail et de l'aérospatiale de TAU-bench s'est également améliorée de manière significative, de 62,61 TP3T à 69,21 TP3T et de 36,01 TP3T à 46,01 TP3T, respectivement.
Les premiers retours des utilisateurs montrent que Claude 3.5 Sonnet fonctionne bien pendant le développement de logiciels en plusieurs étapes, avec des entreprises telles que GitLab qui ont constaté qu'il améliore le raisonnement de 101 TP3T sans augmentation de la latence.

Claude 3.5 Haiku : efficace et économique à la fois
Le nouveau Claude 3.5 Haiku est le modèle le plus rapide disponible aujourd'hui, et il est particulièrement performant dans les tâches de codage, obtenant un score de 40,61 TP3T dans le banc d'essai SWE Verified.
Fonctions innovantes d'utilisation de l'ordinateur
Claude 3.5 Sonnet est le premier modèle d'IA de pointe à offrir des fonctions d'utilisation de l'ordinateur dans le cadre de tests publics. Les développeurs peuvent demander à Claude d'utiliser l'ordinateur comme un humain via une API, notamment en visualisant l'écran, en déplaçant le curseur, en cliquant sur des boutons et en saisissant du texte. Cette fonctionnalité, qui en est encore au stade expérimental, a été utilisée par Asana, Canva, Cognition et d'autres pour effectuer des tâches complexes.
Bien que l'actuel Claude soit encore maladroit dans l'exécution de certaines actions, il a obtenu un score de 14,91 TP3T lors de l'évaluation d'OSWorld, ce qui est beaucoup plus élevé que les 7,81 TP3T d'autres systèmes d'intelligence artificielle.
regarder vers l'avant
Au fur et à mesure que la technologie évolue, Anthropic se réjouit d'en apprendre davantage sur le potentiel et l'impact de cette nouvelle fonctionnalité grâce au retour d'information des utilisateurs. L'entreprise encourage les développeurs à explorer ces nouveaux modèles et attend avec impatience de voir comment ils utilisent ces innovations pour améliorer la productivité.
Anthropic estime que ces nouveaux développements ouvriront de nouvelles possibilités d'interaction entre les utilisateurs et Claude.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...