Anthropic lance les nouveaux modèles Claude 3.5 et les "fonctions d'utilisation informatique".

Nouvelles de l'IAMise à jour il y a 10 mois Cercle de partage de l'IA
2.7K 00

Anthropic annonce aujourd'hui la sortie d'une version améliorée de l'applicationClaude 3.5 Sonnetet de nouveaux modèlesClaude 3.5 Haiku. Cette mise à jour ne se contente pas d'améliorer les capacités de codage, elle introduit également une fonctionnalité révolutionnaire : la fonctionUtilisation de l'ordinateurqui est actuellement en phase de test public.

mis à jour Claude Le Claude 3.5 Sonnet s'améliore sur tous les fronts par rapport à son prédécesseur, et fait en particulier des progrès significatifs dans le domaine de l'encodage, où il était déjà un leader.Le Claude 3.5 Haiku a des performances comparables à celles de notre plus grand modèle précédent, le Claude 3 Opus, atteignant le même coût et des vitesses similaires à la génération précédente de Haiku dans de nombreuses évaluations.

Anthropic推出全新Claude 3.5模型及「计算机使用功能」

 

Mise à jour majeure pour Claude 3.5 Sonnet

Le Sonnet Claude 3.5 mis à jour excelle dans un certain nombre de domaines, en particulier dans l'encodage, où sa performance s'améliore de 33.41 TP3T à 49.01 TP3T dans le benchmark SWE-bench Verified, surpassant tous les modèles publiquement disponibles. En outre, la performance de Sonnet dans les domaines de la vente au détail et de l'aérospatiale de TAU-bench s'est également améliorée de manière significative, de 62,61 TP3T à 69,21 TP3T et de 36,01 TP3T à 46,01 TP3T, respectivement.

Les premiers retours des utilisateurs montrent que Claude 3.5 Sonnet fonctionne bien pendant le développement de logiciels en plusieurs étapes, avec des entreprises telles que GitLab qui ont constaté qu'il améliore le raisonnement de 101 TP3T sans augmentation de la latence.

Anthropic推出全新Claude 3.5模型及「计算机使用功能」

 

Claude 3.5 Haiku : efficace et économique à la fois

Le nouveau Claude 3.5 Haiku est le modèle le plus rapide disponible aujourd'hui, et il est particulièrement performant dans les tâches de codage, obtenant un score de 40,61 TP3T dans le banc d'essai SWE Verified.

 

Fonctions innovantes d'utilisation de l'ordinateur

Claude 3.5 Sonnet est le premier modèle d'IA de pointe à offrir des fonctions d'utilisation de l'ordinateur dans le cadre de tests publics. Les développeurs peuvent demander à Claude d'utiliser l'ordinateur comme un humain via une API, notamment en visualisant l'écran, en déplaçant le curseur, en cliquant sur des boutons et en saisissant du texte. Cette fonctionnalité, qui en est encore au stade expérimental, a été utilisée par Asana, Canva, Cognition et d'autres pour effectuer des tâches complexes.

Bien que l'actuel Claude soit encore maladroit dans l'exécution de certaines actions, il a obtenu un score de 14,91 TP3T lors de l'évaluation d'OSWorld, ce qui est beaucoup plus élevé que les 7,81 TP3T d'autres systèmes d'intelligence artificielle.

 

regarder vers l'avant

Au fur et à mesure que la technologie évolue, Anthropic se réjouit d'en apprendre davantage sur le potentiel et l'impact de cette nouvelle fonctionnalité grâce au retour d'information des utilisateurs. L'entreprise encourage les développeurs à explorer ces nouveaux modèles et attend avec impatience de voir comment ils utilisent ces innovations pour améliorer la productivité.

Anthropic estime que ces nouveaux développements ouvriront de nouvelles possibilités d'interaction entre les utilisateurs et Claude.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...