Anthropic hat heute die Veröffentlichung einer aktualisierten Version desClaude 3.5 Sonettund neue ModelleClaude 3.5 Haiku. Diese Aktualisierung verbessert nicht nur die Codierungsmöglichkeiten, sondern führt auch eine bahnbrechende Funktion ein - dieComputereinsatz, die sich derzeit in der öffentlichen Testphase befindet.
aktualisiert Claude 3.5 Sonnet verbessert seinen Vorgänger in allen Bereichen und macht insbesondere im Bereich der Verschlüsselung, in dem er bereits führend war, erhebliche Fortschritte. 3.5 Haiku liegt auf Augenhöhe mit unserem größten Vorgängermodell, dem Claude 3 Opus, und erreicht in vielen Bewertungen die gleichen Kosten und ähnliche Geschwindigkeiten wie die vorherige Haiku-Generation.
Großes Upgrade für Claude 3.5 Sonnet
Der aktualisierte Claude 3.5 Sonnet zeichnet sich in einer Reihe von Bereichen aus, insbesondere bei der Verschlüsselung, wo seine Leistung im SWE-bench Verified Benchmark von 33,41 TP3T auf 49,01 TP3T steigt und damit alle öffentlich verfügbaren Modelle übertrifft. Darüber hinaus verbesserte sich die Leistung von Sonnet in den Bereichen Einzelhandel und Luft- und Raumfahrt des TAU-Bench von 62,61 TP3T auf 69,21 TP3T bzw. von 36,01 TP3T auf 46,01 TP3T.
Erste Rückmeldungen von Anwendern zeigen, dass Claude 3.5 Sonnet bei der Softwareentwicklung in mehreren Schritten gut funktioniert. Unternehmen wie GitLab haben festgestellt, dass es die Argumentation um 101 TP3T verbessert, ohne dass sich die Latenzzeit erhöht.
Klausel 3.5 Haiku: Effizient und sparsam zugleich
Der neue Claude 3.5 Haiku ist das schnellste derzeit erhältliche Modell, das bei Codierungsaufgaben besonders gut abschneidet und im SWE-Bench Verified 40,61 TP3T erzielt - und damit seinen Vorgänger, das größte Modell Claude 3 Opus, bei gleichen Kosten und gleicher Geschwindigkeit übertrifft.
Innovative Funktionen für die Computernutzung
Claude 3.5 Sonnet ist das erste hochmoderne KI-Modell, das in öffentlichen Tests Funktionen zur Computernutzung bietet. Entwickler können Claude über die API anweisen, den Computer wie ein Mensch zu nutzen, d. h. den Bildschirm zu betrachten, den Cursor zu bewegen, auf Schaltflächen zu klicken und Text einzugeben. Diese Funktionalität befindet sich zwar noch im Versuchsstadium, wurde aber bereits von Asana, Canva, Cognition und anderen genutzt, um komplexe Aufgaben zu erledigen.
Obwohl der aktuelle Claude bei der Durchführung bestimmter Aktionen immer noch ungeschickt ist, erreichte er bei der OSWorld-Bewertung 14,91 TP3T, was deutlich über den 7,81 TP3T anderer KI-Systeme liegt.Anthropic sagt, dass es diese Fähigkeit weiter verbessern und Maßnahmen zur sicheren Nutzung ergreifen wird, um möglichen Missbrauch zu verhindern.
vorausschauend
Anthropic freut sich darauf, durch das Feedback der Nutzer mehr über das Potenzial und die Auswirkungen dieser neuen Funktionen zu erfahren. Das Unternehmen ermutigt Entwickler, diese neuen Modelle zu erforschen und freut sich darauf zu sehen, wie sie diese Innovationen zur Steigerung der Produktivität einsetzen.
Anthropic ist überzeugt, dass diese neuen Entwicklungen den Nutzern neue Möglichkeiten der Interaktion mit Claude eröffnen werden.