AI Personal Learning
und praktische Anleitung
Ressource Empfehlung 1

Claude 3.7 Sonnet: Erstes hybrides Reasoning-Modell und Einführung des intelligenten Kodierungswerkzeugs Claude Code

Erst gestern Abend verbreitete sich die Nachricht von Anthropics bevorstehender Veröffentlichung eines neuen Modells schnell in der KI-Gemeinschaft, allerdings nicht in der Weise, wie man es erwartet hatte. Claude 4.0, sondern die Sonnet-Version Claude 3.7.


Heute früh hat Anthropic pünktlich sein neuestes Flaggschiff-Modell veröffentlicht, dasDie offizielle Markteinführung von Claude 3.7 Sonnet, dem nach eigenen Angaben bisher intelligentesten und ersten Hybrid-Inferenzmodell auf dem Markt!.

Claude 3.7 Sonnet bietet sowohl eine schnelle Reaktion nahezu in Echtzeit als auch eine tiefer gehende, detailliertere Schritt-für-Schritt-Analyse auf der Grundlage der Benutzeranforderungen. Als Anthropisch Die Beschreibung "Ein Modell, zwei Arten zu denken..." bezieht sich auf die Tatsache, dass es sowohl Standard- als auch erweiterte Denkmodi hat. Darüber hinaus können API-Benutzer die Länge der Denkweise des Modells feiner steuern.

Zusätzlich zur Veröffentlichung von Claude 3.7 Sonnet.Anthropic hat außerdem ein paralleles Befehlszeilen-Tool namens Claude Code auf den Markt gebracht, das sich auf intelligente Kodierung konzentriert. Das Tool ist derzeit als begrenzte Forschungsvorschau verfügbar und soll es Entwicklern ermöglichen, Claude eine große Anzahl von technischen Aufgaben direkt in der Terminalumgebung zu überlassen.

Im Hinblick auf die Codierungsmöglichkeiten hat Anthropic die Codierungserfahrung auf der Claude.ai-Plattform weiter optimiert. Die GitHub-Integration ist jetzt in allen Claude-Programmen verfügbar und ermöglicht es Entwicklern, ihre Code-Repositories direkt mit Claude zu verbinden. Durch ein tieferes Verständnis von persönlichen, Arbeits- und Open-Source-Projekten wird Claude zu einem noch leistungsfähigeren Assistenten für Entwickler, wenn es um die Fehlerbehebung, die Entwicklung von Funktionen und die Erstellung von Dokumentation in GitHub-Projekten geht.

Aus diesem Grund und dank erheblicher Verbesserungen bei der Codierung und den Front-End-Webentwicklungsfähigkeiten.Claude 3.7 Sonnet wurde zum bisher besten Kodierungsmodell von Anthropic..

Benutzer können jetzt das neueste Claude 3.7 Sonnet-Modell über alle Claude-Tarife (einschließlich Free, Pro, Team und Enterprise) sowie über Plattformen wie Anthropic API, Amazon Bedrock und Google Cloud Vertex AI nutzen. Zusätzlich zu den Free-Nutzern können alle kostenpflichtigen Abonnenten das Extended Thinking-Modell nutzen.

In den Modi Standard und Erweitertes Denken wird dieDer Preis für Claude 3.7 Sonnet bleibt derselbe wie für die vorherige Generation von Claude 3.5 Sonnet: 3 US-Dollar pro Million Input-Token und 15 US-Dollar pro Million Output-Token (einschließlich Think-Token)..

Wie ein Nutzer kommentierte: "Jede neue Veröffentlichung von Anthropic ist überraschend und aufregend!"

Maximum Claude 3.7 Sonett

Modernste Argumentation auf Knopfdruck

Anthropic betont, dass Claude 3.7 Sonnet mit einer anderen Philosophie als andere auf dem Markt befindliche Inferenzmodelle entwickelt wurde. So wie das menschliche Gehirn in der Lage ist, schnell zu reagieren und gleichzeitig tiefgründig zu denken, sollte auch die KI-Inferenz in der Lage sein, die Fähigkeiten modernster Modelle zu integrieren, anstatt sie voneinander zu trennen. Dieser einheitliche Design-Ansatz zielt darauf ab, ein reibungsloseres Nutzererlebnis zu bieten.

Im Einklang mit dieser Philosophie bietet der Claude 3.7 Sonnet eine Reihe von einzigartigen Vorteilen.

Erstens.Claude 3.7 Sonnet ist insofern einzigartig, als es als Allzweck-LLM verwendet werden kann, aber auch über leistungsstarke Argumentationsfähigkeiten verfügt. Je nach Bedarf können Sie wählen, ob das Modell Ihnen eine schnelle Antwort geben soll, oder ob es vor der Antwort tiefergehende Überlegungen anstellen soll.Im Standardmodus kann die Claude 3.7 Sonnet als ein Upgrade der vorherigen Claude 3.5 Sonnet angesehen werden. Im Standardmodus kann Claude 3.7 Sonnet als eine verbesserte Version seines Vorgängers, Claude 3.5 Sonnet, angesehen werden. Im Modus "Erweitertes Denken" denkt es über sich selbst nach, bevor es eine Antwort gibt, was seine Leistung bei einer Vielzahl von Aufgaben, darunter Mathematik, Physik, Befolgen von Anweisungen, Codierung usw., erheblich verbessert.

Zweitens.Wenn Claude 3.7 Sonnet über die API aufgerufen wird, kann der Benutzer auch das "Denk-Budget" des Modells anpassen. Insbesondere kann der Nutzer Claude so einstellen, dass er in Bezug auf die maximale Anzahl von Token Anzahl (N). Unabhängig vom N-Wert begrenzt das Modell die Anzahl der ausgegebenen Token auf 128K. Dies ermöglicht es dem Benutzer, das optimale Gleichgewicht zwischen Geschwindigkeit (und Kosten) der Antwort und Qualität der Antwort zu finden.

Drittens: Bei der Entwicklung seines Inferenzmodells hat derAnstatt sich übermäßig auf die Optimierung der Modellleistung bei Mathematik- und Informatik-Wettbewerbsfragen zu konzentrieren, wie es andere Organisationen getan haben, konzentriert sich Anthropic auf reale Aufgaben, die für praktische Anwendungsszenarien in Unternehmen von größerer Bedeutung sind.

Aus den Claude 3.7 Sonnet-Benchmark-Ergebnissen im SWE-bench Verified-Benchmark (der entwickelt wurde, um die Fähigkeit des LLM zu bewerten, reale Softwareprobleme auf GitHub zu lösen), ist dieClaude 3.7 Sonnet erreichte eine Leistung auf SOTA-Niveau und lag damit deutlich vor Modellen wie Claude 3.5 Sonnet, o3-mini (hoch) und o1 von OpenAI sowie DeepSeek R1..

Im TAU-bench Benchmark, einer Benchmarking-Plattform zur Bewertung der Fähigkeit von LLM, mit dem Tool in komplexen, realistischen Szenarien zu interagieren, schneidet Claude 3.7 Sonnet ebenfalls gut ab und erreicht eine Leistung auf SOTA-Niveau, die sowohl Claude 3.5 Sonnet als auch das o1-Modell von OpenAI übertrifft.

Claude 3.7 Sonnet zeigt hervorragende Leistungen in einer Reihe von Bereichen, einschließlich der Befolgung von Anweisungen, des allgemeinen logischen Denkens, der multimodalen Fähigkeiten und der intelligenten Codierung, mit deutlichen Verbesserungen in Mathematik und Naturwissenschaften, insbesondere im Modus "Erweitertes Denken". In einigen spezifischen Bereichen bleibt er jedoch immer noch leicht hinter OpenAIs o3-mini (hoch), Grok-3 Beta, und andere Modelle.

Es ist leicht zu erkennen, dass Anthropic sich bei Claude 3.7 Sonnet auf die Codierfähigkeiten konzentriert hat, während die Verbesserungen in anderen Bereichen relativ unauffällig sind. Es ist klar, dass Anthropic beabsichtigt, die Sonnet-Serie als KI-Modelle mit Schwerpunkt auf Codierung zu positionieren (und sich tatsächlich in diese Richtung bewegt).

Es ist erwähnenswert, dass das Claude 3.7 Sonnet nicht nur in den traditionellen Benchmarks glänzt, sondern auch alle vorherigen Modelle im Pokémon-Spieltest übertrifft.

Anthropic hat bereits umfangreiche Tests mit seinen Partnern durchgeführt, und die Ergebnisse haben die führende Rolle der Claude-Modellfamilie in Bezug auf die Kodierungsfähigkeit eindrucksvoll bewiesen.

So stellte das Cursor-Team fest, dass Claude erneut die Lösung der Wahl für reale Codierungsaufgaben war und signifikante Verbesserungen bei der Handhabung komplexer Codebasen und der Verwendung fortschrittlicher Tools zeigte, während das Cognition-Team feststellte, dass Claude die anderen Modelle bei der Planung von Codeänderungen und der Handhabung von Full-Stack-Updates übertraf. Vercel hob die Genauigkeit von Claude bei komplexen Agenten-Workflows hervor, und Replit setzte Claude erfolgreich ein, um komplexe Webanwendungen und Dashboards von Grund auf zu erstellen, bei denen andere Modelle Schwierigkeiten hatten, während die Evaluierung von Canva zeigte, dass Claude durchgängig gut konzipierten, produktionsreifen Code produzierte und die Zahl der Bugs deutlich reduzierte. Erheblich geringere Fehlerquoten.

Claude Code

Intelligente Kodierung für einfachere Entwicklung

Seit Juni 2024 sind die Modelle der Sonnet-Familie die erste Wahl für Entwickler auf der ganzen Welt. Heute ist dieAnthropic hat offiziell Claude Code veröffentlicht, sein erstes intelligentes Coding-Tool (derzeit in einer begrenzten Forschungsvorschau), das die Produktivität und die Fähigkeiten von Entwicklern weiter verbessern soll.

Funktional ist Claude Code als proaktiver Kooperationspartner positioniert, der Aufgaben wie das Suchen und Lesen von Code, das Bearbeiten von Dateien, das Schreiben und Ausführen von Tests, das Übertragen und Veröffentlichen von Code auf GitHub und das Aufrufen verschiedener Befehlszeilentools übernehmen kann.

Gehen wir einige Beispiele für Szenarien durch, in denen Claude Code verwendet werden kann, z. B. zur Erläuterung der Struktur eines Projekts:

Schriftliche Tests:

Erstellen Sie die Anwendung:

Obwohl sich Claude Code noch im Anfangsstadium befindet, ist es zu einem unverzichtbaren Werkzeug für das Anthropic-Team geworden, insbesondere für die testgetriebene Entwicklung, das Debugging komplexer Probleme und das Refactoring von Code in großem Umfang.

In ersten Tests war Claude Code in der Lage, Aufgaben, deren manuelle Ausführung normalerweise mehr als 45 Minuten in Anspruch nehmen würde, in einem einzigen Durchgang zu erledigen, was die Entwicklungszeit und -kosten erheblich reduziert..

In den kommenden Wochen plant Anthropic, den Claude-Code auf der Grundlage des Feedbacks seiner Nutzer weiter zu optimieren. Dazu gehören die Verbesserung der Zuverlässigkeit von Tool-Aufrufen, die Verbesserung der Unterstützung für lang laufende Befehle, die Verbesserung des In-App-Renderings und die Erweiterung des Verständnisses von Claude für seine eigenen Funktionen.

Die Einführung von Claude Code soll ein tieferes Verständnis dafür vermitteln, wie Entwickler mit Claude für die Codierung arbeiten, und so eine wertvolle Referenz für zukünftige Iterationen der Modelle von Anthropic bieten. Diejenigen, die an der Claude Code-Vorschau teilnehmen, erhalten einen frühen Zugang zu den leistungsstarken Werkzeugen, die Anthropic intern zur Erstellung und Optimierung von Claude-Modellen verwendet.

Verantwortungsvolles Bauen und Zukunftsperspektiven

Anthropic hat Claude 3.7 Sonnet gründlich getestet und evaluiert und mit externen Sicherheitsexperten zusammengearbeitet, um sicherzustellen, dass das Modell die selbst gesetzten Sicherheits- und Zuverlässigkeitsstandards vollständig erfüllt.

Gleichzeitig zeigt Claude 3.7 Sonnet ein besseres Urteilsvermögen bei der Unterscheidung zwischen schädlichen und gutartigen Anfragen. Im Vergleich zum Vorgängermodell hat es die Zahl der unnötigen Ablehnungen um 45% reduziert.

Ergebnisse der CoT-Treuebewertung.

In der Modellkarte für Claude 3.7 Sonnet beschreibt Anthropic seinen Rahmen für die Bewertung verantwortungsbewusster KI-Skalierungsrichtlinien und stützt sich auf die praktischen Erfahrungen anderer KI-Labors und Forscher in verwandten Arbeiten. Darüber hinaus beschreibt die Model Card die neuen Arten von Risiken, die sich aus der Anwendung von KI-Technologien ergeben, insbesondere Rapid-Injection-Angriffe, und erläutert, wie Anthropic diese potenziellen Sicherheitslücken bewertet und darauf reagiert sowie das Claude-Modell trainiert, um sich gegen diese Risiken zu schützen und sie zu mindern. Darüber hinaus befasst sich die Modellkarte mit den potenziellen Sicherheitsvorteilen von Inferenzmodellen und untersucht Fragen wie "wie man den Entscheidungsprozess des Modells versteht" und "ob die Inferenzergebnisse des Modells wirklich vertrauenswürdig und zuverlässig sind".

Anthropic ist davon überzeugt, dass die Veröffentlichung von Claude 3.7 Sonnet und Claude Code einen entscheidenden Schritt auf dem Weg zur wirklichen Befähigung des Menschen durch KI-Systeme darstellt. Mit überlegenem Deep Reasoning, autonomer Arbeit und effizienter Zusammenarbeit bringt uns Anthropic der Vision einer Zukunft näher, in der KI-Technologie das menschliche Potenzial vollständig bereichert und ausbaut.

Anthropic hat auch eine aufregende Vision für die Zukunft: Bis 2025 soll sich Claude zu einer Expertenintelligenz entwickelt haben, die stundenlang autonom arbeiten kann, und bis 2027 erwartet Anthropic, dass Claude in der Lage sein wird, komplexe Probleme zu lösen, für die ein menschliches Team Jahre brauchen würde.

Tools herunterladen
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Claude 3.7 Sonnet: Erstes hybrides Reasoning-Modell und Einführung des intelligenten Kodierungswerkzeugs Claude Code

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)