Gestern veröffentlichte DeepSeek eine Vorschau auf DeepSeek-R1-Lite, ein umfangreiches Sprachmodell für autonomes Denken, das mit o1 konkurriert und den Nutzern den vollständigen Denkprozess zeigt, den o1 nicht öffentlich macht.Ähnlich wie die o1-Vorschau von OpenAI hat die DeepSeek-R1-Lite-Vorschau über die Aufgabe nachgedacht, vorausgeplant und eine Reihe von Aktionen durchgeführt, um dem Modell zu helfen, die Antwort zu finden, und sie hat den gesamten Denkprozess gezeigt.DeepSeek-R1-Lite wurde mithilfe von Reinforcement Learning trainiert, und der Denkprozess beinhaltet eine Menge Reflexion und Validierung, mit Gedankenketten, die zehntausende von Wörtern lang sind. Der Denkprozess umfasst viele Überlegungen und Überprüfungen, und die Gedankenketten sind Zehntausende von Wörtern lang, was ihn effizienter macht. Zurzeit unterstützt es nur die Verwendung im Internet, und die offizielle Version wird vollständig quelloffen sein.DeepSeek-R1-Lite preview übertrifft o1-preview bei mathematischen, Code- und komplexen logischen Denkaufgaben in einigen Tests. o1-preview übertrifft Modelle wie o1-preview in maßgeblichen Tests wie dem AIME, der den höchsten Schwierigkeitsgrad im amerikanischen Mathematikwettbewerb AMC hat, und codeforces, dem weltweit führenden Programmierwettbewerb.Führen Sie den einfachen "Erdbeertest" durch, und Sie werden eine perfekte Antwort erhalten.Je nach Komplexität der Frage kann DeepSeek-R1 mehrere Dutzend Sekunden lang "nachdenken", bevor er antwortet, und Nutzer haben berichtet, dass sie für dieselbe Frage länger brauchten als o1. Offiziell gilt: Je länger die Denkkette ist, desto genauer sind die Ergebnisse.Verschiedene Tests wurden online durchgeführt, und DeepSeek macht es auch leicht, einen Jailbreak durchzuführen - nämlich durch Eingabeaufforderungen, die die Sicherheitsmaßnahmen ignorieren. Ein X-Nutzer brachte DeepSeek-R1-Lite dazu, ein detailliertes Rezept für Gift zu geben, indem er spezielle Jailbreak-Prompts schrieb.Natürlich hatte DeepSeek-R1-Lite in Online-Tests immer noch jede Menge Patzer und schnitt vor allem bei Tic-Tac-Toe und anderen logischen Aufgaben schlecht ab, ebenso wie o1.Loggen Sie sich auf chat.deepseek.com ein und wählen Sie im Eingabefeld den Modus "Deep Thinking", um mit der DeepSeek-R1-Lite-Vorschau zu sprechen. Der "Deep Thinking"-Modus wurde speziell für komplexe logische Denkaufgaben in Mathematik, Code usw. entwickelt und liefert umfassendere, klarere und strengere Antworten als einfache Fragen.Allerdings unterstützt sie derzeit nur die Webnutzung, keine API-Aufrufe und nur ein tägliches Kontingent von 50 Nutzungen.
Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.