DeepSeek-R1-Lite, ein selbst entwickeltes Inferenzmodell vergleichbar mit o1-preview, ist online!

AI-NachrichtenAktualisiert vor 7 Monaten AI-Austauschkreis

9.4K 00

Gestern veröffentlichte DeepSeek DeepSeek-R1Eine Vorschau auf -Lite, ein Programm, das mit dem o1 konkurrierende Makro-Sprachmodelle für autonomes Denken und präsentiert den Nutzern einen vollständigen Denkprozess, den o1 nicht veröffentlicht.

Ähnlich wie die o1-Vorschau von OpenAI hat die DeepSeek-R1-Lite-Vorschau über die Aufgabe nachgedacht, vorausgeplant und eine Reihe von Aktionen durchgeführt, um dem Modell zu helfen, die Antwort zu finden, und sie hat den gesamten Denkprozess gezeigt.DeepSeek-R1-Lite wurde mithilfe von Reinforcement Learning trainiert, und der Denkprozess beinhaltet eine Menge Reflexion und Validierung, mit Gedankenketten, die zehntausende von Wörtern lang sind. Der Denkprozess umfasst viele Überlegungen und Überprüfungen, und die Gedankenketten sind zehntausende von Wörtern lang, was ihn effizienter macht. Zurzeit unterstützt es nur die Verwendung im Internet, und die offizielle Version wird vollständig quelloffen sein.

媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线

DeepSeek-R1-Lite Preview schneidet in Mathematik, Code und komplexen logischen Denkaufgaben besser ab als o1-preview. In renommierten Tests wie AIME, dem höchsten Schwierigkeitsgrad des US-Mathematikwettbewerbs AMC, und codeforces, dem weltweit führenden Programmierwettbewerb, übertrifft es den o1-vorschau und andere Modelle.

Führen Sie den einfachen "Erdbeertest" durch, und Sie werden eine perfekte Antwort erhalten.

Je nach Komplexität der Frage kann DeepSeek-R1 mehrere Dutzend Sekunden lang "nachdenken", bevor er antwortet, und Nutzer haben berichtet, dass sie für dieselbe Frage länger brauchten als o1. Offiziell gilt: Je länger die Denkkette ist, desto genauer sind die Ergebnisse.

Verschiedene Tests wurden online durchgeführt, und DeepSeek macht es auch leicht, einen Jailbreak durchzuführen - nämlich durch Eingabeaufforderungen, die die Sicherheitsmaßnahmen ignorieren. Ein X-Nutzer brachte DeepSeek-R1-Lite dazu, ein detailliertes Rezept für Gift zu geben, indem er spezielle Jailbreak-Prompts schrieb.

Natürlich hatte DeepSeek-R1-Lite in Online-Tests immer noch jede Menge Patzer und schnitt vor allem bei Tic-Tac-Toe und anderen logischen Aufgaben schlecht ab, ebenso wie o1.

Loggen Sie sich auf chat.deepseek.com ein und wählen Sie im Eingabefeld den Modus "Deep Thinking", um mit der DeepSeek-R1-Lite-Vorschau zu sprechen. Der "Deep Thinking"-Modus ist speziell für komplexe logische Fragestellungen in Mathematik, Code usw. konzipiert und liefert umfassendere, klarere und strengere Antworten als einfache Fragen.

Allerdings unterstützt es derzeit nur die Nutzung über das Internet, keine API-Aufrufe und nur ein tägliches Kontingent von 50 Nutzungen.

AI-Nachrichten

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Copilot Agenten Intelligenzen in SharePoint offiziell freigegeben

AI-Nachrichten

vor 9 Monaten

08K

OpenAI veröffentlicht GPT-4.5: ein "subtiles Upgrade" oder eine "abschreckende" Preisgestaltung?

AI-Nachrichten

vor 6 Monaten

08.6K

Teilen Sie AI-generierte Videos 24/7

AI-Nachrichten

vor 1 Jahr

08.8K

MiniMax Multimodale Generierungstechnologie erneuert: Motivreferenz, Referenzporträtbilder zur Generierung stilistisch konsistenter Videos

AI-Nachrichten

vor 8 Monaten

09.3K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

DeepSeek-R1-Lite, ein selbst entwickeltes Inferenzmodell vergleichbar mit o1-preview, ist online!

Copilot für PowerPoint erfährt große Änderungen, die wichtigsten Punkte sind: Umschreiben, Übersetzen, Illustrieren, Kommentieren

Microsoft kündigt AI Shell in der öffentlichen Beta an, keine Angst mehr vor verlegten Befehlen

Ähnliche Artikel

Copilot Agenten Intelligenzen in SharePoint offiziell freigegeben

OpenAI veröffentlicht GPT-4.5: ein "subtiles Upgrade" oder eine "abschreckende" Preisgestaltung?

Teilen Sie AI-generierte Videos 24/7

MiniMax Multimodale Generierungstechnologie erneuert: Motivreferenz, Referenzporträtbilder zur Generierung stilistisch konsistenter Videos

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

DeepSeek-R1-Lite, ein selbst entwickeltes Inferenzmodell vergleichbar mit o1-preview, ist online!

Copilot für PowerPoint erfährt große Änderungen, die wichtigsten Punkte sind: Umschreiben, Übersetzen, Illustrieren, Kommentieren

Microsoft kündigt AI Shell in der öffentlichen Beta an, keine Angst mehr vor verlegten Befehlen

Ähnliche Artikel

Copilot Agenten Intelligenzen in SharePoint offiziell freigegeben

OpenAI veröffentlicht GPT-4.5: ein "subtiles Upgrade" oder eine "abschreckende" Preisgestaltung?

Teilen Sie AI-generierte Videos 24/7

MiniMax Multimodale Generierungstechnologie erneuert: Motivreferenz, Referenzporträtbilder zur Generierung stilistisch konsistenter Videos

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel