Sind Sie es leid, Unmengen von Informationen zu durchsuchen und trotzdem nicht die gewünschten Antworten zu finden? Sehnen Sie sich nach einem intelligenten Assistenten, der wie ein professioneller Analyst für Sie recherchieren kann? OpenAI ist stolz darauf, die Einführung der neuesten und innovativsten Software, OpenAI, bekannt zu geben. ChatGPT Eine brandneue Funktion des -Intensive Forschung! Sie wird die Art und Weise, wie Sie Informationen erhalten, völlig verändern und es Ihnen ermöglichen, komplexe Rechercheaufgaben, für die Sie sonst Stunden benötigen würden, in wenigen Minuten zu erledigen. Dieser Artikel vermittelt Ihnen ein umfassendes Verständnis der leistungsstarken Funktionen der Tiefenrecherche, der Anwendungsszenarien, der Arbeitsprinzipien und der künftigen Entwicklungsrichtung. Gemeinsam werden wir erleben, wie KI die Wissensarbeit unterstützt und eine neue Ära der intelligenten Forschung einleitet!
Dabei handelt es sich um eine Intelligenz, die große Mengen von Online-Informationen durch logisches Denken zusammenfasst und mehrstufige Rechercheaufgaben für Sie erledigt, ähnlich wie die Perplexität im Gesang antworten Zwillinge OpenAIs neu veröffentlichtes "Deep Research" nutzt sein leistungsfähiges o3-Modell, um riesige Mengen an Informationen durch Websuchen zu sammeln und zu analysieren, und erstellt schließlich einen detaillierten professionellen Bericht mit Zitaten. Diese Funktion hat seit ihrer Einführung große Aufmerksamkeit auf sich gezogen und wurde als "superstarker" KI-Assistent gefeiert, der eine neue Ära der KI-gestützten Forschung einläutet.
Sie ist ab heute für Pro-Nutzer verfügbar und wird demnächst auch für Plus- und Team-Nutzer verfügbar sein.
Kurz und bündig:"Deep Research" führt selbstständig mehrstufige Netzwerkuntersuchungen durch, erledigt komplexe Forschungsaufgaben in 5-30 Minuten, für die ein menschlicher Forscher normalerweise Stunden benötigen würde, und präsentiert dem Nutzer die Ergebnisse in einem hochwertigen Bericht.
Referenzlektüre:Google lanciert Deep Research, undOpen Deep Research: Generierung von KI-Forschung auf der Grundlage von Websuchinhalten, undSTORM: Durchsuchen von Webdaten auf der Grundlage von Themen, Erstellen von Artikeln mit Zitaten, lange Berichte über Artikel
Wie gut ist "Tiefenforschung"? Das wollen wir herausfinden:
- Leistungsstark und unglaublich effizient: Verabschieden Sie sich von der nächtelangen Suche nach Informationen! Mit "Deep Research" erreicht die Recherche eine ganz neue Effizienzstufe, indem komplexe Studien, die normalerweise Stunden dauern, in 5-30 Minuten abgeschlossen werden. Dabei können Sie so tief wie nötig in die Materie eindringen, um Analysen auf Expertenniveau zu erstellen.
- Die Ergebnisse sind zuverlässig und gut dokumentiert: Machen Sie sich keine Gedanken mehr über die Quelle Ihrer Informationen! Alle Schlussfolgerungen sind mit detaillierten Zitaten versehen, bis hin zum jeweiligen Absatz der Original-Webseite oder PDF-Datei. So können die Nutzer die Richtigkeit der Informationen leicht nachvollziehen und überprüfen, und Ihre Recherchen werden noch überzeugender.
- Vielfältige Einsatzmöglichkeiten, flexibel und einfach in der Anwendung: Egal, ob Sie Wettbewerbsanalysen, Marktforschung, Produkteinkäufe oder akademische Forschung durchführen müssen, "Deep Research" kann Ihre rechte Hand sein. Wählen Sie einfach "Deep Research" auf der ChatGPT-Oberfläche aus und geben Sie eine Abfrage ein, um Ihre Recherche zu starten. Unterstützung für das Hochladen von Dateien (z. B. PDF), um einen spezifischeren Kontext zu liefern, und Echtzeitansicht des Forschungsfortschritts und der zitierten Quellen in der Seitenleiste.
- Technologisch fortschrittlich und mit hervorragender Leistung: Deep Research basiert auf durchgängigem Reinforcement Learning und ist in der Lage, mehrstufige Browsing- und Argumentationsaufgaben durchzuführen. Es unterstützt das Lesen von Website-Inhalten, die Datenverarbeitung, die Erstellung von Diagrammen und das Zitieren von Quelltexten zur Unterstützung von Argumenten. In einem schwierigen Benchmark-Test namens Humanity's Last Exam (HLE) erzielte Deep Research 26,6% und übertraf damit das Ergebnis des vorherigen HLE bei weitem. o3-mini (13%) und o1 (9%), die ihre leistungsstarken Fähigkeiten zur Informationsbeschaffung und -integration sowie ihr menschenähnliches Rechercheverhalten unter Beweis stellen.
- Allmähliche Liberalisierung und eine vielversprechende Zukunft: Sie ist derzeit für Pro-Nutzer (100 Suchvorgänge pro Monat) verfügbar und wird innerhalb eines Monats auf Plus-Nutzer (10 Suchvorgänge pro Monat) ausgeweitet, wobei Team- und Enterprise-Editionen folgen werden. In Zukunft wird es auch Unterstützung für Mobil-/Desktop-Apps geben, und es ist geplant, eine Verbindung zu mehr Datenquellen (sowohl Abonnements als auch interne) herzustellen, um eine leistungsfähigere Personalisierung zu ermöglichen.
Diese Details sind ebenfalls bemerkenswert:
- Je mehr Werkzeuge Sie aufrufen, desto genauer werden Sie sein: Das Diagramm zeigt, dass mit zunehmender Anzahl der Toolaufrufe (Max Tool Calls) die Erfolgsquote von Deep Research im HLE-Test steigt, was auf eine positive Korrelation zwischen seiner Intelligenz und seiner Fähigkeit zur Nutzung von Tools hindeutet.
- Das Problem der Halluzinationen muss noch verbessert werden: Trotz der beeindruckenden Leistung von Deep Research gibt es immer noch die Möglichkeit von Täuschungen und Denkfehlern, was ein Hauptaugenmerk der nachfolgenden Optimierungen von OpenAI ist.
- In Kombination mit Operator sind die Möglichkeiten grenzenlos: Die Zukunftspläne von OpenAI sehen vor, tiefgreifende Online-Forschung mit realen Operationen zu kombinieren (Betreiber) werden kombiniert, um leistungsfähigere intelligente Körperfunktionen zu erreichen, die mit Spannung erwartet werden!
Vollständige offizielle DeepResearch Bewertung
Heute stellen wir Deep Research in ChatGPT vor, eine neue Agentenfunktion, die eine mehrstufige Recherche im Internet für komplexe Aufgaben ermöglicht. Er kann in wenigen Minuten das tun, wofür ein Mensch Stunden brauchen würde.
Deep Research ist OpenAIs nächste Intelligenz, die selbstständig für Sie arbeiten kann - Sie geben ihr eine Eingabeaufforderung und ChatGPT findet, analysiert und synthetisiert Hunderte von Online-Quellen, um einen umfassenden Bericht auf Analystenniveau zu erstellen. Es wird von einer kommenden Version des OpenAI o3-Modells angetrieben, das für das Browsen im Internet und die Datenanalyse optimiert ist. Es nutzt Inferenzen, um die riesigen Mengen an Text, Bildern und PDFs im Internet zu durchsuchen, zu interpretieren und zu analysieren und die notwendigen Anpassungen auf der Grundlage der gefundenen Informationen vorzunehmen.
Die Fähigkeit, Wissen zu synthetisieren, ist eine Voraussetzung für die Schaffung von neuem Wissen. Aus diesem Grund ist Deep Research ein wichtiger Schritt in Richtung unseres umfassenderen Ziels der Entwicklung von AGI, die unserer Ansicht nach seit langem neue wissenschaftliche Forschung hervorbringen soll.
Gründe, warum wir vertiefte Studien erstellen
Deep Research wurde für Menschen entwickelt, die wissensintensive Arbeit in Bereichen wie Finanzen, Wissenschaft, Politik und Technik leisten und gründliche, genaue und zuverlässige Recherchen benötigen. Es ist auch nützlich für versierte Käufer, die eine hyper-personalisierte Beratung bei Käufen wünschen, die normalerweise eine sorgfältige Recherche erfordern würden, wie z. B. Autos, Haushaltsgeräte und Möbel. Jede Ausgabe ist vollständig dokumentiert, mit klaren Zitaten und Zusammenfassungen der Gedanken, so dass es einfach ist, Informationen zu referenzieren und zu validieren. Es ist besonders effektiv bei der Suche nach Nischeninformationen, die nicht intuitiv sind und das Durchsuchen einer großen Anzahl von Websites erfordern. Deep Research setzt wertvolle Zeit frei, indem es Ihnen ermöglicht, komplexe, zeitaufwändige Webrecherchen mit einer einzigen Abfrage zu beschleunigen.
Deep Research entdeckt, begründet und integriert selbstständig Erkenntnisse aus dem gesamten Web. Um dies zu erreichen, verwendet es denselben Ansatz des verstärkten Lernens wie OpenAI o1 (unser erstes Inferenzmodell), das auf realen Aufgaben trainiert wurde, die die Verwendung eines Browsers und von Python-Tools erfordern. Während o1 beeindruckende Fähigkeiten in den Bereichen Programmierung, Mathematik und anderen technischen Bereichen demonstriert, erfordern viele reale Herausforderungen umfangreiche Hintergrundinformationen und das Sammeln von Informationen aus verschiedenen Online-Quellen. Vertiefte Forschung baut auf diesen logischen Fähigkeiten auf, um diese Lücke zu schließen und sie in die Lage zu versetzen, das breite Spektrum an Problemen zu bewältigen, mit denen Menschen bei der Arbeit und in ihrem täglichen Leben konfrontiert sind.
Wie man gründliche Forschung betreibt
Wählen Sie in ChatGPT im Nachrichteneditor "Deep Research" und geben Sie Ihre Anfrage ein. Teilen Sie ChatGPT mit, was Sie benötigen - sei es eine Wettbewerbsanalyse von Streaming-Plattformen oder ein personalisierter Bericht über die besten Pendlerfahrräder. Sie können Dateien oder Kalkulationstabellen anhängen, um Ihrer Frage einen Kontext zu geben. Sobald die Suche gestartet ist, erscheint eine Seitenleiste mit einer Zusammenfassung der durchgeführten Schritte und der verwendeten Quellen.
Eingehende Studien können 5 bis 30 Minuten dauern und benötigen Zeit, um das Netz tiefer zu durchdringen. In der Zwischenzeit können Sie den Chat verlassen oder an anderen Aufgaben arbeiten - Sie werden benachrichtigt, wenn die Studie abgeschlossen ist. Die endgültige Ausgabe erfolgt in Form von Berichten im Chat - in den nächsten Wochen werden wir auch eingebettete Bilder, Datenvisualisierungen und andere analytische Ausgaben zu diesen Berichten hinzufügen, um zusätzliche Klarheit und Kontext zu schaffen.
Im Gegensatz zur Tiefenforschung eignet sich GPT-4o gut für multimodale Echtzeitdialoge. Fürvielschichtige, bereichsspezifische Bereiche, in denen Tiefe und Detailgenauigkeit entscheidend sindAbfragen, eingehende Recherchen für eine umfassende Untersuchung und die Fähigkeit, jede Aussage zu zitieren, machen den Unterschied zwischen einer kurzen Zusammenfassung und einer gut dokumentierten, validierten Antwort (die als Arbeitsprodukt verwendet werden kann) aus.
Die ausführliche Studie geht sehr detailliert auf die Fragen ein und stellt die Daten für die 10 wichtigsten Industrieländer und die 10 wichtigsten Entwicklungsländer nebeneinander, um einen einfachen Vergleich zu ermöglichen. Anhand dieser Informationen werden detaillierte, fundierte und praktische Empfehlungen für den Markteintritt gegeben. Siehe offizielles Beispiel: https://openai.com/index/introducing-deep-research/
Arbeitsprinzip
Deep Research wurde mithilfe von End-to-End-Verstärkungslernen für schwierige Such- und Schlussfolgerungsaufgaben in einer Vielzahl von Bereichen trainiert. Durch dieses Training hat es gelernt, mehrstufige Trajektorien zu planen und auszuführen, um die benötigten Daten zu finden, und bei Bedarf zurück zu verfolgen und auf Echtzeitinformationen zu reagieren. Das Modell ist auch in der Lage, von Benutzern hochgeladene Dateien zu durchsuchen, mit Python-Tools Grafiken zu zeichnen und zu iterieren, von Websites generierte Grafiken und Bilder in seine Antworten einzubetten und bestimmte Sätze oder Absätze aus seinen Quellen zu zitieren. Als Ergebnis dieses Trainings erreichte es in vielen öffentlichen Bewertungen, die sich auf reale Probleme konzentrierten, neue Höchstwerte.
Die letzte Prüfung der Menschheit
existieren Die letzte Prüfung der Menschheit (öffnet in einem neuen Fenster)(ein kürzlich veröffentlichter Test, bei dem KI anhand von Fragen auf Expertenebene auf eine breite Palette von Themen getestet wird) erzielte das Deep-Research-fähige Modell mit einer Genauigkeit von 26,6% einen neuen Höchstwert. Der Test enthält mehr als 3.000 Multiple-Choice- und Kurzantwortfragen zu mehr als 100 Themen, die von Linguistik bis zu Raketenwissenschaft und von Klassikern bis zu Ökologie reichen. Die größten Verbesserungen gegenüber OpenAI o1 gab es in den Bereichen Chemie, Geistes- und Sozialwissenschaften sowie Mathematik. Modelle, die tiefgehende Forschung unterstützen, zeigen einen menschenähnlichen Ansatz, um bei Bedarf effektiv nach Fachinformationen zu suchen.
Modellierung | Genauigkeit (%) |
---|---|
GPT-4o | 3.3 |
Grok-2 | 3.8 |
Claude 3.5 Sonett | 4.3 |
Zwillinge-Denken | 6.2 |
OpenAI o1 | 9.1 |
DeepSeek-R1* | 9.4 |
OpenAI o3-mini (mittel)* | 10.5 |
OpenAI o3-mini (hoch)* | 13.0 |
OpenAI Tiefenforschung** | 26.6 |
- Die Modelle sind nicht multimodal und werden nur für eine Textuntermenge bewertet.
- Verwendung des Tools browse + python
GAIA
existieren GAIA(öffnet in einem neuen Fenster) (ein öffentlich zugänglicher Benchmark für die Bewertung von KI bei realen Problemen) erreichte ein neues State-of-the-Art-Niveau (SOTA) für Modelle zur Unterstützung von Deep Research in externen Rangliste (öffnet in einem neuen Fenster) Ganz oben auf der Liste. Enthält Fragen mit drei Schwierigkeitsgraden. Die erfolgreiche Bewältigung dieser Aufgaben erfordert Fähigkeiten wie logisches Denken, multimodale Kompetenz, Surfen im Internet und Kenntnisse im Umgang mit Tools.
Beispiele für GAIA-Aufgaben
Siehe offizielles Beispiel: https://openai.com/index/introducing-deep-research/
Missionen auf Expertenebene
In einer internen Evaluierung einer Reihe von Aufgaben auf Fachgebietsebene wurde von Fachgebietsexperten festgestellt, dass eingehende Studien stundenlange, schwierige manuelle Untersuchungen automatisiert haben.
Bestehensquote und maximale Anzahl von Werkzeugaufrufen
Je mehr das Modell browst und darüber nachdenkt, was es browst, desto besser ist seine Leistung, weshalb es wichtig ist, ihm Zeit zum Nachdenken zu geben.
Beispiel für einen Auftrag auf Expertenebene
Siehe offizielles Beispiel: https://openai.com/index/introducing-deep-research/
Der geschätzte wirtschaftliche Wert der Aufgabe korreliert eher mit der Erfolgsquote als mit der Anzahl der von Menschen aufgewendeten Stunden - was das Modell als schwierig ansieht, unterscheidet sich von dem, was Menschen als zeitaufwendig empfinden.
Einschränkungen
Deep Research hat wichtige neue Funktionen freigeschaltet, befindet sich aber noch in der Anfangsphase und hat seine Grenzen. Internen Bewertungen zufolge kann es manchmal Phantomfakten produzieren oder falsche Schlussfolgerungen in Antworten ziehen, wenn auch auf einem viel niedrigeren Niveau als bei bestehenden ChatGPT-Modellen. Es kann Schwierigkeiten haben, zwischen verbindlichen Informationen und Gerüchten zu unterscheiden, und weist derzeit Schwächen bei der Kalibrierung des Vertrauens auf, so dass die Unsicherheit oft nicht richtig dargestellt wird. Zum Zeitpunkt der Veröffentlichung kann es kleinere Formatierungsfehler in Berichten und Zitaten geben, und die Einleitung von Aufgaben kann länger dauern. Wir gehen davon aus, dass sich alle diese Probleme mit zunehmender Nutzung und im Laufe der Zeit rasch verbessern werden.
Interviews
Tiefgreifende Recherchen in ChatGPT erfordern derzeit eine sehr hohe Rechenleistung. Je länger die Forschungsanfrage dauert, desto mehr Inferenzberechnungen sind erforderlich. Wir beginnen heute mit den Berechnungen, die für eine Abfrage erforderlich sind, die auf Pro-BenutzerDie optimierte Version beginnt mit bis zu 100 Abfragen pro Monat.Plus- und Team-BenutzerDer Zugang wird als nächstes kommen, gefolgt von den Nutzern in Unternehmen. Wir arbeiten noch daran, Nutzern in Großbritannien, der Schweiz und dem EWR Zugang zu gewähren.
Höhere Ratenlimits werden bald für alle zahlenden Abonnenten verfügbar sein, wenn wir eine schnellere, kostengünstigere Version der ausführlichen Studie mit kleineren Modellen veröffentlichen, die dennoch hochwertige Ergebnisse liefert.
In den nächsten Wochen und Monaten werden wir an unserer technischen Infrastruktur arbeiten, die aktuellen Versionen genau überwachen und strengere Tests durchführen. Dies steht im Einklang mit unserem Grundsatz der schrittweisen Einführung. Wenn alle Sicherheitsprüfungen weiterhin unsere Freigabekriterien erfüllen, werden wir voraussichtlich in etwa einem Monat eine ausführliche Studie für Plus-Nutzer veröffentlichen.
Nachfolgeplan
Deep Research ist ab heute über das ChatGPT-Netzwerk verfügbar und wird innerhalb eines Monats auf mobile und Desktop-Anwendungen ausgeweitet werden. Derzeit hat Deep Research Zugriff auf das offene Web und alle hochgeladenen Dateien. In Zukunft werden Sie in der Lage sein, eine Verbindung zu spezielleren Datenquellen herzustellen und den Zugang zu abonnementbasierten oder internen Ressourcen zu erweitern, um die Ergebnisse noch leistungsfähiger und personalisierter zu gestalten.
In Zukunft möchten wir die Agentenerfahrung in ChatGPT zusammenführen, um asynchrone, authentische Forschung und Entwicklung durchzuführen. Die Kombination aus Deep Research, wo asynchrone Online-Umfragen durchgeführt werden können, und Operator, wo echte Aktionen durchgeführt werden können, wird es ChatGPT ermöglichen, immer komplexere Aufgaben für Sie durchzuführen.