OpenAI stellt eine neue Reihe von Inferenzmodellen vor, die zur Lösung schwieriger Probleme entwickelt wurden. Sie wird ab dem 12. September offiziell eingeführt.
Wir haben eine Reihe neuer KI-Modelle entwickelt, die sich mehr Zeit zum Nachdenken nehmen, bevor sie eine Antwort geben. Sie können komplexe Aufgaben bewältigen und anspruchsvollere Probleme lösen als frühere Modelle in Bereichen wie Wissenschaft, Programmierung und Mathematik.
Heute befinden wir uns in der ChatGPT und unsere API hat das erste Modell in dieser Reihe veröffentlicht. Dies ist eine Vorabversion, und wir planen regelmäßige Aktualisierungen und Verbesserungen. In der Zwischenzeit haben wir dieErgebnisse der nächsten aktualisierten BewertungDas Update ist derzeit in der Entwicklung.
Arbeitsprinzip
Wir trainieren diese Modelle, damit sie vor der Beantwortung von Fragen gründlicher nachdenken, so wie es auch Menschen tun. Durch das Training lernen sie, ihre Denkprozesse zu verfeinern, verschiedene Strategien auszuprobieren und ihre Fehler zu erkennen.
In unseren Tests schnitt das einsatzbereite Modell-Update bei anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie auf PhD-Niveau ab. Auch in den Bereichen Mathematik und Programmierung schnitt es hervorragend ab. In der Qualifikationsprüfung der Internationalen Mathematik-Olympiade (IMO) löste GPT-4o nur 13% Probleme richtig, während das neue Inferenzmodell 83% erreichte. Was die Programmierfähigkeiten betrifft, so erreichten sie das frühere Leistungsniveau von 89% im Codeforces-Wettbewerb. Weitere Einzelheiten finden Sie in unseremTechnische Forschungsartikel.
Da es sich um ein frühes Modell handelt, fehlen ihm derzeit viele der nützlichen Funktionen von ChatGPT, wie z. B. das Surfen im Internet und das Hochladen von Dateien und Bildern. Kurzfristig könnte GPT-4o für viele gängige Szenarien praktischer sein.
Für komplexe Denkaufgaben ist dies jedoch ein großer Durchbruch und stellt eine neue Stufe der KI-Fähigkeit dar. Aus diesem Grund haben wir den Zähler auf 1 zurückgesetzt und die Serie OpenAI o Security genannt.
Mit der Entwicklung dieser neuen Modelle schlagen wir einen neuen Ansatz für das Sicherheitstraining vor, der ihre Argumentationsfähigkeiten voll ausschöpft, um eine bessere Einhaltung der Sicherheits- und Ausrichtungsrichtlinien zu ermöglichen. Indem wir in der Lage sind, über unsere Sicherheitsregeln in spezifischen Kontexten nachzudenken, ermöglichen wir eine effektivere Anwendung dieser Regeln.
Eine Möglichkeit, die Sicherheit zu messen, besteht darin, die Fähigkeit des Modells zu testen, die Sicherheitsregeln auch dann einzuhalten, wenn ein Benutzer versucht, sie zu umgehen (allgemein als "Jailbreak" bekannt). In unserem anspruchsvollsten Jailbreak-Test erreichte GPT-4o 22 von 100 Punkten, während unser o1-Vorschaumodell satte 84 Punkte erzielte. Weitere Einzelheiten finden Sie unterSystembeschreibungund unserForschungsartikel.
Um den neuen Möglichkeiten dieser Modelle gerecht zu werden, haben wir unsere Sicherheitsanstrengungen, die interne Verwaltung und die Zusammenarbeit mit der Bundesregierung verbessert. Dazu gehört die Nutzung unsererRahmen der VorbereitungStrenge Tests und Bewertungen, erstklassige Red-Team-Tests und ein Überprüfungsverfahren auf Vorstandsebene, an dem auch unser Sicherheitsausschuss beteiligt ist.
Um unser Engagement für die KI-Sicherheit zu verstärken, haben wir vor kurzem formelle Vereinbarungen mit den KI-Sicherheitsinstituten in den Vereinigten Staaten und im Vereinigten Königreich getroffen. Wir haben mit der Umsetzung dieser Vereinbarungen begonnen und gewähren diesen Instituten einen frühen Zugang zu den Forschungsversionen des Modells. Dies ist ein wichtiger erster Schritt in unserer Partnerschaft, um einen Prozess für die Erforschung, Bewertung und Prüfung künftiger Modelle vor und nach der öffentlichen Freigabe zu etablieren.
relevante Bevölkerung
Diese erweiterten Argumentationsfähigkeiten eignen sich besonders für diejenigen, die an komplexen Problemen in Wissenschaft, Programmierung, Mathematik und anderen Bereichen arbeiten. Zum Beispiel können medizinische Forscher o1 verwenden, um Zellsequenzierungsdaten zu kommentieren, Physiker können damit die komplexen mathematischen Formeln erstellen, die für die Quantenoptik benötigt werden, und Entwickler in einer Vielzahl von Bereichen können damit mehrstufige Arbeitsabläufe erstellen und ausführen.
OpenAI o1-mini
Die o1-Modellfamilie eignet sich hervorragend zum Generieren und Debuggen von komplexem Code. Um Entwicklern eine noch effizientere Lösung zu bieten, haben wir die OpenAI o1-mini. Es ist ein schnelleres, wirtschaftlicheres Argumentationsmodell, das sich besonders gut für Programmieraufgaben eignet. Als kleineres Modell kostet o1-mini 80% weniger als o1-preview, was es zu einer idealen Wahl für Anwendungen macht, die zwar Denkleistung, aber kein umfangreiches Weltwissen erfordern, und zwar sowohl leistungsfähig als auch kostengünstig.
Wie man OpenAI o1 verwendet
Ab heute.ChatGPT Plus- und Team-BenutzerDas o1-Modell kann in ChatGPT verwendet werden. Benutzer können o1-preview und o1-mini manuell in der Modellauswahl auswählen. o1-preview ist in der ersten Version auf 30 Nachrichten pro Woche und o1-mini auf 50 Nachrichten pro Woche begrenzt. Wir arbeiten daran, diese Grenzen zu erhöhen und ChatGPT in die Lage zu versetzen, automatisch das am besten geeignete Modell für jede Anfrage auszuwählen.
ChatGPT Enterprise und Edu Benutzerwerden ab nächster Woche Zugang zu beiden Modellen erhalten. Entspricht dem API-Nutzungsstufe 5 (öffnet in neuem Fenster) (in Form eines Nominalausdrucks)EntwicklerSie können ab sofort mit beiden Modellen in der API Prototypen erstellen, wobei die Rate derzeit auf 20 Anfragen pro Minute begrenzt ist. Wir führen derzeit weitere Tests durch, um diese Grenzen zu erhöhen. Derzeit enthalten die APIs für diese Modelle keine Funktionen wie Funktionsaufrufe, Streaming und Unterstützung für Systemmeldungen. Um loszulegen, schauen Sie sich die API-Dokumentation (öffnet in neuem Fenster).
Wir planen außerdem, dass alle ChatGPT Kostenlose BenutzerBeide können den o1-mini verwenden.
Zukunftsaussichten
Dies ist nur eine frühe Vorschau auf diese Inferenzmodelle in ChatGPT und die API. Neben der kontinuierlichen Aktualisierung der Modelle füge ich Web-Browsing, Datei- und Bild-Uploads und andere Funktionen hinzu, um ihre Nützlichkeit zu erhöhen.
Neben der neuen OpenAI o1-Familie werden wir auch die GPT-Modellfamilie weiterentwickeln und veröffentlichen.