Wenn Chinas KI-Neulinge DeepSeek Der CEO von OpenAI, Sam Altman, der mit seinen quelloffenen, kostengünstigen Modellen in der globalen KI-Branche für Furore sorgt, ist gerade auf einer unauffälligen Reise nach Tokio. Im Mittelpunkt dieses Besuchs steht zweifellos die Frage, wie der Branchenführer auf die entstehende Wettbewerbslandschaft reagiert und seine technologische Führungsposition festigt.
Altman und Kevin Weil, Chief Product Officer von OpenAI, traten an der Universität von Tokio zu einer ausführlichen Fragerunde mit Studenten und Dozenten auf, bevor sie mit SoftBank-Gründer Masayoshi Son über eine mögliche 500-Milliarden-Dollar-Investition sprachen. Während der Fragerunde gaben sie eine Reihe faszinierender Einblicke, die einen Ausblick auf die künftige Ausrichtung von OpenAI und das strategische Denken über die Wettbewerbslandschaft in der Branche geben.
Iterativer Fahrplan für die GPT-Modellfamilie: Eine Revolution in der Effizienz und ein Sprung in der Leistungsfähigkeit
Altman machte in dem Interview deutlich, dass innerhalb von OpenAI Fortschritte bei GPT-4.5 gemacht wurden und dass es eine klarere Vorstellung von dem Weg zu GPT-5.5 gibt. Insbesondere betonte er, dass "das Erreichen von GPT-5.5 keine 100-fach höhere Rechenleistung erfordert".
Diese Behauptung ist keine leere Behauptung, sondern basiert auf OpenAIs Durchbrüchen bei der Inferenzmodellierung und den Techniken des Reinforcement Learning. Altman erklärt: "Fortschritte in der Inferenzmodellierung und der Reinforcement-Learning-Technologie haben die Berechnungseffizienz dramatisch verbessert, so dass kleinere Modelle eine Leistung auf GPT-6-Niveau erreichen können, ohne 100-mal mehr Rechenleistung zu benötigen." Dies bedeutet, dass OpenAI einen "effizienzgesteuerten" Weg der Modellskalierung beschreitet, anstatt sich ausschließlich auf arithmetisches Stacking zu verlassen.
Multimodale Verschmelzung und intelligente Körperstrategie: Aufbau eines allgemeinen Ökosystems für künstliche Intelligenz
Altman erläuterte außerdem das künftige Technologiekonzept von OpenAI, bei dem die multimodale Verschmelzung und Intelligenz im Mittelpunkt der Strategie stehen. Er gab einen Ausblick auf die Leistungsfähigkeit der nächsten Generation von Modellen, der "o-Serie":
- Multimodale Integration: "Wir werden alle Modalitäten miteinander verbinden, und Sie können auf der Leinwand sehen, dass es mit Ihnen spricht, während es für Sie Code schreibt und kompiliert. Es wird in der Lage sein, das Internet zu durchsuchen." Das bedeutet, dass künftige OpenAI-Modelle nicht mehr auf Text beschränkt sein werden, sondern in der Lage sein werden, mehrere Formen von Informationen wie Sprache, Bilder, Code und mehr nahtlos zu verarbeiten, um eine natürlichere und umfassendere Interaktionserfahrung zu ermöglichen.
- Visuelle Erkennungsfunktionen: "o Modelle werden in der Lage sein, visuelle Erkennungsfunktionen zu unterstützen, z. B. wenn ein Gerät überholt und ein Foto gemacht werden muss, werden o Serien von Modellen in der Lage sein, technische Unterstützung zu leisten." Dies wird die Anwendungsszenarien der KI erheblich erweitern und sie in die Lage versetzen, die physische Welt zu verstehen und praktischere Lösungen anzubieten.
- Miniaturisierte, leistungsstarke Inferenzmodelle: "o3-mini gibt einen Ausblick auf die Forschungsrichtungen der nächsten sechs bis zwölf Monate ......" OpenAI wird weiterhin in die Entwicklung von miniaturisierten, hochleistungsfähigen Inferenzmodellen investieren, die sich im MINT-Bereich und darüber hinaus auszeichnen werden.
- Prototyp eines intelligenten Körpers: "Ich hoffe, dass wir bis zum Ende dieses Jahres ein Modell eines intelligenten Körpers entwickelt haben werden, der alle schwierigen Aufgaben mit Ausnahme der wissenschaftlichen Entdeckung lösen kann, und es kann Stunden dauern, darüber nachzudenken, und es kann sogar eine Reihe von Werkzeugen aufrufen müssen, aber es wird letztendlich in der Lage sein, die Aufgabe für Sie zu erledigen." Dies deutet darauf hin, dass OpenAI aktiv den Aufbau autonomer Intelligenzen erforscht, mit dem Ziel, KI-Systeme zu schaffen, die komplexe Aufgaben selbständig durchführen können, und die kürzlich veröffentlichte Funktion "Deep Research" ist ein wichtiger Meilenstein in dieser Strategie.
Obwohl Altman und Weil betonten, dass der Zweck der Reise darin bestand, Nutzerfeedback zu sammeln, deuten ihre unbedachten Enthüllungen über die GPT-Produktplanung und ihre Reaktion auf die Open-Source-Strategie von DeepSeek eindeutig auf eine Verlagerung des strategischen Schwerpunkts von OpenAI hin: von der reinen Verfolgung der Modellskala und der Rechenleistung hin zu einer vertieften Beschäftigung mit hochleistungsfähigen Inferenzmodellen, multimodaler Fusion und intelligenten Körpertechnologien, um ein allgemeineres, effizienteres und intelligenteres KI-Ökosystem aufzubauen. Es hat sich von der reinen Verfolgung der Modellskala und der Rechenleistung zu einer tiefgreifenden Beschäftigung mit leistungsstarken Inferenzmodellen, multimodaler Fusion und intelligenten Körpertechnologien verlagert, um ein allgemeineres, effizienteres und intelligenteres KI-Ökosystem zu schaffen.
Analyse der Kernpunkte des Interviews: Zukunftsperspektiven der GPT und Interpretation der strategischen Ausrichtung
Wir haben die Höhepunkte dieses Gesprächs an der Universität Tokio zusammengestellt und geben im Folgenden die wichtigsten Inhalte des Dialogs wieder:
Künftige Veröffentlichungspläne für die GPT-Modellfamilie
F: Wenn ChatGPT Welche neuen emergenten Eigenschaften werden durch die 100-fache Rechenleistung entstehen? Wird es irgendwelche qualitativen Sprünge geben?
Altman: OpenAI erforscht aktiv die Modellfähigkeiten, die mit einer höheren Rechenleistung einhergehen, und das Star Gate-Projekt ist darauf ausgelegt, genau das zu tun, mit einer 100-fachen Steigerung der Leistung gegenüber den aktuellen Clustern. Wenn man sich die Entwicklung der GPT-Familie von GPT-1 bis GPT-4 ansieht, hat jede Modellgeneration eine etwa 100-fache Steigerung der Rechenleistung und damit beeindruckende neue Fähigkeiten erfahren.
Altman betonte jedoch, dass der größte Durchbruch des vergangenen Jahres in der Entwicklung von Inferenzmodellen bestand, die zu erheblichen Steigerungen der Recheneffizienz geführt haben. Er wies darauf hin, dass mit Techniken wie dem Reinforcement Learning selbst kleine Modelle bei bestimmten Benchmarks eine Leistung erreichen können, für die früher GPT-6-Niveau erforderlich war. Dies bedeutet, dass OpenAI ein neues Paradigma erforscht, bei dem die Modellleistung durch algorithmische Innovation und Effizienzoptimierung vorangetrieben wird, anstatt sich ausschließlich auf arithmetische Expansion zu verlassen.
Auf der Grundlage der Durchbrüche in der Inferenzmodellierungstechnologie sieht Altman der künftigen Entwicklung der KI, insbesondere im Bereich der autonomen wissenschaftlichen Entdeckung, erwartungsvoll entgegen. Er glaubt, dass die KI in naher Zukunft autonom neue wissenschaftliche Erkenntnisse entdecken wird, vor allem in Bereichen wie Physik und Biologie. Als Beispiel nannte er die rasche Iteration des Inferenzmodells von OpenAI: Von der anfänglichen Stufe, bei der nur eine Million Programmierer an Wettbewerben teilnahmen, über das o3-Modell, das bereits zu den weltweit besten 175 gehört, bis hin zur Annäherung an die weltweit besten 50 im internen Testmodell - die erstaunliche Geschwindigkeit des Fortschritts zeigt, dass KI über ein großes Potenzial bei der Inferenzfähigkeit verfügt. Altman sagt sogar kühn voraus, dass das Modell von OpenAI bis zum Ende dieses Jahres die weltweite Nummer eins im Bereich der Wettbewerbsprogrammierung sein wird.
Künftige Forschungsbereiche und technische Herausforderungen
F: Können Sie uns Ihre zukünftigen Forschungspläne für jeden Ihrer Forschungsbereiche mitteilen und sagen, was Sie derzeit als erreichbar ansehen und was eine besondere Herausforderung darstellt?
Ottoman: Freigegeben am Freitag o3-mini Die Modelle, an denen OpenAI in den nächsten 6-12 Monaten arbeiten wird, sind der Schlüssel für die Richtung der OpenAI-Forschung. Miniaturisierung, hohe Inferenz und ultraschnelle Modelle werden den Schwerpunkt der kurzfristigen Forschung und Entwicklung von OpenAI bilden, wobei eine schrittweise Ausweitung auf alle Bereiche erfolgen wird.
Die multimodale Integration ist eine weitere wichtige strategische Ausrichtung. OpenAI ist bestrebt, Text, Sprache, Bild, Code und andere Modalitäten in ein und dasselbe Modell zu integrieren, um eine umfassendere und natürlichere Interaktionserfahrung zu schaffen. Eine kontinuierliche Erweiterung der Modellskala ist ebenfalls geplant, und GPT-5, GPT-6 und sogar Modelle auf höherer Ebene sind noch zu erwarten.
Die Agententechnologie ist ein wichtiger Schwerpunkt von OpenAI. Die kürzlich eingeführte Funktion "Deep Research" ist ein wichtiger Schritt in diese Richtung. Diese Funktion kann selbstständig komplexe Online-Rechercheaufgaben erledigen und so die Effizienz der Informationsbeschaffung und -analyse erheblich verbessern. Altman verriet, dass OpenAI weitere Intelligenzen entwickeln und schließlich seine Vision von "programmierten Intelligenzen" verwirklichen wird, d. h. von KI-Systemen, die komplexe Programmieraufgaben selbstständig ausführen können.
Altman hofft, bis Ende dieses Jahres ein allgemeines Modell einer Intelligenz entwickeln zu können, die in der Lage ist, "die meisten komplexen Probleme außer der wissenschaftlichen Entdeckung" zu lösen. Ein solches Modell könnte stundenlanges Nachdenken erfordern und eine Vielzahl von Werkzeugen einsetzen, wäre aber letztendlich in der Lage, komplexe, vom Benutzer gestellte Aufgaben eigenständig zu lösen. Obwohl die rechnerischen und algorithmischen Herausforderungen zur Erreichung dieses Ziels enorm sind, ist Altman zuversichtlich.
ChatGPT Auswirkungen auf die Hochschulbildung
F: Wie wird generative KI die Bildung in den nächsten 10, 30, 100 Jahren verändern?
Ottoman: Generative KI wird die Bildungslandschaft umgestalten und allen Menschen den Zugang zu personalisierter Bildung ermöglichen, die über das heutige Niveau hinausgeht. Bildungs-Start-ups, die auf OpenAI-Technologie basieren, entstehen, um Lernenden maßgeschneiderte Lernlösungen zu bieten, die Wissenslücken schließen und lebenslanges Lernen fördern. Die Studierenden sind zum Hauptnutzer von ChatGPT geworden, und der Bildungssektor ist zweifelsohne eines der vielversprechendsten Anwendungsszenarien für generative KI.
Längerfristig glaubt Altman, dass die KI den wissenschaftlichen Fortschritt und die Entdeckungen dramatisch beschleunigen wird, wobei sich das Tempo der wissenschaftlichen Entwicklung in den nächsten 10 Jahren wahrscheinlich verzehn- oder sogar verhundertfachen wird. Dies wird die Lebensqualität der Menschen erheblich verbessern und den Fortschritt in zukunftsweisenden Bereichen wie der Weltraumforschung vorantreiben. Auf sozialer Ebene werden sich die Grundbedürfnisse und die Lebensweise der Menschen jedoch nicht grundlegend ändern, und zwischenmenschliche Interaktionen, Familienleben und Hobbys werden ein wichtiger Bestandteil der menschlichen Gesellschaft bleiben. Altman machte deutlich, dass er "überhaupt nicht besorgt ist, dass Menschen ihre Arbeitsplätze verlieren werden", und er glaubt, dass die KI nur eine Veränderung des Arbeitsinhalts und des Umfelds mit sich bringen wird, nicht aber eine Umwälzung der Funktionsweise der menschlichen Gesellschaft.
Gleichberechtigter Zugang zu KI-Tools
F: Wie kann die Welt einen gleichberechtigten Zugang zu diesen KI-Werkzeugen erhalten?
Ottoman: Das Ziel von OpenAI ist es, Intelligenz extrem billig zu machen, um schließlich Allgegenwart und kostenlosen Zugang für jeden auf dem Planeten zu erreichen. Um diese Vision zu verwirklichen, senkt OpenAI ständig die Kosten für die Nutzung seiner Modelle. Die Intelligenz des aktuellen Modells übertrifft die des GPT-3 von vor zwei Jahren bei weitem, aber der Preis beträgt nur 1% des ursprünglichen GPT-3. OpenAI wird weiter daran arbeiten, die Schwelle für die Nutzung von KI zu senken und die Universalität der Technologie zu fördern.
Talentbedarf und Qualifikationen im Zeitalter der KI
F: Welche Talente und Fähigkeiten werden Ihrer Meinung nach im Zeitalter der KI in Asien mehr geschätzt werden? Ein Ratschlag für Studenten: Welche Talente und Fähigkeiten sind Ihrer Meinung nach am wertvollsten und wichtigsten?
Altman: Im Zeitalter der KI ist es sinnlos, mit KI um Mathematik- oder Programmierkenntnisse zu konkurrieren. So wie die Erfindung der Rechenmaschine die Bedeutung von Rechenfertigkeiten revolutioniert hat, wird der Aufstieg der KI die Kernkompetenzen von Talenten neu definieren. Die Schlüsselfähigkeit der Zukunft liegt darin, "mit KI Dinge zu tun, die noch niemand zuvor tun konnte".
Altman schlägt vor, dass zu den Kernkompetenzen für die Zukunft gehören: Einblick in die Bedürfnisse der Nutzer, eine Vision für Innovation, schnelle Anpassung an Veränderungen, Belastbarkeit und die Beherrschung von Möglichkeiten, KI-Tools zur Steigerung der Effizienz einzusetzen. kevin Weil fügt hinzu, dass es entscheidend ist, KI-Tools aktiv zu nutzen und sie in Arbeits- und Lernprozesse zu integrieren. Er rät den Studierenden, proaktiv darüber nachzudenken: "Kann KI mir helfen, Dinge schneller zu erledigen? Welche Aufgaben können an KI ausgelagert werden?"
Altman betonte, dass KI und Mensch kein Nullsummenspiel sind, sondern eine "ko-evolutionäre" Beziehung. Der Mensch sollte sich aktiv an neue Technologien anpassen und KI nutzen, um noch nie dagewesene Fähigkeiten zu erlangen. Weil empfiehlt das Buch "Co Intelligence" des Wharton-Professors Ethan Malik, in dem es darum geht, wie KI in der Lehre eingesetzt werden kann und wie Studenten mit KI arbeiten können.
Die Auswirkungen der Open-Source-Strategie von DeepSeek und die Antwort von OpenAI
F: Sie erwähnten vorhin, dass Sie Intelligenz für alle zugänglich machen wollen. Mit der jüngsten Veröffentlichung der chinesischen KI DeepSeek und der Offenlegung der Gewichte und der Architektur wurde die Richtigkeit der Abkehr von OpenAI von Open Source in Frage gestellt. Haben Sie Pläne, diese Position zu überdenken? Was sind die Gründe dafür?
Ottman: OpenAI überdenkt seine Open-Source-Strategie. "Ja, das werden wir", sagt er, aber es gibt keinen klaren Zeitplan dafür, welche Modelle wann als Open Source verfügbar sein werden. Altman zufolge scheint sich der Trend in der Branche in Richtung offener Modelle zu bewegen, und die Community akzeptiert die potenziellen Risiken und Herausforderungen, die mit Open Source einhergehen, immer mehr. Er betonte, dass OpenAI Fortschritte bei der Gewährleistung der Sicherheit und Robustheit von Open-Source-Modellen gemacht hat und glaubt, dass die meisten Open-Source-Modelle für positive Zwecke verwendet werden. Der Open-Source-Schritt von DeepSeek hat sich zweifellos auf die strategischen Entscheidungen von OpenAI ausgewirkt und das Unternehmen dazu veranlasst, seine Position zu Open Source zu überdenken.
Andere Q&A Featured
- Gehirn-Computer-Schnittstellen und Ideologie: Altman glaubt, dass die Gehirn-Computer-Schnittstellentechnologie an der Schwelle zur Entwicklung steht, mit dem Versprechen einer direkten Verbindung zwischen dem menschlichen Gehirn und der KI in der Zukunft. Er hat Vorbehalte gegenüber einigen "disruptiven" Brain-Computer-Interface-Lösungen, ist aber optimistisch gegenüber "leichtgewichtigen" Lösungen und sieht in den nächsten sechs Monaten weitere interessante Start-ups entstehen.
- KI und Raumfahrttechnik: Laut Weil erleben KI-Anwendungen im Weltraum eine Phase schnellen Wachstums. Die zunehmende Leistungsfähigkeit von Satelliten und die schrumpfende Größe von Modellen machen es möglich, KI-Modelle im Weltraum einzusetzen. Sein Unternehmen Planet hat bereits Satelliten mit GPUs gestartet, um KI-Modelle im Weltraum auszuführen und die Datenverarbeitung und -übertragung zu beschleunigen.
- KI-Zukunftsprognosen: Altman sagt voraus, dass bis 2035 die intellektuelle Kapazität eines einzigen Rechenzentrums die kombinierte intellektuelle Kapazität aller Menschen und KI auf dem Planeten im Jahr 2025 übersteigen wird. Das bedeutet, dass die KI schneller wachsen wird als je zuvor.
- Modelltrainingsstrategien für knappe Datensätze: Weil weist darauf hin, dass mit der zunehmenden Intelligenz der Modelle auch die für die Feinabstimmung erforderliche Stichprobengröße abnimmt. Die Fähigkeit hochintelligenter Modelle, aus einer kleinen Anzahl von Datenpunkten schnell neues Domänenwissen zu erlernen, bietet eine neue Möglichkeit, das Problem des Trainings von Modellen auf knappen Datensätzen anzugehen.
Unternehmertum, Robotik und technologischer Rückstand
- Laut Altman sind die wichtigsten Eigenschaften von Teammitgliedern in der Anfangsphase Energie und Entschlossenheit. Er zitierte Paul Grahams berühmten Satz "be relentlessly resourceful", um zu betonen, dass frühe Teams extrem lern- und problemlösungsfähig sein sollten. Weil fügte hinzu, dass Unternehmer flexibel sein, nicht aufgeben und bereit sein müssen, zu lernen, um die Herausforderungen des Unternehmertums zu meistern.
- Robotersprache und -kultur: Altman ist der Ansicht, dass die Integration von visuellem und auditivem Input in einen Rahmen für abstraktes Denken der Schlüssel zur Entwicklung einer autonomen Sprache und Kultur bei Robotern ist. Er sagt voraus, dass mit fortschreitender Intelligenz multi-intelligente Systeme entstehen werden, die neue Wege der Kommunikation und des Informationsaustauschs entwickeln. Auch wenn es vielleicht nicht so dramatisch ist, wie in Science-Fiction-Filmen dargestellt, ist das Aufkommen autonomer Roboterkommunikation und -kultur ein Phänomen, auf das man sich freuen kann.
- Technologischer Aufholprozess und Wettbewerbsvorteil: Altman betonte, dass die grundlegenden Gesetze der Wirtschaft auch im Zeitalter der KI gelten und dass Unternehmer Produkte oder Dienstleistungen entwickeln müssen, die einen dauerhaften Wert haben, sich durchsetzen und sich von anderen abheben. Er empfahl Peter Thiels Buch "From 0 to 1", das einen detaillierten Einblick in den Aufbau langfristiger Wettbewerbsvorteile gibt. Weil schlug vor, dass Unternehmer darauf abzielen sollten, "bahnbrechende" Produkte zu entwickeln, die die Grenzen der Modellierungsmöglichkeiten ausreizen. Wenn ein Startup Angst vor den Modell-Upgrades von OpenAI hat, könnte es ein Problem mit der Ausrichtung geben. Wenn sie jedoch davon ausgehen, dass Modell-Upgrades ihren Produkten einen größeren Wert verleihen, sind sie auf dem richtigen Weg.
Zusammenfassungen
Die Reise von OpenAI-CEO Sam Altman nach Tokio signalisiert nicht nur eine neue Richtung für die Iteration der GPT-Modellreihe, sondern zeigt auch das strategische Denken von OpenAI in der sich verändernden Landschaft der globalen KI. Von der Betonung des arithmetischen Stapelns bis zur Effizienzsteigerung, von Textmodellen bis zur multimodalen Fusion und von der Einzelmodellintelligenz bis zu einem Ökosystem von Intelligenzen - OpenAI nimmt den technologischen Wandel aktiv auf und versucht, seine führende Position in der neuen Wettbewerbslandschaft zu behaupten. Der Aufstieg chinesischer KI-Neulinge wie DeepSeek stellt OpenAI zweifellos vor neue Herausforderungen und veranlasst sie, sich aktiver um Offenheit und Zusammenarbeit zu bemühen, um gemeinsam den Fortschritt und die Verbreitung der KI-Technologie zu fördern.