Les modèles à faible coût de DeepSeek remuent le couteau dans la plaie, la stratégie de l'OpenAI s'oriente vers l'intelligence d'ordre supérieur, et le GPT-4.5 est prêt à démarrer !
Quand les débutants chinois en matière d'IA DeepSeek Alors que Sam Altman, PDG d'OpenAI, fait des vagues dans l'espace mondial de l'IA avec ses modèles open source et à faible coût, il est en voyage discret à Tokyo. Au centre de cette visite se trouve sans aucun doute la manière dont le leader du secteur réagit à l'émergence d'un paysage concurrentiel et consolide son leadership technologique.

M. Altman et Kevin Weil, Chief Product Officer d'OpenAI, se sont rendus à l'Université de Tokyo pour une séance de questions-réponses approfondie avec les étudiants et les professeurs avant de discuter d'un investissement potentiel de 500 milliards de dollars avec le fondateur de SoftBank, Masayoshi Son. Au cours de la séance de questions-réponses, ils ont révélé un certain nombre d'informations fascinantes qui préfigurent l'orientation future d'OpenAI et la réflexion stratégique sur le paysage concurrentiel de l'industrie.
Feuille de route itérative pour la famille de modèles GPT : une révolution dans l'efficacité et un bond dans la capacité
M. Altman a clairement indiqué dans l'interview que des progrès ont été réalisés au sein de l'OpenAI sur le GPT-4.5 et que l'on a une idée plus claire de la voie à suivre pour atteindre le GPT-5.5. Il a notamment souligné que "l'atteinte de GPT-5.5 ne nécessite pas une puissance de calcul 100 fois supérieure".
Cette affirmation n'est pas vide de sens, mais repose sur les percées d'OpenAI en matière de modélisation de l'inférence et de techniques d'apprentissage par renforcement. M. Altman explique : "Les progrès de la modélisation de l'inférence et de la technologie d'apprentissage par renforcement ont considérablement amélioré l'efficacité des calculs, ce qui permet à des modèles plus petits d'atteindre des performances de niveau GPT-6 sans nécessiter une puissance de calcul 100 fois supérieure". Cela signifie que l'OpenAI explore une voie de mise à l'échelle des modèles "axée sur l'efficacité", plutôt que de s'appuyer uniquement sur l'empilement arithmétique.
Fusion multimodale et stratégie corporelle intelligente : construction d'un écosystème général d'intelligence artificielle
M. Altman a ensuite présenté le plan technologique futur d'OpenAI, avec la fusion multimodale et les intelligences au centre de sa stratégie. Il a donné un aperçu de la puissance de la prochaine génération de modèles, la "série o" :
- Intégration multimodale : "Nous intégrerons toutes les modalités ensemble, et vous pourrez voir sur la toile qu'il vous parle tout en écrivant et en compilant du code pour vous. Il sera capable de naviguer sur Internet". Cela signifie que les futurs modèles OpenAI ne seront plus limités au texte, mais qu'ils seront capables de gérer de manière transparente de multiples formes d'information telles que la parole, les images, le code, et plus encore, pour une expérience d'interaction plus naturelle et plus complète.
- Capacité de reconnaissance visuelle : "o Les modèles seront capables de prendre en charge des fonctions de reconnaissance visuelle, par exemple un certain matériel doit être révisé, prendre une photo, o Des séries de modèles seront capables de fournir une assistance technique." Les scénarios d'application de l'IA s'en trouveront considérablement élargis, ce qui lui permettra de comprendre le monde physique et de fournir des solutions plus pratiques.
- Modèles d'inférence miniaturisés et très performants : "o3-mini préfigure les directions de recherche pour les six à douze prochains mois ......" OpenAI continuera à investir dans le développement de modèles miniaturisés à haute performance d'inférence qui excelleront dans le domaine des STIM et au-delà.
- Prototype de corps intelligent : "J'espère que d'ici la fin de l'année, nous aurons développé un modèle de corps intelligent capable de résoudre toutes les tâches difficiles, à l'exception de la découverte scientifique, et qu'il faudra peut-être des heures pour y réfléchir, et qu'il faudra peut-être même faire appel à un tas d'outils, mais qu'en fin de compte, il sera capable d'accomplir la tâche à votre place." Cela suggère qu'OpenAI explore activement la construction d'intelligences autonomes dans le but de créer des systèmes d'IA capables d'effectuer des tâches complexes par eux-mêmes, et la récente sortie de la fonctionnalité Deep Research est une étape importante dans cette stratégie.
Bien qu'Altman et Weil aient souligné que l'objectif du voyage était de recueillir les commentaires des utilisateurs, leurs révélations désinvoltes sur la planification du produit GPT et leur réponse à la stratégie open source de DeepSeek indiquent clairement un changement d'orientation stratégique de l'OpenAI : de la recherche pure de l'échelle du modèle et de la puissance arithmétique à l'approfondissement des modèles d'inférence à haute capacité, de la fusion multimodale et des intelligences pour construire un écosystème d'IA plus polyvalent, plus efficace et plus intelligent. La stratégie de l'OpenAI est passée de la recherche pure de l'échelle de modèle et de la puissance arithmétique à un engagement profond dans les modèles d'inférence à haute capacité, la fusion multimodale et les technologies du corps intelligent, afin de construire une écologie de l'IA plus polyvalente, plus efficace et plus intelligente.
Analyse des points essentiels de l'entretien : perspectives d'avenir et interprétation de l'orientation stratégique de GPT
Les points saillants de cet entretien avec l'Université de Tokyo ont été compilés, et ce qui suit est une lecture approfondie du contenu essentiel du dialogue :
Plans de publication futurs pour la famille de modèles GPT
Q : Si ChatGPT Quelles sont les nouvelles propriétés émergentes qui résulteront de l'obtention d'une puissance arithmétique cent fois supérieure ? Y aura-t-il des sauts qualitatifs ?
Altman : OpenAI explore activement les capacités des modèles qui découlent de l'augmentation de la puissance arithmétique, et le projet Star Gate est justement conçu pour cela, avec une puissance multipliée par 100 par rapport aux clusters actuels. Si l'on considère l'évolution de la famille GPT, de GPT-1 à GPT-4, chaque génération de modèles a vu sa puissance arithmétique multipliée par 100 environ, ce qui a donné lieu à de nouvelles capacités impressionnantes.
Toutefois, M. Altman a souligné que la plus grande avancée de l'année dernière a été l'émergence de modèles d'inférence, qui ont permis des gains significatifs en termes d'efficacité de calcul. Il a souligné qu'avec des techniques telles que l'apprentissage par renforcement, même de petits modèles peuvent atteindre des performances dans des repères spécifiques qui nécessitaient auparavant des niveaux GPT-6. Cela signifie que l'OpenAI explore un nouveau paradigme dans lequel la puissance des modèles est déterminée par l'innovation algorithmique et l'optimisation de l'efficacité, plutôt que de s'appuyer uniquement sur l'expansion arithmétique.
S'appuyant sur les percées réalisées dans la technologie de modélisation par inférence, M. Altman attend avec impatience le développement futur de l'IA, en particulier dans le domaine de la découverte scientifique autonome. Il pense que l'IA devrait découvrir de manière autonome de nouvelles connaissances scientifiques dans un avenir proche, en particulier dans des domaines tels que la physique et la biologie. Il a cité en exemple l'itération rapide du modèle d'inférence d'OpenAI : du niveau initial où il n'atteignait que le niveau des programmeurs dans les compétitions en dehors des millions, au modèle o3 capable de se classer parmi les 175 meilleurs au monde, puis au modèle de test interne approchant les 50 meilleurs au monde, la vitesse étonnante des progrès indique que l'IA a un grand potentiel en matière de capacité d'inférence. M. Altman prédit même avec audace que d'ici la fin de l'année, le modèle d'OpenAI devrait être le numéro 1 mondial dans le domaine de la programmation compétitive.
Domaines de recherche et défis techniques futurs
Q : Pouvez-vous nous faire part de vos projets de recherche pour chacun de vos domaines de recherche et nous dire ce que vous considérez actuellement comme réalisable et ce qui représente un défi particulier ?
Ottoman : libéré vendredi o3-mini Les modèles sur lesquels OpenAI travaillera dans les 6 à 12 prochains mois seront la clé de l'orientation de la recherche d'OpenAI. La miniaturisation, l'inférence élevée et les modèles ultra-rapides seront au centre de la recherche et du développement d'OpenAI à court terme, avec une expansion progressive dans tous les domaines.

L'intégration multimodale est une autre orientation stratégique majeure. OpenAI s'engage à intégrer le texte, la parole, l'image, le code et d'autres modalités dans le même modèle afin de créer une expérience d'interaction plus complète et plus naturelle. L'expansion continue de l'échelle du modèle est également prévue, et les modèles GPT-5, GPT-6 et même des modèles de niveau supérieur méritent d'être attendus avec impatience.
La technologie des agents est un domaine clé pour l'OpenAI. La fonction Deep Research, lancée récemment, constitue une étape importante dans cette direction. Cette fonction peut accomplir de manière autonome des tâches complexes de recherche en ligne, ce qui améliore considérablement l'efficacité de l'acquisition et de l'analyse des informations. M. Altman a révélé qu'OpenAI continuera à développer d'autres intelligences et finira par concrétiser sa vision des "intelligences programmées", c'est-à-dire des systèmes d'IA capables d'exécuter de manière autonome des tâches de programmation complexes.
Pour l'avenir, M. Altman espère développer, d'ici la fin de l'année, un modèle polyvalent d'intelligence capable de résoudre "la plupart des problèmes complexes autres que la découverte scientifique". Un tel modèle pourrait nécessiter des heures de réflexion et faire appel à une variété d'outils, mais il serait en fin de compte capable d'exécuter seul des tâches complexes confiées par l'utilisateur. Bien que les défis informatiques et algorithmiques à relever pour atteindre cet objectif soient énormes, M. Altman est confiant.
ChatGPT Impact sur l'enseignement supérieur
Q : Comment l'IA générative va-t-elle changer l'éducation dans les 10, 30 ou 100 prochaines années ?
Ottoman : L'IA générative va remodeler le paysage de l'éducation, en donnant à chacun l'accès à un enseignement personnalisé, au-delà des meilleurs d'aujourd'hui. Des startups du secteur de l'éducation basées sur la technologie OpenAI émergent pour fournir aux apprenants des solutions d'apprentissage sur mesure qui comblent les lacunes en matière de connaissances et favorisent l'apprentissage tout au long de la vie. La population étudiante est devenue le principal utilisateur de ChatGPT, et le secteur de l'éducation est sans aucun doute l'un des scénarios d'application les plus prometteurs pour l'IA générative.
À plus long terme, M. Altman estime que l'IA accélérera considérablement les progrès et les découvertes scientifiques, le taux de développement scientifique étant susceptible d'être multiplié par 10, voire par 100, au cours des dix prochaines années. Cela améliorera considérablement la qualité de la vie humaine et favorisera les progrès dans des domaines de pointe tels que l'exploration spatiale. Cependant, au niveau social, les besoins essentiels et les modes de vie des êtres humains ne changeront pas fondamentalement, et les interactions interpersonnelles, la vie de famille et les loisirs resteront une partie importante de la société humaine. Altman a précisé qu'il n'est "pas du tout inquiet que les humains perdent leur emploi", et il pense que l'IA n'apportera qu'un changement dans le contenu du travail et de l'environnement, plutôt qu'une subversion du mode de fonctionnement de la société humaine.
Accès équitable aux outils d'IA
Q : Comment le monde peut-il bénéficier d'un accès équitable à ces outils d'IA ?
Ottoman : L'objectif d'OpenAI est de rendre l'intelligence extrêmement bon marché, afin de parvenir à une ubiquité à un coût proche de zéro et à un accès gratuit pour tous les habitants de la planète. Pour concrétiser cette vision, OpenAI réduit constamment le coût d'utilisation de ses modèles. Le niveau d'intelligence du modèle actuel a largement dépassé celui du GPT-3 il y a deux ans, mais son prix ne représente que 1% du GPT-3 original. OpenAI continuera à travailler pour abaisser le seuil d'utilisation de l'IA et promouvoir l'universalité de la technologie.
Besoins en talents et compétences à l'ère de l'IA
Q : Quels types de talents et de compétences seront, selon vous, davantage valorisés en Asie à l'ère de l'IA ? Quelques conseils pour les étudiants : quels sont les talents et les compétences qui, selon vous, ont le plus de valeur et sont les plus importants ?
Altman : À l'ère de l'IA, il est vain de rivaliser avec l'IA pour des compétences en mathématiques ou en programmation. Tout comme l'invention de la calculatrice a révolutionné l'importance des compétences en calcul, l'essor de l'IA va redéfinir les compétences de base des talents. La compétence clé de l'avenir consiste à "faire des choses avec l'IA que personne n'a été capable de faire auparavant".
Selon M. Altman, les compétences essentielles pour l'avenir sont les suivantes : comprendre les besoins des utilisateurs, avoir une vision de l'innovation, s'adapter rapidement au changement, rester résilient et maîtriser les moyens d'exploiter les outils d'IA pour améliorer l'efficacité. kevin Weil ajoute qu'il est essentiel d'adopter activement les outils d'IA et de les intégrer dans les processus de travail et d'apprentissage. Il conseille aux étudiants de réfléchir de manière proactive aux questions suivantes : "L'IA peut-elle m'aider à faire les choses plus rapidement ? Quelles tâches peuvent être confiées à l'IA ?"
M. Altman a souligné que l'IA et l'homme ne sont pas un jeu à somme nulle, mais une relation "coévolutive". Les humains devraient s'adapter activement aux nouvelles technologies et utiliser l'IA pour acquérir des capacités sans précédent. Mme Weil recommande le livre Co Intelligence d'Ethan Malik, professeur à Wharton, qui explique comment l'IA peut être utilisée pour l'enseignement et comment les étudiants peuvent travailler avec l'IA.
L'impact de la stratégie Open Source de DeepSeek et la réponse d'OpenAI
Q : Plus tôt, vous avez parlé de rendre l'intelligence accessible à tous. Avec la récente publication de l'IA chinoise DeepSeek et la divulgation des poids et de l'architecture, la validité de la décision d'OpenAI de s'éloigner de l'open source a été remise en question. Avez-vous l'intention de reconsidérer cette position ? Pour quelles raisons ?

Ottman : OpenAI est en train de réévaluer sa stratégie en matière d'open source. "Oui, nous le ferons", dit-il, mais il n'y a pas de calendrier précis concernant les modèles qui seront ouverts et le moment où ils le seront. Selon M. Altman, l'industrie semble s'orienter vers des modèles plus ouverts, et la communauté accepte de plus en plus les risques et les défis potentiels liés à l'open source. Il souligne que l'OpenAI a fait des progrès pour garantir la sécurité et la robustesse des modèles open source et pense que la plupart des modèles open source seront utilisés à des fins positives. Le passage à l'open source de DeepSeek a sans aucun doute eu un impact sur les décisions stratégiques de l'OpenAI, l'incitant à réexaminer sa position sur l'open source.
Autres Q&R en vedette
- Interfaces cerveau-ordinateur et idéologie : M. Altman estime que la technologie des interfaces cerveau-ordinateur est sur le point d'être développée, avec la promesse d'une connexion directe entre le cerveau humain et l'IA à l'avenir. Il émet des réserves sur certaines solutions d'interface cerveau-ordinateur "perturbatrices", mais il est optimiste quant aux solutions "légères" et voit d'autres start-ups intéressantes émerger au cours des six prochains mois.
- L'IA et l'ingénierie spatiale : selon M. Weil, les applications de l'IA dans l'espace connaissent une période de croissance rapide. L'augmentation des performances des satellites et la réduction de la taille des modèles permettent de déployer des modèles d'IA dans l'espace. Son entreprise Planet a déjà lancé des satellites équipés de GPU pour exécuter des modèles d'IA dans l'espace et accélérer le traitement et la transmission des données.
- Prévisions concernant l'avenir de l'IA : M. Altman prévoit que d'ici 2035, la capacité intellectuelle d'un seul centre de données dépassera la capacité intellectuelle combinée de tous les humains et de l'IA sur la planète en 2025. Cela signifie que l'IA se développera plus rapidement que jamais.
- Stratégies de formation de modèles pour les ensembles de données rares : Weil souligne qu'à mesure que les modèles deviennent plus intelligents, la taille de l'échantillon nécessaire pour les affiner diminue. La capacité des modèles très intelligents à apprendre rapidement de nouvelles connaissances du domaine à partir d'un petit nombre de points de données offre une nouvelle façon d'aborder le problème de la formation des modèles sur des ensembles de données rares.
Entrepreneuriat, robotique et rattrapage technologique
- Selon M. Altman, les qualités les plus importantes des membres d'une équipe en phase de démarrage sont l'énergie et la détermination. Il a cité la célèbre phrase de Paul Graham "be relentlessly resourceful" pour souligner que les équipes en phase de démarrage doivent être extrêmement capables d'apprendre et de résoudre des problèmes. M. Weil a ajouté que les entrepreneurs doivent être flexibles, ne pas abandonner et être prêts à apprendre afin de relever les défis de l'entrepreneuriat.
- Langage et culture des robots : M. Altman estime que l'intégration des données visuelles et auditives dans un cadre de pensée abstraite est essentielle au développement d'un langage et d'une culture autonomes chez les robots. Il prédit qu'au fur et à mesure que l'intelligence progresse, des systèmes multi-intelligents apparaîtront et développeront de nouveaux modes de communication et de partage de l'information. Même si elle n'est pas aussi spectaculaire que celle décrite dans les films de science-fiction, l'émergence d'une communication et d'une culture robotiques autonomes est quelque chose que l'on peut attendre avec impatience.
- Rattrapage technologique et avantage concurrentiel : M. Altman a souligné que les lois fondamentales de l'entreprise s'appliquent toujours à l'ère de l'IA et que les entrepreneurs doivent créer des produits ou des services qui ont une valeur durable, qui sont accrocheurs et qui se différencient des autres. Il a recommandé le livre de Peter Thiel "From 0 to 1" pour un examen approfondi de la manière de créer un avantage concurrentiel à long terme. Selon M. Weil, les entrepreneurs devraient s'efforcer de créer des produits "d'avant-garde" qui repoussent les limites des capacités de modélisation. Si une startup a peur des mises à jour des modèles d'OpenAI, il se peut qu'il y ait un problème d'orientation. En revanche, si elle s'attend à ce que les mises à jour des modèles apportent plus de valeur à ses produits, elle est sur la bonne voie.
résumés
Le voyage du PDG d'OpenAI, Sam Altman, à Tokyo ne signale pas seulement une nouvelle direction pour l'itération de la série de modèles GPT, mais montre également la pensée stratégique d'OpenAI dans le paysage changeant de l'IA mondiale. De l'empilement arithmétique à l'amélioration de l'efficacité, des modèles textuels à la fusion multimodale, et de l'intelligence à modèle unique à un écosystème d'intelligences, OpenAI adopte activement le changement technologique et tente de maintenir sa position de leader dans le nouveau paysage concurrentiel. La montée en puissance des nouveaux venus chinois dans le domaine de l'IA, tels que DeepSeek, pose sans aucun doute de nouveaux défis à l'OpenAI et l'incite à adopter plus activement l'ouverture et la coopération afin de promouvoir conjointement les progrès et la popularisation de la technologie de l'IA.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...