Introduction à l'OpenAI o1-preview

Base de connaissances sur l'IAMise à jour il y a 12 mois Cercle de partage de l'IA

9.4K 00

OpenAI présente une nouvelle série de modèles d'inférence conçus pour résoudre des problèmes difficiles. Elle sera officiellement lancée le 12 septembre.

Nous avons mis au point une série de nouveaux modèles d'IA qui prennent plus de temps pour réfléchir avant de donner une réponse. Ils peuvent gérer des tâches complexes et résoudre des problèmes plus difficiles que les modèles précédents dans des domaines tels que les sciences, la programmation et les mathématiques.

Aujourd'hui, nous sommes dans la ChatGPT et notre API a publié le premier modèle de cette série. Il s'agit d'une version préliminaire et nous prévoyons des mises à jour et des améliorations régulières. Dans l'intervalle, nous avons rendu leRésultats de la prochaine évaluation actualiséeLa mise à jour est actuellement en cours de développement.

Principe de fonctionnement

Nous formons ces modèles à réfléchir plus profondément avant de répondre aux questions, comme le font les humains. Grâce à cette formation, ils apprennent à affiner leur processus de réflexion, à essayer différentes stratégies et à reconnaître leurs erreurs.

Lors de nos tests, la mise à jour du modèle prête à être lancée a obtenu des résultats dignes d'un doctorat dans des tâches de référence difficiles en physique, en chimie et en biologie. Nous avons également constaté qu'il excellait en mathématiques et en programmation. Lors de l'examen de qualification de l'Olympiade internationale de mathématiques (OIM), GPT-4o n'a résolu correctement que 13%, tandis que le nouveau modèle d'inférence a obtenu 83%. En termes de capacité de programmation, ils ont atteint l'ancien niveau de performance de 89% dans la compétition Codeforces. Pour plus de détails, voir notreArticles de recherche technique.

En tant que modèle précoce, il manque actuellement de nombreuses fonctions utiles de ChatGPT, telles que la navigation sur le web et le téléchargement d'images de fichiers. À court terme, pour de nombreux scénarios courants, GPT-4o pourrait s'avérer plus pratique.

Cependant, pour les tâches de raisonnement complexes, il s'agit d'une avancée majeure qui représente un nouveau niveau de capacité de l'IA. Sur cette base, nous avons remis le compteur à 1 et nommé la série OpenAI o Security.

En développant ces nouveaux modèles, nous proposons une nouvelle approche de la formation à la sécurité qui utilise pleinement leurs capacités de raisonnement pour permettre un meilleur respect des directives de sécurité et d'alignement. En étant capable de raisonner sur nos règles de sécurité dans des contextes spécifiques, ils permettent une application plus efficace de ces règles.

L'une des façons de mesurer la sécurité consiste à tester la capacité du modèle à continuer à respecter les règles de sécurité lorsqu'un utilisateur tente de les contourner (ce que l'on appelle communément un "jailbreak"). Lors de notre test de jailbreak le plus difficile, GPT-4o a obtenu un score de 22 sur 100, tandis que notre modèle o1-preview a obtenu un score impressionnant de 84. Pour plus de détails, consultez le siteDescription du systèmeet notreArticles de recherche.

Pour répondre aux nouvelles capacités de ces modèles, nous avons renforcé nos efforts en matière de sécurité, de gouvernance interne et de collaboration avec le gouvernement fédéral. Il s'agit notamment d'utiliser notreCadre de préparationEn procédant à des tests et à des évaluations rigoureuses, à des tests en équipe rouge de haut niveau et à un processus d'examen au niveau du conseil d'administration qui inclut la participation de notre comité de sûreté et de sécurité.

Dans le cadre de notre engagement en faveur de la sécurité de l'IA, nous avons récemment conclu des accords formels avec les instituts de sécurité de l'IA aux États-Unis et au Royaume-Uni. Nous avons commencé à mettre en œuvre ces accords, notamment en accordant à ces instituts un accès anticipé aux versions de recherche du modèle. Il s'agit d'une première étape importante de notre partenariat visant à établir un processus de recherche, d'évaluation et de test des futurs modèles avant et après leur diffusion publique.

population concernée

Ces capacités de raisonnement améliorées sont particulièrement adaptées à ceux qui travaillent sur des problèmes complexes dans les domaines de la science, de la programmation, des mathématiques et autres. Par exemple, les chercheurs médicaux peuvent utiliser o1 pour annoter les données de séquençage cellulaire, les physiciens peuvent l'utiliser pour générer les formules mathématiques complexes nécessaires à l'optique quantique, et les développeurs dans une variété de domaines peuvent l'utiliser pour construire et exécuter des flux de travail à plusieurs étapes.

OpenAI o1-mini

La famille de modèles o1 excelle dans la génération et le débogage de codes complexes. Pour offrir aux développeurs une solution encore plus efficace, nous avons introduit le modèle OpenAI o1-mini. Il s'agit d'un modèle de raisonnement plus rapide et plus économique qui est particulièrement efficace pour les tâches de programmation. En tant que modèle à plus petite échelle, o1-mini coûte 80% de moins que o1-preview, ce qui en fait un choix idéal pour les applications qui requièrent une puissance de raisonnement sans pour autant nécessiter une connaissance approfondie du monde, à la fois puissante et abordable.

Comment utiliser OpenAI o1

A partir d'aujourd'hui.Utilisateurs de ChatGPT Plus et TeamLe modèle o1 peut être utilisé dans ChatGPT. Les utilisateurs peuvent sélectionner manuellement o1-preview et o1-mini dans le sélecteur de modèle. o1-preview est limité à 30 messages par semaine et o1-mini à 50 messages par semaine dans la version initiale. Nous travaillons à l'augmentation de ces limites et au développement de la capacité de ChatGPT à sélectionner automatiquement le modèle le plus approprié pour chaque message.

ChatGPT Enterprise et Edu utilisateursauront accès aux deux modèles à partir de la semaine prochaine. Conforme à la norme Niveau d'utilisation de l'API 5 (ouvre une nouvelle fenêtre) (utilisé comme expression nominale)développeursVous pouvez commencer à faire des prototypes avec les deux modèles dans l'API dès maintenant, avec une limite actuelle de 20 requêtes par minute. Nous effectuons des tests supplémentaires en vue d'augmenter ces limites. Actuellement, les API de ces modèles n'incluent pas de fonctionnalités telles que les appels de fonction, la diffusion en continu et la prise en charge des messages système. Pour commencer, consultez la page Documentation de l'API (s'ouvre dans une nouvelle fenêtre).

Nous prévoyons également d'avoir tous les ChatGPT Utilisateurs gratuitsLes deux peuvent utiliser l'o1-mini.

perspectives d'avenir

Il ne s'agit que d'un premier aperçu de ces modèles d'inférence dans ChatGPT et l'API. En plus de la mise à jour continue des modèles, j'ajoute la navigation sur le web, le téléchargement de fichiers et d'images, et d'autres fonctionnalités pour améliorer leur utilité.

Outre la nouvelle famille OpenAI o1, nous continuerons à développer et à publier la famille de modèles GPT.