OpenAI lance DeepResearch, une intelligence pour la recherche en profondeur utilisant les modèles o3

Nouvelles de l'IAMise à jour il y a 7 mois Cercle de partage de l'IA

11.9K 00

Êtes-vous fatigué de chercher dans d'énormes quantités d'informations et d'avoir toujours du mal à trouver les réponses dont vous avez besoin ? Vous rêvez d'un assistant intelligent capable d'effectuer des recherches approfondies pour vous, à la manière d'un analyste professionnel ? OpenAI est fière d'annoncer le lancement d'OpenAI ! ChatGPT Une toute nouvelle caractéristique du -Recherche approfondie! Elle changera complètement la façon dont vous obtenez des informations, vous permettant d'accomplir en quelques minutes des tâches de recherche complexes qui prendraient autrement des heures. Cet article vous permettra de mieux comprendre les puissantes fonctions de la recherche approfondie, les scénarios d'application, les principes de fonctionnement et l'orientation future du développement. Ensemble, nous verrons comment l'IA renforce le travail de la connaissance et ouvre une nouvelle ère de recherche intelligente !

Il s'agit d'une intelligence qui utilise le raisonnement pour synthétiser de grandes quantités d'informations en ligne et accomplir des tâches de recherche en plusieurs étapes pour vous, à l'instar de la Perplexité répondre en chantant Gémeaux La nouvelle version de "Deep Research" d'OpenAI utilise son puissant modèle o3 pour rassembler et analyser des quantités massives d'informations par le biais de recherches sur le web, et génère finalement un rapport professionnel détaillé avec des citations. Cette fonction a suscité une grande attention depuis son lancement et a été saluée comme un assistant IA "superpuissant", annonçant l'arrivée d'une nouvelle ère de recherche assistée par l'IA.

Elle est disponible dès aujourd'hui pour les utilisateurs Pro, et le sera ensuite pour les utilisateurs Plus et Team.

En bref :"Deep Research" effectue de manière autonome des recherches en réseau en plusieurs étapes, réalisant en 5 à 30 minutes des tâches de recherche complexes qui prendraient normalement des heures à un chercheur humain, et présentant les résultats à l'utilisateur sous la forme d'un rapport de haute qualité.

Lecture de référence :Google lance Deep Research,Open Deep Research : générer des recherches sur l'IA à partir du contenu des recherches sur le web,STORM : recherche de données sur le web sur la base de thèmes, génération d'articles avec citations, rapports d'articles longs

Quelle est la qualité de la "recherche approfondie" ? Découvrons-le :

Puissant et incroyablement efficace : Fini les nuits blanches à chercher des informations ! "Deep Research" porte la recherche à un tout autre niveau d'efficacité en réalisant des études complexes qui prennent traditionnellement des heures en 5 à 30 minutes, avec la possibilité de creuser aussi profondément que nécessaire pour fournir des analyses de niveau expert.
Les résultats sont fiables et bien documentés : Plus besoin de s'inquiéter de la source de vos informations ! Toutes les conclusions sont accompagnées de citations détaillées, jusqu'au paragraphe concerné de la page web ou du PDF d'origine, ce qui permet aux utilisateurs de retrouver et de vérifier facilement l'exactitude des informations et de rendre votre recherche plus convaincante.
Large gamme d'applications, flexible et facile à utiliser : Que vous ayez besoin d'effectuer une analyse concurrentielle, une étude de marché, un achat de produits ou une recherche académique, "Deep Research" peut être votre main droite. Il vous suffit de sélectionner "Recherche approfondie" dans l'interface de ChatGPT et de saisir une requête pour commencer votre recherche. Prise en charge du téléchargement de fichiers (p. ex. PDF) pour fournir un contexte plus spécifique, et affichage en temps réel de l'avancement de la recherche et des sources citées dans la barre latérale.
Technologie avancée et excellentes performances : Basé sur l'apprentissage par renforcement de bout en bout, Deep Research est capable d'effectuer des tâches de navigation et de raisonnement en plusieurs étapes. Il prend en charge la lecture du contenu des sites web, le traitement des données, la génération de graphiques et la citation de textes sources pour étayer des arguments. Lors d'un test de référence difficile appelé "Humanity's Last Exam" (HLE), Deep Research a obtenu un score de 26,6%, dépassant de loin le score de ses prédécesseurs, dont o3-mini (13%) et o1 (9%), démontrant leurs puissantes capacités de recherche et d'intégration d'informations et leur comportement de recherche quasi humain.
Une libéralisation progressive et un avenir prometteur : Il est actuellement disponible pour les utilisateurs Pro (100 recherches par mois) et sera étendu aux utilisateurs Plus (10 recherches par mois) d'ici un mois, les éditions Team et Enterprise devant suivre. Les applications mobiles et de bureau seront également prises en charge à l'avenir, et il est prévu de se connecter à davantage de sources de données (abonnement et internes) pour une personnalisation plus puissante.

Ces détails sont également dignes d'intérêt :

Plus vous appelez d'outils, plus vous serez précis : Le graphique montre que plus le nombre d'appels d'outils (Max Tool Calls) augmente, plus le taux de réussite de Deep Research au test HLE augmente, ce qui indique une corrélation positive entre son intelligence et sa capacité à utiliser des outils.
Le problème des hallucinations doit encore être amélioré : Malgré les performances impressionnantes de Deep Research, la possibilité d'illusions et de raisonnements erronés subsiste, ce qui constitue un élément clé de l'optimisation ultérieure d'OpenAI.
Combiné à l'opérateur, le potentiel est illimité : Les futurs projets de l'OpenAI visent à combiner la recherche en ligne approfondie avec des opérations dans le monde réel (Opérateur) sont combinés pour obtenir des fonctions corporelles intelligentes plus puissantes qui sont très attendues !

Revue officielle complète de DeepResearch

Aujourd'hui, nous lançons Deep Research dans ChatGPT, une nouvelle fonctionnalité de l'agent qui permet d'effectuer des recherches en plusieurs étapes sur Internet pour des tâches complexes. Il peut faire en quelques dizaines de minutes ce qui prendrait des heures à un humain.

Deep Research est la prochaine intelligence d'OpenAI qui peut travailler pour vous de manière autonome - vous lui donnez un ordre et ChatGPT trouvera, analysera et synthétisera des centaines de sources en ligne pour créer un rapport complet au niveau d'un analyste de recherche. Il est alimenté par une prochaine version du modèle OpenAI o3, optimisé pour la navigation sur le web et l'analyse de données, qui utilise l'inférence pour rechercher, interpréter et analyser la grande quantité de textes, d'images et de PDF sur Internet, en faisant les ajustements nécessaires sur la base des informations qu'il rencontre.

La capacité à synthétiser les connaissances est une condition préalable à la création de nouvelles connaissances. Pour cette raison, Deep Research marque une étape importante vers notre objectif plus large de développement de l'AGI, que nous envisageons depuis longtemps comme génératrice de nouvelles recherches scientifiques.

Raisons pour lesquelles nous réalisons des études approfondies

Deep Research est conçu pour les personnes qui effectuent un travail à forte intensité de connaissances dans des domaines tels que la finance, la science, la politique et l'ingénierie, et qui ont besoin de recherches approfondies, précises et fiables. Elle est également utile aux acheteurs avertis qui souhaitent obtenir des conseils hyperpersonnalisés sur des achats qui nécessitent normalement des recherches approfondies, comme les voitures, les appareils électroménagers et les meubles. Chaque résultat est entièrement documenté, avec des citations claires et des résumés des réflexions, ce qui facilite la référence et la validation des informations. Il est particulièrement efficace pour trouver des informations spécialisées et non intuitives qui nécessitent de parcourir un grand nombre de sites. Deep Research vous fait gagner un temps précieux en vous permettant de vous décharger et d'accélérer les recherches complexes et fastidieuses sur le web à l'aide d'une seule requête.

Deep Research découvre, raisonne et intègre de manière indépendante des informations provenant de l'ensemble du Web. Pour ce faire, il utilise la même approche d'apprentissage par renforcement que l'OpenAI o1 (notre premier modèle d'inférence), formé sur des tâches réelles qui nécessitent l'utilisation d'un navigateur et d'outils Python. Alors que o1 démontre des capacités impressionnantes en matière de codage, de mathématiques et d'autres domaines techniques, de nombreux défis du monde réel requièrent des connaissances approfondies et la collecte d'informations à partir de diverses sources en ligne. La recherche approfondie s'appuie sur ces capacités de raisonnement pour combler cette lacune et permettre aux utilisateurs de s'attaquer au large éventail de problèmes auxquels ils sont confrontés au travail et dans leur vie quotidienne.

Comment utiliser la recherche approfondie

Dans ChatGPT, sélectionnez "Recherche approfondie" dans l'éditeur de messages et entrez votre requête. Dites à ChatGPT ce dont vous avez besoin - qu'il s'agisse d'une analyse concurrentielle des plateformes de streaming ou d'un rapport personnalisé sur les meilleurs vélos de banlieue. Vous pouvez joindre des fichiers ou des feuilles de calcul pour ajouter du contexte à votre question. Une fois la recherche lancée, une barre latérale s'affiche avec un résumé des étapes suivies et des sources utilisées.

Les études approfondies peuvent prendre de 5 à 30 minutes et nécessitent du temps pour approfondir le réseau. Pendant ce temps, vous pouvez partir ou travailler sur d'autres tâches - vous serez averti lorsque l'étude sera terminée. Au cours des prochaines semaines, nous ajouterons à ces rapports des images intégrées, des visualisations de données et d'autres résultats analytiques afin d'apporter plus de clarté et de contexte.

Contrairement à la recherche approfondie, GPT-4o est bien adapté aux dialogues multimodaux en temps réel. Pour lesles domaines à multiples facettes et spécifiques où la profondeur et le détail sont essentielsLes requêtes, les recherches approfondies pour une exploration étendue et la capacité de citer chaque déclaration font la différence entre un résumé rapide et une réponse bien documentée et validée (qui peut être utilisée comme produit de travail).

OpenAI 推出 DeepResearch ，利用o3模型进行深度研究的智能体

L'étude approfondie répond aux questions de manière très détaillée, en fournissant des données pays/territoire côte à côte pour les 10 premiers pays développés et les 10 premiers pays en développement, afin de faciliter les références et les comparaisons. Elle utilise ces informations pour fournir des recommandations détaillées, éclairées et pratiques sur l'entrée sur le marché. Voir l'exemple officiel : https://openai.com/index/introducing-deep-research/

Principe de fonctionnement

Deep Research est formé à l'aide de l'apprentissage par renforcement de bout en bout sur des tâches difficiles de navigation et de raisonnement dans une variété de domaines. Grâce à cette formation, il a appris à planifier et à exécuter des trajectoires en plusieurs étapes pour trouver les données requises, ainsi qu'à revenir en arrière et à réagir aux informations en temps réel si nécessaire. Le modèle est également capable de parcourir les fichiers téléchargés par les utilisateurs, de dessiner et d'itérer des graphiques à l'aide d'outils python, d'intégrer dans ses réponses des graphiques et des images générés à partir de sites web, et de citer des phrases ou des paragraphes spécifiques de ses sources. Grâce à cette formation, il a atteint de nouveaux sommets dans de nombreuses évaluations publiques axées sur des problèmes réels.

Le dernier examen de l'humanité

existent Le dernier examen de l'humanité (ouvre une nouvelle fenêtre)(une évaluation récemment publiée qui teste l'IA sur un large éventail de sujets avec des questions de niveau expert), le modèle basé sur Deep Research a obtenu un nouveau record avec une précision de 26,6%. Le test contient plus de 3 000 questions à choix multiples et à réponses courtes couvrant plus de 100 sujets, allant de la linguistique à la science des fusées, et des classiques à l'écologie. Les améliorations les plus importantes par rapport à l'OpenAI o1 ont été enregistrées en chimie, en sciences humaines et sociales et en mathématiques. Les modèles soutenant la recherche approfondie font preuve d'une approche similaire à celle des humains pour rechercher efficacement des informations spécialisées lorsque c'est nécessaire.

modélisation	Précision (%)
GPT-4o	3.3
Grok-2	3.8
Claude 3.5 Sonnet	4.3
Réflexion des Gémeaux	6.2
OpenAI o1	9.1
ProfondSeek-R1*	9.4
OpenAI o3-mini (moyenne)*	10.5
OpenAI o3-mini (haut)*	13.0
La recherche approfondie de l'OpenAI**	26.6

Le modèle n'est pas multimodal et est évalué sur un sous-ensemble de textes uniquement.
Utilisation des outils Browse + python

GAIA

existent GAIA(ouvre une nouvelle fenêtre) (un test de référence accessible au public pour évaluer l'IA sur des problèmes du monde réel) a atteint un nouveau niveau d'excellence (SOTA) pour les modèles soutenant la recherche approfondie dans les domaines externes de la santé, de l'éducation et de l'environnement. Classement (s'ouvre dans une nouvelle fenêtre) En tête de liste. Contient des questions à trois niveaux de difficulté, et la réussite de ces tâches requiert des capacités de raisonnement, de fluidité multimodale, de navigation sur le web et d'utilisation d'outils.

Exemples de tâches GAIA

Voir l'exemple officiel : https://openai.com/index/introducing-deep-research/

Missions de niveau expert

Lors d'une évaluation interne d'une série de tâches effectuées par des experts, ces derniers ont estimé que les études approfondies avaient permis d'automatiser des heures d'investigations manuelles difficiles.

Taux de réussite et nombre maximum d'appels d'outils

Plus le modèle parcourt et réfléchit à ce qu'il parcourt, plus il est performant, c'est pourquoi il est important de lui laisser le temps de réfléchir.

Exemple d'affectation au niveau de l'expert

Voir l'exemple officiel : https://openai.com/index/introducing-deep-research/

La valeur économique estimée de la tâche est davantage liée au taux de réussite qu'au nombre d'heures consacrées par les humains - ce que le modèle considère comme difficile est différent de ce que les humains considèrent comme chronophage.

limitations

La recherche approfondie a débloqué de nouvelles fonctionnalités importantes, mais elle en est encore à ses débuts et présente des limites. Selon des évaluations internes, il peut parfois produire des faits fantômes ou faire des déductions incorrectes dans les réponses, bien qu'à un niveau bien inférieur à celui des modèles ChatGPT existants. Il peut avoir des difficultés à distinguer les informations faisant autorité des rumeurs et présente actuellement des faiblesses dans l'étalonnage de la confiance, ne parvenant souvent pas à exprimer correctement l'incertitude. Il peut y avoir des erreurs mineures de formatage dans les rapports et les citations au moment de la publication, et les tâches peuvent prendre plus de temps à initier. Nous nous attendons à ce que tous ces problèmes s'améliorent rapidement avec une utilisation accrue et au fil du temps.

entretiens

La recherche approfondie dans le domaine du ChatGPT nécessite actuellement une puissance de calcul très élevée. Plus la requête de recherche est longue, plus les calculs d'inférence sont importants. Nous commencerons aujourd'hui par le calcul nécessaire pour une requête ciblant Utilisateurs professionnelsLa version optimisée commence avec un maximum de 100 requêtes par mois.Utilisateurs Plus et TeamL'accès viendra ensuite, suivi par les utilisateurs de l'entreprise. Nous travaillons toujours à la mise en place d'un accès pour les utilisateurs du Royaume-Uni, de la Suisse et de l'EEE.

Des limites de taux plus élevées seront bientôt disponibles pour tous les abonnés payants lorsque nous publierons une version plus rapide et plus rentable de l'étude approfondie, alimentée par des modèles plus petits qui fournissent toujours des résultats de haute qualité.

Au cours des semaines et des mois à venir, nous travaillerons sur notre infrastructure technique, nous surveillerons de près les versions actuelles et nous effectuerons des tests plus rigoureux. Cette démarche est conforme à notre principe de déploiement itératif. Si tous les contrôles de sécurité continuent de répondre à nos critères de publication, nous prévoyons de publier une étude approfondie à l'intention des utilisateurs de Plus dans un mois environ.

plan de suivi

Deep Research est disponible dès aujourd'hui sur le réseau ChatGPT et sera étendu aux applications mobiles et de bureau d'ici un mois. Actuellement, Deep Research a accès au web ouvert et à tous les fichiers téléchargés. À l'avenir, vous pourrez vous connecter à des sources de données plus spécialisées - en étendant leur accès à des ressources internes ou sur abonnement - afin de rendre leurs résultats plus puissants et personnalisés.

À l'avenir, nous envisageons d'intégrer l'expérience de l'agent dans ChatGPT afin d'effectuer une recherche et un développement asynchrones et authentiques. La combinaison de la recherche approfondie, où des enquêtes en ligne asynchrones peuvent être réalisées, et de l'opérateur, où des actions réelles peuvent être entreprises, permettra à ChatGPT d'effectuer des tâches de plus en plus complexes pour vous.