OpenAI lança DeepResearch, Intelligentsia para pesquisa profunda usando modelos o3

🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Você está cansado de pesquisar grandes quantidades de informações e ainda ter dificuldades para encontrar as respostas de que precisa? Deseja um assistente inteligente que possa fazer pesquisas aprofundadas para você como um analista profissional? A OpenAI tem o orgulho de anunciar o lançamento do OpenAI! ChatGPT Um recurso totalmente novo do -Pesquisa profunda! Ela mudará completamente a forma como você obtém informações, permitindo que você conclua tarefas de pesquisa complexas que, de outra forma, levariam horas para serem concluídas em apenas alguns minutos. Este artigo lhe trará uma compreensão aprofundada das funções poderosas da pesquisa aprofundada, dos cenários de aplicação, dos princípios de trabalho e da direção futura do desenvolvimento e, juntos, testemunharemos como a IA capacita o trabalho de conhecimento e abre uma nova era de pesquisa inteligente!

Essa é uma inteligência que usa o raciocínio para sintetizar grandes quantidades de informações on-line e realizar tarefas de pesquisa em várias etapas para você, semelhante à Perplexidade responder cantando Gêmeos O recém-lançado "Deep Research" da OpenAI usa seu poderoso modelo o3 para reunir e analisar grandes quantidades de informações por meio de pesquisas na Web e, por fim, gera um relatório profissional detalhado com citações. Essa função atraiu ampla atenção desde seu lançamento e foi aclamada como um assistente de IA "superpoderoso", anunciando a chegada de uma nova era de pesquisa assistida por IA.

Ele está disponível para usuários Pro hoje e, em seguida, estará disponível para usuários Plus e Team.

Em poucas palavras:O "Deep Research" conduz autonomamente investigações de rede em várias etapas, concluindo tarefas de pesquisa complexas em 5 a 30 minutos, que normalmente levariam horas para serem concluídas por um pesquisador humano, e apresentando os resultados ao usuário em um relatório de alta qualidade.

Leitura de referência:Google lança Deep ResearcheOpen Deep Research: geração de pesquisa de IA com base em conteúdo de pesquisa na WebeSTORM: pesquise dados da Web com base no tópico, gere documentos com citações, relatórios de documentos longos

Quão boa é a "pesquisa profunda"? Vamos descobrir:

Potente e incrivelmente eficiente: Diga adeus ao hábito de ficar acordado a noite toda em busca de informações! O "Deep Research" leva a pesquisa a um nível totalmente novo de eficiência, concluindo estudos complexos que tradicionalmente levam horas em 5 a 30 minutos, com a capacidade de se aprofundar o quanto for necessário para fornecer análises de nível especializado.
Os resultados são confiáveis e bem documentados: Não se preocupe mais com a fonte de suas informações! Todas as conclusões são acompanhadas de citações detalhadas, até o parágrafo relevante da página da Web ou PDF original, facilitando o rastreamento e a verificação da precisão das informações pelos usuários e tornando sua pesquisa mais convincente.
Ampla gama de aplicações, flexível e fácil de usar: Se precisar realizar análises competitivas, pesquisas de mercado, compras de produtos ou pesquisas acadêmicas, a "Deep Research" pode ser o seu braço direito. Basta selecionar "Deep Research" na interface do ChatGPT e inserir uma consulta para iniciar sua pesquisa. Suporte para upload de arquivos (por exemplo, PDF) para fornecer um contexto mais específico e visualização em tempo real do progresso da pesquisa e das fontes citadas na barra lateral.
Tecnologicamente avançado e com excelente desempenho: Com base no aprendizado por reforço de ponta a ponta, o Deep Research é capaz de executar tarefas de navegação e raciocínio em várias etapas. Ele suporta a leitura do conteúdo do site, o processamento de dados, a geração de gráficos e a citação do texto de origem para apoiar argumentos. Em um difícil teste de benchmark chamado "Humanity's Last Exam" (HLE), o Deep Research obteve uma pontuação de 26,6%, superando em muito a pontuação de seus antecessores, incluindo o3-mini (13%) e o1 (9%), demonstrando seus poderosos recursos de recuperação e integração de informações e seu comportamento de pesquisa quase humano.
Liberalização gradual e um futuro promissor: No momento, ele está disponível para usuários Pro (100 pesquisas por mês) e será estendido para usuários Plus (10 pesquisas por mês) dentro de um mês, com as edições Team e Enterprise em seguida. Também haverá suporte para aplicativos móveis/desktop no futuro e planos de conexão com mais fontes de dados (tanto de assinatura quanto internas) para uma personalização mais avançada.

Esses detalhes são igualmente dignos de nota:

Quanto mais ferramentas você chamar, mais preciso será: O gráfico mostra que, à medida que o número de chamadas de ferramentas (Max Tool Calls) aumenta, a taxa de aprovação do Deep Research no teste HLE aumenta, indicando uma correlação positiva entre sua inteligência e sua capacidade de utilizar ferramentas.
O problema das alucinações ainda precisa ser melhorado: Apesar do desempenho impressionante da Deep Research, ainda há a possibilidade de ilusões e raciocínio falho, que é o foco principal das otimizações subsequentes da OpenAI.
Combinado com a Operator, o potencial é ilimitado: Os planos futuros da OpenAI para combinar pesquisa on-line profunda com operações no mundo real (Operador) são combinados para obter funções corporais inteligentes mais poderosas que são altamente esperadas!

Análise oficial completa do DeepResearch

Hoje, estamos lançando o Deep Research no ChatGPT, um novo recurso de agente que permite a pesquisa em várias etapas na Internet para tarefas complexas. Ele pode fazer em dezenas de minutos o que um ser humano levaria horas para fazer.

O Deep Research é a próxima inteligência da OpenAI que pode trabalhar para você por conta própria - você dá a ele um prompt e o ChatGPT encontrará, analisará e sintetizará centenas de fontes on-line para criar um relatório abrangente no nível de analista de pesquisa. Ele é alimentado por uma versão futura do modelo OpenAI o3, otimizado para navegação na Web e análise de dados, que usa inferência para pesquisar, interpretar e analisar a grande quantidade de textos, imagens e PDFs na Internet, fazendo os ajustes necessários com base nas informações encontradas.

A capacidade de sintetizar o conhecimento é um pré-requisito para a criação de novos conhecimentos. Por esse motivo, a Deep Research representa um passo importante em direção à nossa meta mais ampla de desenvolver AGI, que há muito tempo imaginamos gerar novas pesquisas científicas.

Razões pelas quais criamos estudos aprofundados

O Deep Research foi desenvolvido para pessoas que trabalham com conhecimento intensivo em áreas como finanças, ciência, política e engenharia e precisam de pesquisas completas, precisas e confiáveis. Também é útil para compradores experientes que desejam conselhos hiperpersonalizados sobre compras que normalmente exigiriam uma pesquisa cuidadosa, como carros, eletrodomésticos e móveis. Cada resultado é totalmente documentado com citações e resumos claros de seus pensamentos, facilitando a referência e a validação das informações. É particularmente eficaz para encontrar informações de nicho e não intuitivas que exigem a navegação em um grande número de sites. O Deep Research libera um tempo valioso, permitindo que você descarregue e acelere pesquisas complexas e demoradas na Web com uma única consulta.

O Deep Research descobre, raciocina e integra de forma independente os insights de toda a Web. Para isso, ele usa a mesma abordagem de aprendizagem por reforço que o OpenAI o1 (nosso primeiro modelo de inferência), treinado em tarefas do mundo real que exigem o uso de um navegador e ferramentas Python. Embora o o1 demonstre recursos impressionantes em codificação, matemática e outras áreas técnicas, muitos desafios do mundo real exigem um extenso histórico e coleta de informações de diversas fontes on-line. A pesquisa aprofundada se baseia nesses recursos de raciocínio para preencher essa lacuna e permitir que eles resolvam a grande variedade de problemas que as pessoas enfrentam no trabalho e em suas vidas diárias.

Como usar a pesquisa aprofundada

No ChatGPT, selecione "Deep Research" no editor de mensagens e digite sua consulta. Diga ao ChatGPT o que você precisa - seja uma análise competitiva de plataformas de streaming ou um relatório personalizado sobre as melhores bicicletas para deslocamento. Você pode anexar arquivos ou planilhas para adicionar contexto à sua pergunta. Quando a pesquisa estiver pronta e funcionando, será exibida uma barra lateral com um resumo das etapas realizadas e das fontes utilizadas.

Os estudos aprofundados podem levar de 5 a 30 minutos para serem concluídos e exigem tempo para se aprofundar na rede. Nesse meio tempo, você pode sair ou trabalhar em outras tarefas - você será notificado quando o estudo for concluído. Nas próximas semanas, também adicionaremos imagens incorporadas, visualizações de dados e outros resultados analíticos a esses relatórios para proporcionar mais clareza e contexto.

Em contraste com a pesquisa profunda, o GPT-4o é adequado para diálogos multimodais em tempo real. Paraáreas multifacetadas e de domínio específico em que a profundidade e os detalhes são essenciaisConsultas, pesquisas aprofundadas para exploração extensiva e a capacidade de citar cada declaração são a diferença entre um resumo rápido e uma resposta bem documentada e validada (que pode ser usada como um produto de trabalho).

A OpenAI lança o DeepResearch, um corpo inteligente para pesquisas profundas-1

O estudo aprofundado responde às solicitações de forma altamente detalhada, fornecendo dados de país/território lado a lado para os 10 principais países desenvolvidos e os 10 principais países em desenvolvimento para fácil referência e comparação. Ele usa essas informações para fornecer recomendações detalhadas, informadas e práticas de entrada no mercado. Veja o exemplo oficial: https://openai.com/index/introducing-deep-research/

Princípio de funcionamento

O Deep Research é treinado usando o aprendizado por reforço de ponta a ponta em tarefas difíceis de navegação e raciocínio em uma variedade de domínios. Com esse treinamento, ele aprendeu a planejar e executar trajetórias de várias etapas para encontrar os dados necessários, além de voltar atrás e reagir a informações em tempo real quando necessário. O modelo também é capaz de procurar arquivos carregados pelos usuários, desenhar e iterar gráficos usando ferramentas python, incorporar gráficos e imagens gerados de sites em suas respostas e citar frases ou parágrafos específicos de suas fontes. Como resultado desse treinamento, ele alcançou novos patamares em muitas avaliações públicas focadas em problemas do mundo real.

O último exame da humanidade

existir O último exame da humanidade (abre em uma nova janela)(uma avaliação lançada recentemente que testa a IA em uma ampla gama de tópicos com perguntas de nível especializado), o modelo habilitado pela Deep Research obteve uma nova pontuação máxima com uma precisão de 26,6%. O teste contém mais de 3.000 perguntas de múltipla escolha e de resposta curta que abrangem mais de 100 tópicos, desde linguística até ciência de foguetes e de clássicos a ecologia. As maiores melhorias em relação ao OpenAI o1 ocorreram em química, ciências humanas e sociais e matemática. Os modelos de apoio à pesquisa profunda demonstram uma abordagem semelhante à humana para buscar informações especializadas de forma eficaz quando necessário.

modelagem	Precisão (%)
GPT-4o	3.3
Grok-2	3.8
Claude 3.5 Soneto	4.3
Pensamento de Gêmeos	6.2
OpenAI o1	9.1
DeepSeek-R1*	9.4
OpenAI o3-mini (médio)*	10.5
OpenAI o3-mini (high)*	13.0
Pesquisa profunda da OpenAI**	26.6

O modelo não é multimodal e é avaliado em um subconjunto somente de texto.
Usando a ferramenta browse + python

GAIA

existir GAIA(abre em uma nova janela) (um benchmark disponível publicamente para avaliar a IA em problemas do mundo real) atingiu um novo nível de estado da arte (SOTA) para modelos de suporte à pesquisa profunda em ambientes externos Tabela de classificação(abre em uma nova janela) No topo da lista. Contém perguntas em três níveis de dificuldade, e a conclusão bem-sucedida dessas tarefas exige habilidades que incluem raciocínio, fluência multimodal, navegação na Web e proficiência no uso de ferramentas.

A OpenAI lança o DeepResearch, um corpo inteligente para pesquisas profundas-1

Exemplos de tarefas GAIA

A OpenAI lança o DeepResearch, um corpo inteligente para pesquisas profundas-1

Veja o exemplo oficial: https://openai.com/index/introducing-deep-research/

Missões em nível de especialista

Em uma avaliação interna de uma série de tarefas de nível de especialista de domínio, os especialistas de domínio classificaram os estudos aprofundados como tendo automatizado horas de investigações manuais difíceis.

Taxa de aprovação e número máximo de chamadas de ferramentas

A OpenAI lança o DeepResearch, um corpo inteligente para pesquisas profundas-1

Quanto mais o modelo escaneia e pensa sobre o que escaneia, melhor é seu desempenho, e é por isso que é importante dar a ele tempo para pensar.

Exemplo de uma atribuição de nível de especialista

A OpenAI lança o DeepResearch, um corpo inteligente para pesquisas profundas-1

Veja o exemplo oficial: https://openai.com/index/introducing-deep-research/

A OpenAI lança o DeepResearch, um corpo inteligente para pesquisas profundas-1

O valor econômico estimado da tarefa está mais correlacionado com a taxa de aprovação do que com o número de horas gastas por humanos - o que o modelo considera difícil é diferente do que os humanos consideram demorado.

limitações

O Deep Research desbloqueou novos recursos importantes, mas ainda está em seus estágios iniciais e tem limitações. De acordo com avaliações internas, às vezes ela pode produzir fatos fantasmas ou fazer inferências incorretas nas respostas, embora em um nível muito mais baixo do que os modelos existentes do ChatGPT. Ele pode ter dificuldade em distinguir entre informações confiáveis e rumores e, atualmente, apresenta deficiências na calibração da confiança, muitas vezes não conseguindo transmitir com precisão a incerteza. Pode haver pequenos erros de formatação em relatórios e citações no momento da publicação, e as tarefas podem demorar mais para serem iniciadas. Esperamos que todos esses problemas melhorem rapidamente com o aumento do uso e com o passar do tempo.

entrevistas

Atualmente, a pesquisa profunda no ChatGPT exige um poder computacional muito alto. Quanto mais demorada for a consulta de pesquisa, mais cálculos de inferência serão necessários. Começaremos hoje com a computação necessária para uma consulta que visa Usuários profissionaisA versão otimizada começa com até 100 consultas por mês.Usuários Plus e TeamO acesso virá em seguida, seguido pelos usuários Enterprise. Ainda estamos trabalhando para fornecer acesso a usuários no Reino Unido, na Suíça e no EEE.

Em breve, os limites de taxas mais altas estarão disponíveis para todos os assinantes pagos quando lançarmos uma versão mais rápida e econômica do estudo aprofundado, com modelos menores que ainda oferecem resultados de alta qualidade.

Nas próximas semanas e meses, estaremos trabalhando em nossa infraestrutura técnica, monitorando de perto as versões atuais e realizando testes mais rigorosos. Isso é consistente com nosso princípio de implementação iterativa. Se todas as verificações de segurança continuarem a atender aos nossos critérios de lançamento, esperamos lançar um estudo aprofundado para os usuários do Plus em cerca de um mês.

plano de acompanhamento

O Deep Research está disponível hoje na rede ChatGPT e será implementado em aplicativos móveis e de desktop dentro de um mês. Atualmente, o Deep Research tem acesso à Web aberta e a todos os arquivos carregados. No futuro, você poderá se conectar a fontes de dados mais especializadas - ampliando o acesso a recursos internos ou baseados em assinatura - para tornar seus resultados mais avançados e personalizados.

No futuro, pretendemos reunir a experiência do Agente no ChatGPT para realizar pesquisa e desenvolvimento autênticos e assíncronos. A combinação de Deep Research, onde pesquisas on-line assíncronas podem ser realizadas, e Operator, onde ações reais podem ser tomadas, permitirá que o ChatGPT realize tarefas cada vez mais complexas para você.