Aprendizagem pessoal com IA
e orientação prática

Extra: o1-mini foi totalmente aberto para a experiência de conta gratuita do ChatGPT!

-1

 


A família de modelos o1 é composta por modelos avançados de raciocínio de processos, dos quais o modelo o1-mini, de tamanho reduzido, tem o potencial de ser mais forte que o o1-preview em termos de raciocínio lógico, embora a capacidade de conhecimento do mundo tenha sido reduzida.

Atualmente, a o1-mini está aberta apenas a algumas contas gratuitas para experiência de visualização. Se sua conta está oficialmente aberta, o modelo o1-mini pode ser verificado com as seguintes perguntas de decodificação:

oyfjdnisdr rtqwainr acxz mynzbhhx -> Pense passo a passo

Use o exemplo acima para decodificar.

oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz

A pergunta de validação acima vem de OpenAI o1 Aprendizagem da capacidade de raciocínio para modelos de idiomas grandesPara obter mais informações sobre o modelo o1-mini, consulte o artigo a seguir. Introdução ao macromodelo OpenAI o1-mini.

 

Se você não tiver uma conta gratuita do ChatGPT ou não tiver acesso à experiência do o1-mini, poderá visitar o site:Site espelho do ChatGPT (acesso doméstico aos modelos da série GPT4) Experiência.

 

 

Algumas questões de interesse sobre o modelo o1 da OpenAI

 

Nomes de modelos e padrões de inferência

  • OpenAI o1 representa um novo nível de capacidade de IA e o contador é redefinido para 1
  • "Preview" indica que esta é uma versão inicial do modelo completo.
  • "Mini" indica que essa é uma versão menor do modelo o1, otimizada para velocidade
  • o - em nome da OpenAI
  • o1 não é um "sistema", mas um modelo que treina os alunos a desenvolver a cadeia de raciocínio antes de fornecer a resposta final.
  • O ícone do o1 representa simbolicamente um alienígena com habilidades extraordinárias

 

o1 Tamanho e desempenho do modelo

  • O o1-mini é menor e mais rápido que o o1-preview, portanto, estará disponível para usuários gratuitos no futuro
  • O o1-preview é um ponto de verificação inicial no modelo o1, nem muito grande nem muito pequeno
  • o1-mini tem melhor desempenho em tarefas STEM, mas é limitado no conhecimento do mundo
  • O o1-mini tem um bom desempenho em algumas tarefas, especialmente em tarefas relacionadas a códigos, melhor do que o o1-preview
  • Entradas para o1 Token é calculado da mesma forma que o GPT-4o, usando o mesmo Tokenizer
  • Em comparação com o o1-preview, o o1-mini pode explorar mais cadeias de pensamento

 

Contextos de token de entrada e recursos de modelo

  • Em breve, os modelos o1 suportarão contextos de entrada maiores
  • O modelo o1 pode lidar com tarefas mais longas e abertas, com menos necessidade de dividir as entradas como no GPT-4o
  • o1 pode gerar longas cadeias de raciocínio antes de fornecer uma resposta, diferentemente dos modelos anteriores
  • No momento, não é possível pausar a inferência durante a inferência de CoT para adicionar mais contexto, mas esse recurso está sendo explorado em modelos futuros

 

Ferramentas, recursos e recursos futuros

  • O o1-preview não usa ferramentas no momento, mas planeja oferecer suporte a chamadas de função, intérpretes de código e recursos de navegação
  • Suporte a ferramentas, saída estruturada e dicas de sistema serão adicionados em atualizações futuras
  • Os usuários poderão eventualmente controlar o tempo de reflexão e os limites de token
  • Há planos em andamento para dar suporte ao streaming e considerar a possibilidade de refletir o progresso da inferência na API
  • Os recursos multimodais do o1 foram incorporados, com o objetivo de alcançar o desempenho de última geração em tarefas como o MMMU

 

Raciocínio CoT (cadeia de raciocínio)

  • o1 Geração de cadeias de inferência ocultas durante os processos de inferência
  • Não há planos de expor o token CoT aos usuários da API ou do ChatGPT
  • O CoT Token será resumido, mas não há garantia de que ele será totalmente consistente com o processo de raciocínio real
  • As instruções no prompt podem influenciar a maneira como o modelo pensa sobre o problema
  • A aprendizagem por reforço (RL) foi usada para aprimorar a capacidade de CoT de o1, enquanto o GPT-4o não conseguiu atingir seu desempenho de CoT somente por meio de dicas
  • Embora a etapa de raciocínio possa parecer mais lenta, na realidade a geração de respostas costuma ser mais rápida, pois resume o processo de raciocínio

 

API e restrições de uso

  • O o1-mini tem um limite semanal de 50 prompts para usuários do ChatGPT Plus
  • Todas as dicas são contadas da mesma forma no ChatGPT
  • Mais níveis de acesso à API e limites mais altos a serem implementados ao longo do tempo
  • O armazenamento em cache de dicas em APIs é uma demanda crescente, mas ainda não há um cronograma

 

Precificação, ajuste fino e expansão

  • o1 Espera-se que o preço do modelo siga uma tendência de queda a cada 1 ou 2 anos
  • Preços de API de volume a serem suportados à medida que as restrições aumentam
  • O ajuste fino está em andamento, mas o cronograma ainda não foi determinado
  • o1 Expansão limitada por gargalos em talentos de pesquisa e engenharia
  • Um novo paradigma estendido para a computação de inferência pode levar a aprimoramentos significativos nas futuras gerações de modelos
  • As extensões reversas não são significativas no momento, mas a o1-preview tem um desempenho apenas um pouco melhor (ou até um pouco pior) do que a GPT-4o em solicitações de escrita individuais

 

Desenvolvimento de modelos e percepções de pesquisa

  • o1 Habilidades de raciocínio por meio de treinamento de aprendizado intensivo
  • O modelo demonstra pensamento criativo e se destaca em tarefas laterais, como poesia
  • O raciocínio filosófico e as habilidades de raciocínio abrangente de o1 são impressionantes, como decifrar códigos
  • O o1 foi usado pelos pesquisadores para criar um bot do GitHub que envia pings aos CODEOWNERS certos para revisões de código
  • Nos testes internos, a o1 fez perguntas difíceis a si mesma para avaliar sua capacidade de
  • Um amplo conhecimento do domínio mundial está sendo adicionado e será aprimorado em versões futuras
  • Dados atualizados planejados para serem adicionados ao o1-mini (atualmente em outubro de 2023)

 

Dicas Dicas e práticas recomendadas

  • o1 Beneficie-se do fornecimento de prompts para casos extremos ou estilos de raciocínio
  • Os modelos o1 são mais receptivos a pistas de raciocínio em pistas do que os modelos anteriores
  • O fornecimento de contexto relevante no Retrieval Augmented Generation (RAG) melhora o desempenho; fragmentos irrelevantes podem enfraquecer a inferência

 

Feedback geral e aprimoramentos futuros

  • o1-preview é menos restritivo por estar em uma fase inicial de testes, mas aumentará o número de
  • A latência e os tempos de inferência estão sendo ativamente aprimorados

 

Recursos significativos de modelagem

  • o1 pode pensar em questões filosóficas como "O que é a vida?"
  • Os pesquisadores descobriram que o o1 é excelente em lidar com tarefas complexas e raciocínio extenso a partir de instruções limitadas
  • As habilidades de raciocínio criativo de o1, como avaliar sua capacidade fazendo suas próprias perguntas, demonstram um alto nível de habilidades de resolução de problemas
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Extra: o1-mini foi totalmente aberto para a experiência de conta gratuita do ChatGPT!

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil