Grok 4 - o último grande modelo da xAI de Musk

Recursos mais recentes de IAPublicado há 2 meses Círculo de compartilhamento de IA

17.3K 00

O que é o Grok 4?

Grok 4 é o mais novo grande modelo de IA da xAI, o Grok 4 oferece um aumento de 10 vezes no poder de raciocínio em comparação com seu antecessor. O Grok 4 tem recursos de raciocínio superiores, com pontuações quase perfeitas em testes difíceis, como o SAT e o GRE, e supera outros modelos de ponta em vários benchmarks. O Grok 4 oferece suporte a recursos multimodais, compreende conceitos subjetivos, gera códigos e visualizações e apresenta melhorias significativas na interação por voz. O Grok 4 está disponível em duas versões: Grok 4 Heavy, uma versão com um único agente, e Grok 4 Heavy, uma versão com vários agentes, que oferece suporte a quatro agentes. O Grok 4 está dividido em duas versões: o Grok 4 é uma versão com um único agente e o Grok 4 Heavy é uma versão com vários agentes, que suporta quatro agentes trabalhando ao mesmo tempo e uma janela de contexto de até 256 mil tokens.

Principais recursos do Grok 4

Raciocínio em nível científicoTreinamento no supercomputador Colossus da xAI com recursos de resolução de problemas acadêmicos em nível de doutorado.
Otimização de conhecimento profundoConhecimento: Fornecer conhecimento mais preciso e confiável, identificando e corrigindo informações incorretas, com o objetivo de reescrever a base de conhecimento humano.
suporte multimodalSuporte a entradas de texto e imagem e, no futuro, será estendido para vídeo.
Funções avançadas de vozGrok 4 Voice tem uma voz natural e real com latência de ponta a ponta reduzida pela metade para uma experiência de conversação mais suave.
Modelo de codificação profissionalO Grok 4 Code é otimizado para programação, suporta várias linguagens, grava, depura e interpreta códigos com eficiência e pode ser incorporado a um IDE para modificar códigos em tempo real.
acesso à web em tempo realEquipado com a ferramenta DeepSearch, que rastreia as informações mais recentes em tempo real de fontes da Web, como a plataforma X.
Alfabetização cultural na InternetÉ o assistente de IA mais "experiente na Web" do mundo: ele entende os "terriers", as gírias e o humor da Internet com alta precisão.
Chamadas de função e saída estruturadaSuporte a chamadas de função para acionar ferramentas externas que retornam dados estruturados (por exemplo, JSON) para facilitar a análise pelo aplicativo.
Suporte à APIDisponível por meio da API xAI, com suporte a chamadas de função, respostas no modo JSON etc., e compatível com OpenAI e Anthropic.

Endereço do site oficial do Grok 4

Endereço do site oficial:: https://x.ai/grok

Como usar o Grok 4

Diretamente pela plataforma X
- Assine o X Premium+US$ 16 por mês para acessar os recursos de conversação do Grok 4 diretamente na Plataforma X (antigo Twitter), com suporte para acesso à Web em tempo real e análise de imagens.
- Privilégios de conta certificadosOs usuários certificados Blue V podem ser certificados rapidamente por meio do site oficial para obter a qualificação de teste com prioridade.
Por meio do aplicativo SuperGrokInterface de aplicativo autônomo com suporte para interação por voz, upload de arquivos (PDF/Excel, etc.) e pesquisas detalhadas para usuários não técnicos.

Integração da API do desenvolvedor

Registro e aquisição de chaves
- Visite o Portal do desenvolvedor xAI para registrar uma conta.
- Crie chaves de API, defina permissões e limites de taxa.
cota livreNovos usuários recebem um crédito de API de US$ 150 no primeiro mês (requer participação em um programa de compartilhamento de dados).

Exemplo rápido de código

Python (compatível com o SDK da OpenAI)::

from openai import OpenAI
client = OpenAI(
    base_url="https://api.x.ai/v1",
    api_key="YOUR_GROK_API_KEY"
)
response = client.chat.completions.create(
    model="grok-4-beta",
    messages=[{"role": "user", "content": "用Python写个快速排序"}]
)
print(response.choices[0].message.content)

Solicitação cURL::

curl https://api.x.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_GROK_API_KEY" \
  -d '{"model":"grok-4-beta","messages":[{"role":"user","content":"分析X平台AI讨论热点"}]}'

Principais benefícios do Grok 4

Desempenho interdisciplinar em nível de doutoradoNível de doutorado: superior ao nível de doutorado em todas as matérias principais, como matemática (AIME 25 de 25), física, química e ciências humanas.
A mais recente inovação em exames humanosNo teste de referência do HLE, que abrangeu 2.500 quebra-cabeças de nível de doutorado, o Grok 4 Heavy (modo multiagente) se tornou o primeiro modelo do mundo a passar da metade, com uma taxa de resposta de 50,71 TP3T.
Liderança do teste AGIPontuação recorde de 15,81 TP3T no teste ArcAGI v2, que está próximo do padrão geral de IA, duas vezes mais do que o segundo colocado (Claude Opus).
Grok 4 Colaboração pesada com vários agentesSuporte ao raciocínio paralelo de 4 inteligências e melhora exponencialmente a eficiência da solução de problemas complexos por meio de validação cruzada e otimização de esquemas.
Otimização dinâmica em tempo realA previsão de probabilidade do campeonato da MLB foi concluída em apenas 4,5 minutos na demonstração, integrando recuperação de informações, modelagem de dados e computação probabilística.
esmagamento aritméticoCom base no supercomputador Colossus (cluster de 200.000 GPUs), o cálculo do treinamento é 100 vezes maior do que o do Grok 3, e a velocidade de resposta é aumentada em mais de 50%.
Atraso na geração do primeiro token: 10 segundos em um contexto de 32 mil tokens, 15% mais rápido que o Grok 3.
modelo de codificação especialGrok 4 Code suporta a incorporação com um clique em IDEs (por exemplo, Cursor), e a precisão e a eficiência da geração de código excedem as do GPT-4 Code Interpreter.
Automação de APISuporte a chamadas de função, saída estruturada JSON e pode acionar automaticamente APIs externas, o que é adequado para cenários de alta precisão, como finanças, direito e saúde.
Vantagem de custoO custo de entrada é de US$ 3 por milhão de tokens e de saída é de US$ 15 por milhão, apenas 1/3 do custo do Claude 3 Opus.

Teste de modelo para o Grok 4

teste oficial::
- O último exame da humanidadeO Grok 4 Heavy obtém 44,41 TP3T com a ferramenta e pode ser aumentado para 50,71 TP3T com otimização adicional.
- AIME25 (competição de matemática)O Grok 4 Heavy obteve uma pontuação perfeita de 100%, superando todos os outros modelos.
- GPQA (Perguntas e respostas sobre proficiência de pós-graduação)Grok 4 Heavy obteve 88,91 TP3T, à frente do Gêmeos 2.5 Pro (86.4%) e Claude 4 Opus (79,6%).
- HMMT25 (Competição de Matemática do Ensino Médio)Grok 4 Heavy obteve 96,71 TP3T, bem à frente do Gemini 2.5 Pro (82,51 TP3T).
- USAMO25 (Olimpíada de Matemática dos Estados Unidos)Grok 4 Heavy obteve 61,91 TP3T, significativamente à frente do Gemini DeepThink (49,41 TP3T) e do Gemini 2.5 Pro (34,51 TP3T).
- ARC-AGI (Raciocínio Abstrato)Grok 4 marcou 15,91 TP3T, quase o dobro do SOTA comercial anterior.
- Vending-Bench (simulação de negócios)O Grok 4 obteve $4694, bem à frente do Claude Opus 4 ($2077) e do Human Player ($844).
Avaliação de terceiros(Teste de Análise Artificial, uma plataforma para avaliar o desempenho de modelos grandes):
- Índice de Inteligência ArtificialGrok 4 obteve 73 pontos, à frente de OpenAI o3 (70), Google Gemini 2.5 Pro (70), Anthropic Claude 4 Opus (64) e DeepSeek R1 0528 (68 pontos).
- Índices codificados e matemáticosGrok 4, ambos classificados em primeiro lugar.
- Pontuação do GPQA DiamondRecorde de 88%, superando os 84% do Gemini 2.5 Pro.
- Pontuação do último exame da humanidadeRecorde de 24%, superando os 21% do Gemini 2.5 Pro.
- tempoGrok 4 a 75 tokens/seg, não tão bom quanto o o3 (188 tokens/seg) e o Gemini 2.5 Pro (142 tokens/seg), mas melhor que o Claude 4 Opus Thinking (66 tokens/seg).

Preços de produtos para Grok 4

Planos de assinatura pagos::
- SuperGrokO custo do programa é de US$ 300 por ano e US$ 30 por mês.
- SuperGrok HeavyO custo do programa é de US$ 3.000 por ano e US$ 300 por mês.
Preços de chamadas de API::
- importação: $3 / milhão de tokens.
- exportações: US$ 15 / milhão de tokens.

Para quem é o Grok 4

Principais desenvolvedoresEngenheiros de pilha completa, especialistas em algoritmos e mantenedores de projetos de código aberto que precisam lidar com bases de código de vários milhões ou criar sistemas complexos.
Trabalhadores de IA/pesquisa: professores universitários, pesquisadores de laboratório e cientistas de dados para descobertas acadêmicas, simulações experimentais ou análises interdisciplinares.
empreendedor de tecnologiaCTOs de startups, hackers independentes, precisam de 48 horas para validar um produto de 0 a 1 ou automatizar operações.
Equipe quantitativa financeiraFundos de hedge, organizações de comércio de alta frequência que dependem de dados em tempo real e raciocínio em nível de doutorado para desenvolver estratégias.
Instituições de nível nacional/empresarialP&D pesado nos setores aeroespacial, de energia, farmacêutico etc., exigindo implantações privadas para resolver problemas de engenharia ultracomplexos.