Grok 4 - le dernier grand modèle de l'IAO de Musk

Dernières ressources sur l'IAPosté il y a 2 mois Cercle de partage de l'IA

17.5K 00

Qu'est-ce que Grok 4 ?

Grok 4 est le nouveau modèle d'IA de xAI, Grok 4 offre une puissance de raisonnement 10 fois supérieure à celle de son prédécesseur. Grok 4 possède des capacités de raisonnement supérieures, avec des scores presque parfaits à des tests difficiles tels que le SAT et le GRE, et surpasse d'autres modèles de pointe dans un certain nombre de tests de référence. Grok 4 prend en charge des capacités multimodales, comprend des concepts subjectifs, génère du code et des visualisations, et présente des améliorations significatives dans l'interaction vocale. Grok 4 est disponible en deux versions, Grok 4 Heavy, une version à agent unique, et Grok 4 Heavy, une version à agents multiples, qui prend en charge quatre agents. Grok 4 est divisé en deux versions, Grok 4 est une version mono-agent et Grok 4 Heavy est une version multi-agent, qui prend en charge quatre agents travaillant en même temps et une fenêtre contextuelle pouvant contenir jusqu'à 256k tokens.

Principales caractéristiques de Grok 4

Raisonnement au niveau scientifiqueLes candidats sont formés sur le supercalculateur Colossus de xAI, avec des capacités de résolution de problèmes académiques du niveau d'un doctorat.
Optimisation des connaissances approfondies: Fournir des connaissances plus précises et plus fiables en identifiant et en corrigeant les informations erronées, dans le but de réécrire la base de connaissances humaine.
soutien multimodalLe système est compatible avec les entrées de texte et d'images et sera étendu à la vidéo à l'avenir.
Fonctions vocales avancéesLe Grok 4 Voice offre une voix naturelle et réaliste, avec une latence de bout en bout réduite de moitié pour une expérience de conversation plus fluide.
Modèle de codage professionnelGrok 4 Code est optimisé pour la programmation, supporte plusieurs langages, écrit, débogue et interprète efficacement le code, et peut être intégré dans un IDE pour modifier le code en temps réel.
accès web en temps réelLe site Web de la Commission européenne est équipé de l'outil DeepSearch, qui recherche en temps réel les informations les plus récentes dans des sources Web telles que la plateforme X.
Alphabétisation culturelle sur InternetIl s'agit de l'assistant d'IA le plus compétent au monde sur le web : il comprend les "terriers", l'argot et l'humour d'Internet avec une grande précision.
Appels de fonctions et sorties structuréesLe système de gestion de la qualité : il prend en charge les appels de fonction pour déclencher des outils externes qui renvoient des données structurées (par exemple, JSON) pour faciliter l'analyse par l'application.
Support APILes données sont disponibles via l'API xAI, qui prend en charge les appels de fonction, les réponses en mode JSON, etc. et qui est compatible avec OpenAI et Anthropic.

Adresse du site web officiel de Grok 4

Adresse du site officiel: : https://x.ai/grok

Comment utiliser Grok 4

Directement via la plateforme X
- S'abonner à X Premium+Le prix est de 16 dollars par mois pour accéder aux fonctions conversationnelles de Grok 4 directement sur Platform X (anciennement Twitter), avec prise en charge de l'accès au web en temps réel et de l'analyse d'images.
- Privilèges des comptes certifiésLes utilisateurs certifiés Blue V peuvent être rapidement certifiés via le site officiel pour obtenir la qualification d'essai sur une base prioritaire.
Grâce à l'application SuperGrokInterface d'application autonome avec prise en charge de l'interaction vocale, des téléchargements de fichiers (PDF/Excel, etc.) et des recherches approfondies pour les utilisateurs non techniques.

Intégration de l'API pour les développeurs

Enregistrement et acquisition des clés
- Visitez le portail des développeurs xAI pour ouvrir un compte.
- Créez des clés API, définissez des autorisations et des limites tarifaires.
quota libreLes nouveaux utilisateurs bénéficient d'un crédit API de 150 dollars pour le premier mois (la participation à un programme de partage de données est requise).

Exemple de code rapide

Python (compatible avec le SDK OpenAI): :

from openai import OpenAI
client = OpenAI(
    base_url="https://api.x.ai/v1",
    api_key="YOUR_GROK_API_KEY"
)
response = client.chat.completions.create(
    model="grok-4-beta",
    messages=[{"role": "user", "content": "用Python写个快速排序"}]
)
print(response.choices[0].message.content)

Demande cURL: :

curl https://api.x.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_GROK_API_KEY" \
  -d '{"model":"grok-4-beta","messages":[{"role":"user","content":"分析X平台AI讨论热点"}]}'

Principaux avantages de Grok 4

Performance interdisciplinaire au niveau du doctoratLes candidats doivent être titulaires d'un doctorat dans toutes les matières principales telles que les mathématiques (AIME 25 sur 25), la physique, la chimie et les sciences humaines.
L'ultime percée en matière d'examen humainDans le test de référence HLE portant sur 2 500 énigmes de niveau doctoral, Grok 4 Heavy (Multi-Agent Mode) est devenu le premier modèle au monde à franchir la moitié du chemin avec un taux de réponse de 50,71 TP3T.
Direction du test AGI: Score record de 15,81 TP3T au test ArcAGI v2, ce qui est proche de la norme générale de l'IA, soit deux fois plus que le deuxième (Claude Opus).
Grok 4 Collaboration multi-agents lourdeLe système de gestion de l'information est un outil de gestion de l'information qui permet de soutenir le raisonnement parallèle de 4 intelligences et d'améliorer de façon exponentielle l'efficacité de la résolution de problèmes complexes grâce à la validation croisée et à l'optimisation des schémas de gestion.
Optimisation dynamique en temps réelDans la démonstration, la prédiction de la probabilité du championnat MLB a été réalisée en seulement 4,5 minutes, en intégrant la recherche d'informations, la modélisation des données et le calcul des probabilités.
écrasement arithmétiqueLe calcul d'entraînement est 100 fois supérieur à celui de Grok 3 et la vitesse de réponse est augmentée de plus de 50%.
Délai de génération du premier jeton: 10 secondes dans un contexte de 32K tokens, 15% plus rapide que Grok 3.
modèle de codage spécialGrok 4 Code prend en charge l'intégration en un clic dans les IDE (par exemple, Cursor), et la précision et l'efficacité de la génération de code dépassent celles de GPT-4 Code Interpreter.
Automatisation de l'APIIl prend en charge les appels de fonction, les sorties structurées JSON et peut déclencher automatiquement des API externes, ce qui convient à des scénarios de haute précision tels que la finance, le droit et les soins de santé.
Avantage en termes de coûtsLe coût de l'Opus Claude 3 : 3 $ par million de jetons en entrée et 15 $ par million en sortie, soit seulement 1/3 du coût de l'Opus Claude 3.

Tests de modèles pour Grok 4

test officiel: :
- Le dernier examen de l'humanitéLe Grok 4 Heavy obtient un score de 44,41 TP3T avec l'outil et peut être porté à 50,71 TP3T avec une optimisation plus poussée.
- AIME25 (concours de mathématiques)Le Grok 4 Heavy a obtenu un score parfait de 100%, écrasant tous les autres modèles.
- GPQA (Graduate Proficiency Question and Answer)Grok 4 Heavy a obtenu un score de 88,91 TP3T, ce qui le place en tête de la liste de contrôle. Gémeaux 2.5 Pro (86.4%) et Claude 4 Opus (79.6%).
- HMMT25 (High School Mathematics Competition)Grok 4 Heavy a obtenu un score de 96,71 TP3T, loin devant Gemini 2.5 Pro (82,51 TP3T).
- USAMO25 (Olympiade mathématique des États-Unis)Grok 4 Heavy a obtenu 61,91 TP3T, ce qui est nettement supérieur à Gemini DeepThink (49,41 TP3T) et à Gemini 2.5 Pro (34,51 TP3T).
- ARC-AGI (raisonnement abstrait)Grok 4 a obtenu un score de 15,91 TP3T, doublant presque le précédent SOTA commercial.
- Vending-Bench (simulation d'entreprise)Grok 4 a obtenu $4694, loin devant Claude Opus 4 ($2077) et Human Player ($844).
Évaluation par un tiers(Artificial Analysis test, plateforme d'évaluation des performances des grands modèles) :
- Index de l'intelligence artificielleGrok 4 a obtenu 73 points, devant OpenAI o3 (70), Google Gemini 2.5 Pro (70), Anthropic Claude 4 Opus (64) et DeepSeek R1 0528 (68 points).
- Indices codés et mathématiquesGrok 4, tous deux classés premiers.
- Score GPQA DiamondRecord de 88%, dépassant les 84% du Gemini 2.5 Pro.
- Le dernier examen de l'humanitéRecord de 24%, dépassant les 21% du Gemini 2.5 Pro.
- tempoGrok 4 à 75 tokens/sec, moins bien que o3 (188 tokens/sec) et Gemini 2.5 Pro (142 tokens/sec), mais mieux que Claude 4 Opus Thinking (66 tokens/sec).

Prix des produits pour Grok 4

Abonnements payants: :
- SuperGrokLe coût du programme est de 300 dollars par an et de 30 dollars par mois.
- SuperGrok HeavyLe coût du programme est de 3 000 dollars par an et de 300 dollars par mois.
Prix des appels API: :
- importation: 3 $ / million de jetons.
- exportations: 15 $ / million de tokens.

À qui s'adresse Grok 4

Développeurs de premier planLes ingénieurs à part entière, les experts en algorithmes et les responsables de projets open source qui doivent gérer des bases de code de plusieurs millions d'euros ou construire des systèmes complexes.
Travailleurs dans le domaine de l'IA et de la rechercheLe site Web de l'Institut des sciences de la vie de l'Union européenne (ISU) : professeurs d'université, chercheurs en laboratoire et scientifiques des données pour des percées universitaires, des simulations expérimentales ou des analyses interdisciplinaires.
entrepreneur technologiqueLes CTO des startups, hackers indépendants, ont besoin de 48 heures pour valider un produit de 0 à 1 ou automatiser des opérations.
Équipe de quantification financièreLes fonds spéculatifs, organisations de négociation à haute fréquence qui s'appuient sur des données en temps réel et un raisonnement de niveau doctoral pour élaborer des stratégies.
Institutions au niveau national/de l'entrepriseLes activités de R&D lourdes dans l'aérospatiale, l'énergie, les produits pharmaceutiques, etc., qui nécessitent des déploiements privés pour résoudre des problèmes d'ingénierie ultra-complexes.