Grok 4: el último gran modelo de la xAI de Musk

¿Qué es Grok 4?

Grok 4 es el nuevo modelo de gran IA de xAI. Grok 4 multiplica por 10 la capacidad de razonamiento de su predecesor. Grok 4 tiene una capacidad de razonamiento superior, con puntuaciones casi perfectas en pruebas difíciles como el SAT y el GRE, y supera a otros modelos de vanguardia en una serie de pruebas comparativas. grok 4 admite capacidades multimodales, entiende conceptos subjetivos, genera código y visualizaciones, y presenta mejoras significativas en la interacción por voz. grok 4 está disponible en dos versiones, Grok 4 Heavy, una versión de agente único, y Grok 4 Heavy, una versión multiagente, que admite cuatro agentes. Grok 4 se divide en dos versiones, Grok 4 es una versión de agente único, y Grok 4 Heavy es una versión multiagente, que admite cuatro agentes trabajando al mismo tiempo y una ventana de contexto de hasta 256k tokens.

Grok 4 – 马斯克旗下xAI推出的最新大模型

Principales características de Grok 4

  • Razonamiento científicoFormación en el superordenador Colossus de xAI con capacidad de resolución de problemas académicos a nivel de doctorado.
  • Optimización del conocimiento profundo: Proporcionar conocimientos más precisos y fiables identificando y corrigiendo la información errónea, con el objetivo de reescribir la base del conocimiento humano.
  • apoyo multimodal: Admite entradas de texto e imagen y se ampliará a vídeo en el futuro.
  • Funciones de voz avanzadas: Grok 4 Voice tiene una voz natural y real con latencia de extremo a extremo reducida a la mitad para una experiencia de conversación más fluida.
  • Modelo de codificación profesionalGrok 4 Code está optimizado para la programación, admite varios lenguajes, escribe, depura e interpreta código de forma eficaz y puede integrarse en un IDE para modificar el código en tiempo real.
  • acceso web en tiempo realEquipado con la herramienta DeepSearch, que rastrea la información más reciente en tiempo real desde fuentes web como la plataforma X.
  • Alfabetización cultural en InternetEs el asistente de inteligencia artificial más "experto en la red" del mundo: entiende los "terriers" de Internet, la jerga y el humor con gran precisión.
  • Llamadas a funciones y salida estructuradaSoporte de llamadas a funciones para activar herramientas externas que devuelven datos estructurados (por ejemplo, JSON) para facilitar su análisis por parte de la aplicación.
  • Soporte API: Disponible a través de la API xAI, admite llamadas a funciones, respuestas en modo JSON, etc., y es compatible con OpenAI y Anthropic.

Dirección del sitio web oficial de Grok 4

  • Dirección del sitio web oficial:: https://x.ai/grok

Cómo utilizar Grok 4

  • Directamente a través de la plataforma X
    • Suscribirse a X Premium: 16 dólares al mes para acceder a las funciones conversacionales de Grok 4 directamente en la plataforma X (antes Twitter), con soporte para acceso a la web en tiempo real y análisis de imágenes.
    • Privilegios de cuenta certificados: Los usuarios certificados Blue V pueden certificarse rápidamente a través del sitio web oficial para obtener la calificación de prueba con carácter prioritario.
  • A través de la aplicación SuperGrokInterfaz de aplicación autónoma compatible con la interacción por voz, la carga de archivos (PDF/Excel, etc.) y las búsquedas exhaustivas para usuarios sin conocimientos técnicos.
  • Integración de la API para desarrolladores
    • Registro y adquisición de llaves
      • Visite el Portal del Desarrollador xAI para registrarse y obtener una cuenta.
      • Cree claves API, establezca permisos y límites de tarifa.
    • cuota libreLos nuevos usuarios reciben un crédito API de 150 $ durante el primer mes (se requiere la participación en un programa de intercambio de datos).
    • Ejemplo de código rápido
      • Python (compatible con OpenAI SDK)::
        from openai import OpenAI
        client = OpenAI(
            base_url="https://api.x.ai/v1",
            api_key="YOUR_GROK_API_KEY"
        )
        response = client.chat.completions.create(
            model="grok-4-beta",
            messages=[{"role": "user", "content": "用Python写个快速排序"}]
        )
        print(response.choices[0].message.content)
      • Solicitud cURL::
        curl https://api.x.ai/v1/chat/completions \
          -H "Authorization: Bearer YOUR_GROK_API_KEY" \
          -d '{"model":"grok-4-beta","messages":[{"role":"user","content":"分析X平台AI讨论热点"}]}'

Principales ventajas de Grok 4

  • Rendimiento interdisciplinar en el doctorado: Supera el nivel de doctorado en todas las asignaturas principales como Matemáticas (AIME 25 sobre 25), Física, Química y Humanidades.
  • El último avance en exámenes humanosEn la prueba de referencia HLE, que abarcó 2.500 rompecabezas de nivel de doctorado, Grok 4 Heavy (modo multiagente) se convirtió en el primer modelo del mundo en superar la mitad de la puntuación con una tasa de respuesta de 50,71 TP3T.
  • Liderazgo en las pruebas AGI: Puntuación récord de 15,81 TP3T en la prueba ArcAGI v2, que se acerca al estándar general de IA, el doble que el segundo clasificado (Claude Opus).
  • Grok 4 Colaboración Multiagente Pesada: Admite el razonamiento paralelo de 4 inteligencias y mejora exponencialmente la eficacia de la resolución de problemas complejos mediante la validación cruzada y la optimización de esquemas.
  • Optimización dinámica en tiempo realLa predicción de probabilidades del campeonato de la MLB se completó en sólo 4,5 minutos en la demostración, integrando la recuperación de información, el modelado de datos y el cálculo de probabilidades.
  • aplastamiento aritméticoBasado en el superordenador Colossus (clúster de 200.000 GPU), el cálculo de entrenamiento es 100 veces superior al de Grok 3, y la velocidad de respuesta se incrementa en más de 50%.
  • Retraso en la generación de la primera ficha10 segundos en un contexto de 32K tokens, 15% más rápido que Grok 3.
  • modelo de codificación especialGrok 4 Code admite la incrustación con un solo clic en IDEs (p. ej., Cursor), y la precisión y eficacia de la generación de código superan a las del GPT-4 Code Interpreter.
  • Automatización de APIEl sistema es compatible con las llamadas a funciones, la salida estructurada JSON y la activación automática de API externas, lo que resulta adecuado para escenarios de alta precisión como las finanzas, el derecho y la sanidad.
  • Ventaja de costes: 3 dólares por millón de fichas de entrada y 15 dólares por millón de salida, sólo 1/3 del coste del Claude 3 Opus.

Prueba de modelos para Grok 4

  • prueba oficial::
    • El último examen de la humanidadEl Grok 4 Heavy obtiene 44,41 TP3T con la herramienta y puede aumentar hasta 50,71 TP3T con una mayor optimización.
    • AIME25 (concurso de matemáticas): El Grok 4 Heavy obtuvo una puntuación perfecta de 100%, aplastando a todos los demás modelos.
    • GPQA (Preguntas y respuestas sobre la aptitud de los titulados)El Grok 4 Heavy obtuvo una puntuación de 88,91 TP3T, por delante del Géminis 2,5 Pro (86,4%) y Claude 4 Opus (79.6%).
    • HMMT25 (Concurso de Matemáticas para Centros de Enseñanza Secundaria)Grok 4 Heavy obtuvo una puntuación de 96,71 TP3T, muy por delante de Gemini 2.5 Pro (82,51 TP3T).
    • USAMO25 (Olimpiada Matemática de Estados Unidos)Grok 4 Heavy obtuvo 61,91 TP3T, muy por delante de Gemini DeepThink (49,41 TP3T) y Gemini 2.5 Pro (34,51 TP3T).
    • ARC-AGI (Razonamiento abstracto): Grok 4 obtuvo 15,91 TP3T, casi el doble que el anterior SOTA comercial.
    • Vending-Bench (simulación de negocio)Grok 4 obtuvo $4694, muy por delante de Claude Opus 4 ($2077) y Human Player ($844).
  • Evaluación por terceros(Prueba de análisis artificial, una plataforma para evaluar el rendimiento de grandes modelos):
    • Índice de Inteligencia Artificial: Grok 4 obtuvo 73 puntos, por delante de OpenAI o3 (70), Google Gemini 2.5 Pro (70), Anthropic Claude 4 Opus (64) y DeepSeek R1 0528 (68 puntos).
    • Índices codificados y matemáticosGrok 4, ambos en primer lugar.
    • Puntuación GPQA DiamondRécord de 88%, superando los 84% del Gemini 2.5 Pro.
    • El último examen de la humanidadRécord de 24%, superando los 21% del Gemini 2.5 Pro.
    • tempoGrok 4 a 75 tokens/seg, no tan bueno como o3 (188 tokens/seg) y Gemini 2.5 Pro (142 tokens/seg), pero mejor que Claude 4 Opus Thinking (66 tokens/seg).

Precios de los productos Grok 4

  • Planes de suscripción de pago::
    • SuperGrokEl coste del programa es de 300 dólares al año y 30 dólares al mes.
    • SuperGrok PesadoEl coste del programa es de 3.000 dólares al año y 300 dólares al mes.
  • Precios de las llamadas API::
    • importación: 3 $ / millón de fichas.
    • exportaciones: 15 $ / millón de tokens.

Para quién es Grok 4

  • Principales promotores: Ingenieros full-stack, expertos en algoritmos y mantenedores de proyectos de código abierto que necesitan manejar bases de código multimillonarias o construir sistemas complejos.
  • AI/investigadores: profesores universitarios, investigadores de laboratorio y científicos de datos para avances académicos, simulaciones experimentales o análisis interdisciplinarios.
  • empresario tecnológico: Los CTO de startups, hackers independientes, necesitan 48 horas para validar un producto de 0 a 1 o automatizar operaciones.
  • Equipo cuantitativo financieroFondos de cobertura: organizaciones de negociación de alta frecuencia que se basan en datos en tiempo real y en razonamientos de nivel doctoral para desarrollar estrategias.
  • Instituciones nacionales y empresariales: Investigación y desarrollo intensivos en los sectores aeroespacial, energético, farmacéutico, etc., que requieren despliegues privados para resolver problemas de ingeniería ultracomplejos.
© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...