k2 - Dark Side of the Moon El último modelo base de arquitectura MoE de Kimi

¿Qué es k2?

k2 es un modelo base de arquitectura MoE con un código magnífico y capacidades de Agente de Moonshot AI, con 1T de parámetros totales y 32B de parámetros de activación. El modelo k2 supera a otros modelos de código abierto convencionales en pruebas de rendimiento de referencia en categorías principales como Razonamiento de Conocimientos Generales, Programación, Matemáticas, Agente, etc. La longitud de contexto del modelo k2 es de 128k, no soporta características visuales. Admite ToolCalls, modo JSON, modo parcial y búsqueda en red.

k2 – 月之暗面Kimi最新推出的MoE架构基础模型

Principales funciones de k2

  • Excelente capacidad de codificaciónOptimizado para tareas de programación, admite la generación de código complejo, la depuración, la interpretación y la conversión entre lenguajes.
  • Capacidad del agenteSoporte de ToolCalls multipaso para planificar y ejecutar de forma autónoma cadenas de tareas (por ejemplo, consultas de datos, llamadas a API, operaciones con archivos, etc.).
  • Matemáticas y razonamiento lógicosupera a los principales modelos de código abierto en competiciones matemáticas (por ejemplo, AIME), puzles lógicos y cálculo científico.

dirección del sitio web oficial de k2

Cómo utilizar k2

  • Visita el asistente inteligente kimi: Visita el sitio web oficial de Kimi Intelligent Assistant y elige utilizar el modelo k2 por defecto.
  • Obtener la clave APIRegístrese e inicie sesión en la plataforma abierta Moonshot AI. Entre en "Clave API" crear y copiar la clave.

Características técnicas de k2

  • Arquitectura del ME: 1 billón de parámetros totales y 32.000 millones de parámetros activos, equilibrando rendimiento y eficacia.
  • Longitud del contexto: 128K tokens (unos 250.000 caracteres chinos), adecuado para el análisis de documentos largos o diálogos extensos.
  • modelo no visual: Centrado en el tratamiento de textos.No hay ayuda para la comprensión de imágenes(debe sustituirse por kimi-latest-vision).

Precios modelo para k2

  • acierto de caché: Si el contenido de la solicitud ya se encuentra en la caché del sistema, la parte de entrada se pulsa como 1,00 yenes/millón de fichas facturación
  • Fallos de cachéContenido nuevo o no almacenado en caché, pulsaciones de la sección de entrada 4,00 yenes/millón de fichas facturación
  • sección de salida: en caché o no, uniformemente por 16,00 yenes/millón de fichas facturación
  • Longitud del contextoSoporte máximo para una sola solicitud 131.072 fichas(≈250.000 caracteres)

Escenarios de aplicación de k2

  • Código y desarrollo de softwareK2 permite leer decenas de miles de líneas de código fuente o todo el documento de requisitos para generar un esqueleto completo del proyecto.
  • Agentes inteligentes y automatización de procesosK2 es compatible con la comprensión de comandos de lenguaje natural y llamadas autónomas a bases de datos, sistemas de archivos, correo electrónico o API internas para completar un cierre comercial de varios pasos.
  • Razonamiento matemático y ayuda a la investigaciónLos usuarios pueden introducir documentos completos, preguntas de concursos o fórmulas complejas a la vez, y el modelo proporciona derivaciones paso a paso, scripts de experimentos Python/JAX/PyTorch reproducibles y genera derivaciones LaTeX que se pueden incluir directamente en el documento.
  • Visión del textoLos equipos jurídicos, de auditoría y de O&M pueden realizar rápidamente comparaciones de protocolos, comprobaciones de conformidad o localización de fallos utilizando el modelo k2.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...