k2 - Dark Side of the Moon (Lado escuro da lua) O mais recente modelo básico de arquitetura MoE de Kimi

O que é k2?

O k2 é um modelo básico de arquitetura MoE com código excelente e recursos de agente da Moonshot AI, com parâmetros totais de 1T e parâmetros de ativação de 32B. O modelo k2 supera outros modelos de código aberto convencionais em testes de desempenho de benchmark nas principais categorias, como Raciocínio de conhecimento geral, Programação, Matemática, Agente, etc. O comprimento do contexto do modelo k2 é de 128k, não oferece suporte a recursos visuais. É compatível com ToolCalls, JSON Mode, Partial Mode e Networked Search.

k2 – 月之暗面Kimi最新推出的MoE架构基础模型

Principais funções do k2

  • Excelentes recursos de codificaçãoOtimizado para tarefas de programação, com suporte à geração de códigos complexos, depuração, interpretação e conversão entre linguagens.
  • Capacidade do agenteSuporte a ToolCalls de várias etapas para planejar e executar cadeias de tarefas de forma autônoma (por exemplo, consultas de dados, chamadas de API, operações de arquivos etc.).
  • Matemática e raciocínio lógicoO desempenho do software de código aberto do Microsoft Office® é superior ao dos principais modelos de código aberto em competições matemáticas (por exemplo, AIME), quebra-cabeças lógicos e computação científica.

Endereço do site oficial da k2

Como usar o k2

  • Visite o assistente inteligente kimiVisite o site oficial do Kimi Intelligent Assistant e escolha usar o modelo k2 por padrão.
  • Obtendo a chave da APIRegistre-se e faça login na Moonshot AI Open Platform. Entre "Chave de API" crie e copie a chave.

Características técnicas do k2

  • Arquitetura do MoE: 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativos, equilibrando desempenho e eficiência.
  • Comprimento do contexto128K tokens (cerca de 250.000 caracteres chineses), adequado para análise de documentos longos ou diálogos longos.
  • modelo não visualFoco no processamento de texto.Não há suporte para a compreensão de imagens(precisa ser substituído por kimi-latest-vision).

Modelo de preço para k2

  • acerto no cacheSe o conteúdo da solicitação já estiver no cache do sistema, a parte da entrada será pressionada como ¥1,00/milhão de tokens faturamento
  • Erros no cacheConteúdo novo ou não armazenado em cache: a seção de entrada pressiona ¥4,00/milhão de tokens faturamento
  • seção de saída: em cache ou não, uniformemente por ¥16,00/milhão de tokens faturamento
  • Comprimento do contextoSuporte máximo para uma única solicitação 131.072 tokens(≈250.000 caracteres)

Cenários de aplicativos para o k2

  • Desenvolvimento de código e softwareK2: O K2 suporta a leitura de dezenas de milhares de linhas de código-fonte ou de todo o documento de requisitos para gerar um esqueleto completo do projeto.
  • Agentes inteligentes e automação de processosK2: suporta a compreensão de comandos de linguagem natural e chamadas autônomas para bancos de dados, sistemas de arquivos, e-mail ou APIs internas para concluir um fechamento de negócios em várias etapas.
  • Raciocínio matemático e assistência à pesquisaO modelo fornece derivações passo a passo, scripts de experimentos Python/JAX/PyTorch reproduzíveis e produz derivações LaTeX que podem ser inseridas diretamente no documento.
  • Visão do textoAs equipes jurídicas, de auditoria e de O&M podem concluir rapidamente comparações de protocolos, verificações de conformidade ou localização de falhas usando o modelo k2.
© declaração de direitos autorais
AiPPT

Artigos relacionados

Sem comentários

Você precisa estar conectado para participar dos comentários!
Faça login agora
nenhum
Nenhum comentário...