k2 - Dark Side of the Moon (Lado escuro da lua) O mais recente modelo básico de arquitetura MoE de Kimi

Recursos mais recentes de IAPublicado há 2 meses Círculo de compartilhamento de IA

19.7K 00

O que é k2?

O k2 é um modelo básico de arquitetura MoE com código excelente e recursos de agente da Moonshot AI, com parâmetros totais de 1T e parâmetros de ativação de 32B. O modelo k2 supera outros modelos de código aberto convencionais em testes de desempenho de benchmark nas principais categorias, como Raciocínio de conhecimento geral, Programação, Matemática, Agente, etc. O comprimento do contexto do modelo k2 é de 128k, não oferece suporte a recursos visuais. É compatível com ToolCalls, JSON Mode, Partial Mode e Networked Search.

Principais funções do k2

Excelentes recursos de codificaçãoOtimizado para tarefas de programação, com suporte à geração de códigos complexos, depuração, interpretação e conversão entre linguagens.
Capacidade do agenteSuporte a ToolCalls de várias etapas para planejar e executar cadeias de tarefas de forma autônoma (por exemplo, consultas de dados, chamadas de API, operações de arquivos etc.).
Matemática e raciocínio lógicoO desempenho do software de código aberto do Microsoft Office® é superior ao dos principais modelos de código aberto em competições matemáticas (por exemplo, AIME), quebra-cabeças lógicos e computação científica.

Endereço do site oficial da k2

Endereço do site oficial::Assistente inteligente Kimi

Como usar o k2

Visite o assistente inteligente kimiVisite o site oficial do Kimi Intelligent Assistant e escolha usar o modelo k2 por padrão.
Obtendo a chave da APIRegistre-se e faça login na Moonshot AI Open Platform. Entre "Chave de API" crie e copie a chave.

Características técnicas do k2

Arquitetura do MoE: 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativos, equilibrando desempenho e eficiência.
Comprimento do contexto128K tokens (cerca de 250.000 caracteres chineses), adequado para análise de documentos longos ou diálogos longos.
modelo não visualFoco no processamento de texto.Não há suporte para a compreensão de imagens(precisa ser substituído por kimi-latest-vision).

Modelo de preço para k2

acerto no cacheSe o conteúdo da solicitação já estiver no cache do sistema, a parte da entrada será pressionada como ¥1,00/milhão de tokens faturamento
Erros no cacheConteúdo novo ou não armazenado em cache: a seção de entrada pressiona ¥4,00/milhão de tokens faturamento
seção de saída: em cache ou não, uniformemente por ¥16,00/milhão de tokens faturamento
Comprimento do contextoSuporte máximo para uma única solicitação 131.072 tokens(≈250.000 caracteres)

Cenários de aplicativos para o k2

Desenvolvimento de código e softwareK2: O K2 suporta a leitura de dezenas de milhares de linhas de código-fonte ou de todo o documento de requisitos para gerar um esqueleto completo do projeto.
Agentes inteligentes e automação de processosK2: suporta a compreensão de comandos de linguagem natural e chamadas autônomas para bancos de dados, sistemas de arquivos, e-mail ou APIs internas para concluir um fechamento de negócios em várias etapas.
Raciocínio matemático e assistência à pesquisaO modelo fornece derivações passo a passo, scripts de experimentos Python/JAX/PyTorch reproduzíveis e produz derivações LaTeX que podem ser inseridas diretamente no documento.
Visão do textoAs equipes jurídicas, de auditoria e de O&M podem concluir rapidamente comparações de protocolos, verificações de conformidade ou localização de falhas usando o modelo k2.