Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife

A Mistral AI lança o modelo Small 3.1: outra atualização nos recursos multimodais de código aberto

IA Mistral anunciou recentemente o lançamento de seu mais recente modelo Mistral Small 3.1, e afirmou que ele era a melhor opção entre os modelos equivalentes disponíveis.

Esse novo modelo se baseia no Mistral Small 3 com melhorias significativas no desempenho do texto, na compreensão multimodal e no processamento contextual, com uma janela de contexto que se estende a 128 mil tokens. Gemma 3 e GPT-4o Mini, mantendo a velocidade de 150 por segundo tokens A velocidade do raciocínio.


Um dos maiores destaques do Mistral Small 3.1 é a adoção da licença de código aberto Apache 2.0, que permite que o modelo seja usado e estudado mais amplamente.

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

Os aplicativos modernos de IA estão exigindo mais dos recursos do modelo, exigindo que os modelos sejam capazes de processar texto, entender entradas multimodais, oferecer suporte a vários idiomas e gerenciar contextos longos, além de serem de baixa latência e econômicos. A Mistral AI acredita que o Mistral Small 3.1 é o primeiro modelo de código aberto que atende ou excede o desempenho dos principais modelos pequenos de código fechado em todas essas dimensões. modelos de código aberto.

De acordo com os dados de desempenho publicados pela Mistral AI, o Mistral Small 3.1 apresenta bom desempenho em vários testes de benchmark. Para garantir a comparabilidade dos dados, a Mistral AI usou números relatados por outros fornecedores sempre que possível; caso contrário, o modelo foi avaliado por meio de sua ferramenta de avaliação genérica.

 

Desempenho de conformidade das instruções

Benchmarking de comandos de texto

Abaixo está uma comparação do desempenho da instrução de texto do Mistral Small 3.1 com outros modelos, incluindo o Gemma 3-it (27B), o Cohere Aya-Vision (32B), o GPT-4o Mini e o Claude-3.5 Haiku.

Tabelas de dados de desempenho

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

 

Avaliação comparativa de instrução multimodal

Abaixo estão os resultados do Multimodal Command Benchmark, com o MM-MT-Bench dimensionado entre 0 e 100. Os modelos também incluídos na comparação são Gemma 3-it (27B), Cohere Aya-Vision (32B), GPT-4o Mini e Claude-3.5 Haiku.

Tabelas de dados de desempenho

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

multilinguismo

O Mistral Small 3.1 também demonstra pontos fortes no processamento multilíngue, comparando-o com modelos como Gemma 3-it (27B), Cohere Aya-Vision (32B) e GPT-4o Mini.

Tabelas de dados de desempenho

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

capacidade de processamento de contexto longo

Para o processamento de contextos longos, o Mistral Small 3.1 foi comparado com o Gemma 3-it (27B), o GPT-4o Mini e o Claude-3.5 Haiku para validar seu desempenho no processamento de textos longos.

Tabelas de dados de desempenho

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

 

Desempenho pré-treinamento

A Mistral AI também lançou um modelo básico pré-treinado para o Mistral Small 3.1.

Todos os dados de pré-treinamento

O Mistral Small 3.1 Base (24B) foi comparado ao Gemma 3-pt (27B) para o desempenho pré-treinamento.

Tabelas de dados de desempenho

Mistral AI lança o modelo Small 3.1: capacidade multimodal de código aberto atualizada novamente-1

 

cenário do aplicativo

O Mistral Small 3.1 está posicionado como um modelo versátil, projetado para lidar com uma ampla gama de tarefas de IA generativa, incluindo acompanhamento de comandos, assistência a diálogos, compreensão de imagens e chamadas de funções, e a Mistral AI acredita que ele estabelece uma base sólida para aplicativos de IA para empresas e consumidores.

 

Principais atributos e recursos

  • Leve. O Mistral Small 3.1 é executado em uma única placa de vídeo RTX 4090 ou em um dispositivo Mac com 32 GB de RAM. Isso o torna ideal para cenários no lado do dispositivo.
  • Assistência ao diálogo de resposta rápida. Ideal para assistentes virtuais e outros aplicativos que exigem respostas rápidas e precisas.
  • Chamadas de função de baixa latência. Capacidade de executar rapidamente funções em um fluxo de trabalho automatizado ou de agente.
  • Ajuste fino para áreas específicas. O Mistral Small 3.1 pode ser ajustado para domínios específicos a fim de criar modelos precisos de domínios especializados. Isso é particularmente útil em áreas como aconselhamento jurídico, diagnóstico médico e suporte técnico.
  • Fundamentos do raciocínio avançado. A Mistral AI diz que a capacidade da comunidade de desenvolver modelos Mistral de código aberto é impressionante. Nas últimas semanas, surgiram alguns ótimos modelos de inferência criados com base no Mistral Small 3, como o Nous Research's DeepHermes 24B.. Para esse fim, a Mistral AI lançou o modelo básico e os pontos de verificação do modelo de comando para o Mistral Small 3.1 para apoiar ainda mais a personalização a jusante do modelo.

O Mistral Small 3.1 tem uma ampla gama de cenários de aplicação que abrangem aplicativos empresariais e de consumo que exigem compreensão multimodal, como validação de documentos, diagnósticos, processamento de imagens do lado do dispositivo, inspeção visual para verificação de qualidade, detecção de objetos em sistemas de segurança, suporte ao cliente baseado em imagens e assistentes gerais.

usabilidade

O Mistral Small 3.1 está disponível para download no site da Hugging Face:Mistral Small 3.1 Base responder cantando Mistral Small 3.1 Instrução. Para implementações empresariais que exigem infraestrutura de inferência privada e otimizada, entre em contato com a Mistral AI.

Os usuários também podem usar a Plataforma de Desenvolvedores da Mistral AI para La Plateforme Experimente as chamadas de API. O modelo também está disponível no Google Cloud Vertex AI. O Mistral Small 3.1 chegará ao NVIDIA NIM e ao Microsoft Azure AI Foundry nas próximas semanas.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " A Mistral AI lança o modelo Small 3.1: outra atualização nos recursos multimodais de código aberto
pt_BRPortuguês do Brasil