A Mistral AI lança o modelo Small 3.1: outra atualização nos recursos multimodais de código aberto

Notícias sobre IAPublicado há 6 meses Círculo de compartilhamento de IA

15K 00

IA Mistral anunciou recentemente o lançamento de seu mais recente modelo Mistral Small 3.1, e afirmou que ele era a melhor opção entre os modelos equivalentes disponíveis.

Esse novo modelo se baseia no Mistral Small 3 com melhorias significativas no desempenho do texto, na compreensão multimodal e no processamento contextual, com uma janela de contexto que se estende a 128 mil tokens. Gemma 3 e GPT-4o Mini, mantendo a velocidade de 150 por segundo tokens A velocidade do raciocínio.

Um dos maiores destaques do Mistral Small 3.1 é a adoção da licença de código aberto Apache 2.0, que permite que o modelo seja usado e estudado mais amplamente.

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

Os aplicativos modernos de IA estão exigindo mais dos recursos do modelo, exigindo que os modelos sejam capazes de processar texto, entender entradas multimodais, oferecer suporte a vários idiomas e gerenciar contextos longos, além de serem de baixa latência e econômicos. A Mistral AI acredita que o Mistral Small 3.1 é o primeiro modelo de código aberto que atende ou excede o desempenho dos principais modelos pequenos de código fechado em todas essas dimensões. modelos de código aberto.

De acordo com os dados de desempenho publicados pela Mistral AI, o Mistral Small 3.1 apresenta bom desempenho em vários testes de benchmark. Para garantir a comparabilidade dos dados, a Mistral AI usou números relatados por outros fornecedores sempre que possível; caso contrário, o modelo foi avaliado por meio de sua ferramenta de avaliação genérica.

Desempenho de conformidade das instruções

Benchmarking de comandos de texto

Abaixo está uma comparação do desempenho da instrução de texto do Mistral Small 3.1 com outros modelos, incluindo o Gemma 3-it (27B), o Cohere Aya-Vision (32B), o GPT-4o Mini e o Claude-3.5 Haiku.

Tabelas de dados de desempenho

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

Avaliação comparativa de instrução multimodal

Abaixo estão os resultados do Multimodal Command Benchmark, com o MM-MT-Bench dimensionado entre 0 e 100. Os modelos também incluídos na comparação são Gemma 3-it (27B), Cohere Aya-Vision (32B), GPT-4o Mini e Claude-3.5 Haiku.

Tabelas de dados de desempenho

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

multilinguismo

O Mistral Small 3.1 também demonstra pontos fortes no processamento multilíngue, comparando-o com modelos como Gemma 3-it (27B), Cohere Aya-Vision (32B) e GPT-4o Mini.

Tabelas de dados de desempenho

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

capacidade de processamento de contexto longo

Para o processamento de contextos longos, o Mistral Small 3.1 foi comparado com o Gemma 3-it (27B), o GPT-4o Mini e o Claude-3.5 Haiku para validar seu desempenho no processamento de textos longos.

Tabelas de dados de desempenho

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

Desempenho pré-treinamento

A Mistral AI também lançou um modelo básico pré-treinado para o Mistral Small 3.1.

Todos os dados de pré-treinamento

O Mistral Small 3.1 Base (24B) foi comparado ao Gemma 3-pt (27B) para o desempenho pré-treinamento.

Tabelas de dados de desempenho

Mistral AI 发布 Small 3.1 模型：开源多模态能力再升级

cenário do aplicativo

O Mistral Small 3.1 está posicionado como um modelo versátil, projetado para lidar com uma ampla gama de tarefas de IA generativa, incluindo acompanhamento de comandos, assistência a diálogos, compreensão de imagens e chamadas de funções, e a Mistral AI acredita que ele estabelece uma base sólida para aplicativos de IA para empresas e consumidores.

Principais atributos e recursos

Leve. O Mistral Small 3.1 é executado em uma única placa de vídeo RTX 4090 ou em um dispositivo Mac com 32 GB de RAM. Isso o torna ideal para cenários no lado do dispositivo.
Assistência ao diálogo de resposta rápida. Ideal para assistentes virtuais e outros aplicativos que exigem respostas rápidas e precisas.
Chamadas de função de baixa latência. Capacidade de executar rapidamente funções em um fluxo de trabalho automatizado ou de agente.
Ajuste fino para áreas específicas. O Mistral Small 3.1 pode ser ajustado para domínios específicos a fim de criar modelos precisos de domínios especializados. Isso é particularmente útil em áreas como aconselhamento jurídico, diagnóstico médico e suporte técnico.
Fundamentos do raciocínio avançado. A Mistral AI diz que a capacidade da comunidade de desenvolver modelos Mistral de código aberto é impressionante. Nas últimas semanas, surgiram alguns ótimos modelos de inferência criados com base no Mistral Small 3, como o Nous Research's DeepHermes 24B.. Para esse fim, a Mistral AI lançou o modelo básico e os pontos de verificação do modelo de comando para o Mistral Small 3.1 para apoiar ainda mais a personalização a jusante do modelo.

O Mistral Small 3.1 tem uma ampla gama de cenários de aplicação que abrangem aplicativos empresariais e de consumo que exigem compreensão multimodal, como validação de documentos, diagnósticos, processamento de imagens do lado do dispositivo, inspeção visual para verificação de qualidade, detecção de objetos em sistemas de segurança, suporte ao cliente baseado em imagens e assistentes gerais.

usabilidade

O Mistral Small 3.1 está disponível para download no site da Hugging Face:Mistral Small 3.1 Base responder cantando Mistral Small 3.1 Instrução. Para implementações empresariais que exigem infraestrutura de inferência privada e otimizada, entre em contato com a Mistral AI.

Os usuários também podem usar a Plataforma de Desenvolvedores da Mistral AI para La Plateforme Experimente as chamadas de API. O modelo também está disponível no Google Cloud Vertex AI. O Mistral Small 3.1 chegará ao NVIDIA NIM e ao Microsoft Azure AI Foundry nas próximas semanas.

Notícias sobre IA

© declaração de direitos autorais

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Publicações relacionadas

Claude CEO的最新万字长文，比山姆奥特曼更理性实际！

O último artigo de 10.000 palavras do CEO da Claude é mais racional e prático do que Sam Altman!

Notícias sobre IA

8mos atrás

015.9K

ChatGPT 图像生成引爆网络：技术突破、版权风波与算力告急

A geração de imagens do ChatGPT incendeia a Web: avanços tecnológicos, furor de direitos autorais e emergência aritmética

Notícias sobre IA

6 meses atrás

016.1K

DeepSeek：中国开源AI飓风席卷硅谷，重塑全球AI格局

DeepSeek: o furacão de IA de código aberto da China varre o Vale do Silício, remodelando o cenário global de IA

Notícias sobre IA

8mos atrás

013.5K

Iriun：使用手机摄像头作为无线网络摄像头或虚拟现实显示器

Iriun: Uso de uma câmera de celular como webcam sem fio ou tela de realidade virtual

Notícias sobre IA

10 meses atrás

016.2K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

nenhum

Nenhum comentário...

Português do Brasil