A Mistral lançou duas grandes atualizações de produtos de uma só vez na noite passada: a ferramenta de bate-papo - Le Chat e o modelo multimodal - Pixtral Large.
O novo Le Chat
Novos recursos adicionados: tela, pesquisa na Web, geração de imagens, compreensão de imagens, ainda como sua base API Mistral O serviço é o mesmo, mantenha-o gratuito.
Le Chat Canvas
O novo conteúdo pode ser gerado selecionando partes do conteúdo gerado e sugerindo alterações. No lado direito está o registro de modificação e a versão rotulada, e na tela esquerda está o conteúdo principal gerado.
Pesquisa na Web do Le Chat
Confie no mecanismo de pesquisa Brave para gerar URLs de fontes de citação de respostas
Reconhecimento de imagens do Le Chat
Calibração do reconhecimento do conteúdo e do significado da imagem, embora o reconhecimento único do chinês seja impreciso, se o comprimento do chinês for maior, o reconhecimento poderá ser mais preciso, mas os caracteres chineses complexos individuais ainda identificarão erros ou o significado de saída semelhante à palavra única não será o mesmo. Isso é semelhante ao modelo openai, não espere muito.
O exemplo a seguir de um OCR pode ser uma boa ilustração da situação: a imagem aponta apenas para o erro de reconhecimento de texto, o texto original na figura é "inducer", indicando que o reconhecimento de imagem do texto ou depende de "adivinhação", o chinês comparado com o inglês ligeiramente adivinhando não acontece.
Geração de imagens do Le Chat
Selecione Image generation (Geração de imagem), digite um prompt com as palavras create (criar), draw (desenhar), generate (gerar), etc., e o modelo Flux Pro será automaticamente chamado para gerar uma imagem.
Agente de despertar
Esse é um recurso lançado há muito tempo... Muitas pessoas não percebem que ele pode selecionar todos os modelos lançados pela Mistral de assistentes inteligentes personalizados para conversar, e você pode digitar na caixa de diálogo@
Evoque o assistente inteligente. Na maioria das tarefas, o modelo de grande porte do Mistral é excelente para completar todos os tipos de tarefas.
Apresentamos o recém-lançado modelo multimodal de grande porte, o Pixtral Large.
- Desempenho multimodal em nível de fronteira
- Estado da arte em MathVista, DocVQA, VQAv2
- Amplia a funcionalidade do Mistral Large 2 sem afetar o desempenho do texto.
- Decodificador multimodal 123B, codificador visual paramétrico 1B
- Janela de contexto de 128K: suporta pelo menos 30 imagens de alta resolução
- Uso:
- Tentativas de O bate-papo
- em nossa API acertou em cheio
pixtral-large-latest
- disponível em aqui (literário) download
Hoje, lançamos o Pixtral Large, um modelo multimodal ponderado aberto de 124B criado com base no Mistral Large 2. O Pixtral Large é o segundo modelo de nossa série multimodal que demonstra recursos avançados de compreensão de imagens. Em particular, o modelo é capaz de compreender documentos, diagramas e imagens naturais, mantendo os principais recursos de compreensão de texto do Mistral Large 2.
O modelo está aberto para pesquisa e uso educacional sob a Licença de Pesquisa Mistral (MRL); para uso experimental, teste e produção para fins comerciais, ele pode ser usado sob a Licença Comercial Mistral.
performances
Avaliamos o desempenho do Pixtral Large com o modelo Frontier em um conjunto de benchmarks multimodais padrão usando uma ferramenta de teste de uso geral. No MathVista, nosso modelo atingiu 69,4%, superando todos os outros modelos e demonstrando a capacidade de raciocinar sobre matemática complexa em dados visuais. Para avaliar sua capacidade de raciocinar em gráficos e documentos complexos, nós o avaliamos usando o ChartQA e o DocVQA, onde o Pixtral Large superou o GPT-4o e o Gemini-1.5 Pro.
Por fim, o Pixtral Large mostra competitividade no MM-MT-Bench, superando o Claude-3.5 Sonnet (novo), o Gemini-1.5 Pro e o GPT-4o (mais recente). expandir seus recursos financeiros Uma avaliação baseada em revisão projetada para refletir cenários de aplicação no mundo real de modelos multimodais de linguagem grande (para obter mais informações, consulte Relatório técnico do Pixtral 12B).
exemplo qualitativo
OCR multilíngue e inferência...
Palavra-chave:
Comprei café e salsichas. Quanto devo pagar? Mais 18% pela gorjeta.
Resposta:
Para calcular o valor total incluindo a gorjeta 18%, siga as etapas abaixo:
- Calcule o custo do café e das salsichas:
- 2x Latte Macchiato: 2 * 4,50 CHF = 9,00 CHF
- 1x Schweinschnitzel: 22,00 CHF
- Custo total do café e da salsicha: 9,00 CHF + 22,00 CHF = 31,00 CHF
- Calcule a ponta para 18%:
- Gorjeta: 31,00 CHF * 0,18 = 5,58 CHF
- Adicione a gorjeta ao custo total:
- Total devido: 31,00 CHF + 5,58 CHF = 36,58 CHF
Portanto, você pagará um total de 36,58 CHF.
Compreensão gráfica...
Palavra-chave:
Quando o modelo Dark Dragon começou a apresentar problemas?
Resposta:
A perda de treinamento para o modelo "dark-dragon-50" começa a mostrar instabilidade significativa em cerca de 10.000 etapas. Há um pico claro nos valores de perda nesse ponto e outro pico importante em cerca de 20.000 etapas. Esses picos indicam que o processo de treinamento do modelo "dark-dragon-50" começa a ter problemas a partir de aproximadamente 10.000 etapas.
Mais exemplos...
Palavra-chave:
Quais empresas usam IA Mistral O modelo?
Resposta:
As empresas que usam o modelo Mistral AI são mostradas no gráfico e incluem:
- BNP Paribas
- Corajoso
- Cloudflare
- CMA CGM (Duffy Shipping Group, França)
- frente
Mais uma coisa...
Com o lançamento do Pixtral LargeMistral LargeEm nosso site, nosso modelo de texto de última geração também foi atualizado. O modelo foi atualizado em nosso API incorporado em pixtral-large-latest
O uso também está disponível para pesquisa no HuggingFace sob uma Licença de Pesquisa Mistral (MRL) ou para uso comercial por meio de uma licença comercial da Mistral AI.
Esse modelo mais recente é uma atualização significativa do Mistral Large 24.07 anterior, com avanços significativos na compreensão de contextos longos, novas dicas de sistema e chamadas de função mais precisas. O modelo é ideal para RAG e fluxos de trabalho de corpo inteligente que podem ser usados em cenários de aplicativos de nível empresarial, como exploração e compartilhamento de conhecimento, compreensão semântica de documentos, automação de tarefas e aprimoramento da experiência do cliente.
O Mistral Large 24.11 será lançado em breve por meio de nossos parceiros provedores de nuvem, começando com o Google Cloud e o Microsoft Azure, e espera-se que esteja disponível em uma semana.