Recursos da interface de usuário do Le Chat atualizados, a Mistral entra oficialmente no mercado de consumo para competir com o ChatGPT

Notícias sobre IAPublicado há 10 meses Círculo de compartilhamento de IA

9.1K 00

Mistral Duas importantes atualizações de produtos foram lançadas de uma só vez na noite passada: a ferramenta de bate-papo - Le Chat e o modelo multimodal - Pixtral Large.

Le Chat 用户界面功能大升级，Mistral 正式打入消费市场与ChatGPT火拼

O novo Le Chat

Novos recursos adicionados: tela, pesquisa na Web, geração de imagens, compreensão de imagens, ainda como sua base API Mistral O serviço é o mesmo, mantenha-o gratuito.

Le Chat Canvas

O novo conteúdo pode ser gerado selecionando partes do conteúdo gerado e sugerindo alterações. No lado direito está o registro de modificação e a versão rotulada, e na tela esquerda está o conteúdo principal gerado.

Pesquisa na Web do Le Chat

Confie no mecanismo de pesquisa Brave para gerar URLs de fontes de citação de respostas

Reconhecimento de imagens do Le Chat

Calibração do reconhecimento do conteúdo e do significado da imagem, embora o reconhecimento único do chinês seja impreciso, se o comprimento do chinês for maior, o reconhecimento poderá ser mais preciso, mas os caracteres chineses complexos individuais ainda identificarão erros ou o significado de saída semelhante à palavra única não será o mesmo. Isso é semelhante ao modelo openai, não espere muito.

O exemplo a seguir de um OCR pode ser uma boa ilustração da situação: a imagem aponta apenas para o erro de reconhecimento de texto, o texto original na figura é "inducer", indicando que o reconhecimento de imagem do texto ou depende de "adivinhação", o chinês comparado com o inglês ligeiramente adivinhando não acontece.

Geração de imagens do Le Chat

Selecione Image generation (Geração de imagem), digite um prompt com as palavras create (criar), draw (desenhar), generate (gerar), etc., e o modelo Flux Pro será automaticamente chamado para gerar uma imagem.

Agente de despertar

Esse é um recurso lançado há muito tempo... Muitas pessoas não percebem que ele pode selecionar todos os modelos lançados pela Mistral de assistentes inteligentes personalizados para conversar, e você pode digitar na caixa de diálogo@ Evoque o assistente inteligente. Na maioria das tarefas, o modelo de grande porte do Mistral é excelente para completar todos os tipos de tarefas.

Apresentamos o recém-lançado modelo multimodal de grande porte, o Pixtral Large.

Desempenho multimodal em nível de fronteira
Estado da arte em MathVista, DocVQA, VQAv2
Amplia a funcionalidade do Mistral Large 2 sem afetar o desempenho do texto.
Decodificador multimodal 123B, codificador visual paramétrico 1B
Janela de contexto de 128K: suporta pelo menos 30 imagens de alta resolução
Uso:
- Tentativas de O bate-papo
- em nossa API acertou em cheio pixtral-large-latest
- disponível em aqui (literário) download

Hoje, lançamos o Pixtral Large, um modelo multimodal ponderado aberto de 124B criado com base no Mistral Large 2. O Pixtral Large é o segundo modelo de nossa série multimodal que demonstra recursos avançados de compreensão de imagens. Em particular, o modelo é capaz de compreender documentos, diagramas e imagens naturais, mantendo os principais recursos de compreensão de texto do Mistral Large 2.

O modelo está aberto para pesquisa e uso educacional sob a Licença de Pesquisa Mistral (MRL); para uso experimental, teste e produção para fins comerciais, ele pode ser usado sob a Licença Comercial Mistral.

performances

Avaliamos o desempenho do Pixtral Large com o modelo Frontier em um conjunto de benchmarks multimodais padrão usando uma ferramenta de teste de uso geral. No MathVista, nosso modelo atingiu 69,4%, superando todos os outros modelos e demonstrando a capacidade de raciocinar sobre matemática complexa em dados visuais. Para avaliar sua capacidade de raciocinar em gráficos e documentos complexos, nós o avaliamos usando o ChartQA e o DocVQA, onde o Pixtral Large superou o GPT-4o e o Gemini-1.5 Pro.

Por fim, o Pixtral Large mostra competitividade no MM-MT-Bench, superando o Claude-3.5 Sonnet (novo), o Gemini-1.5 Pro e o GPT-4o (mais recente). expandir seus recursos financeiros Uma avaliação baseada em revisão projetada para refletir cenários de aplicação no mundo real de modelos multimodais de linguagem grande (para obter mais informações, consulte Relatório técnico do Pixtral 12B).

exemplo qualitativo

OCR multilíngue e inferência...

Palavra-chave:

Comprei café e salsichas. Quanto devo pagar? Mais 18% pela gorjeta.

Resposta:

Para calcular o valor total incluindo a gorjeta 18%, siga as etapas abaixo:

Calcule o custo do café e das salsichas:
- 2x Latte Macchiato: 2 * 4,50 CHF = 9,00 CHF
- 1x Schweinschnitzel: 22,00 CHF
- Custo total do café e da salsicha: 9,00 CHF + 22,00 CHF = 31,00 CHF
Calcule a ponta para 18%:
- Gorjeta: 31,00 CHF * 0,18 = 5,58 CHF
Adicione a gorjeta ao custo total:
- Total devido: 31,00 CHF + 5,58 CHF = 36,58 CHF

Portanto, você pagará um total de 36,58 CHF.

Compreensão gráfica...

Palavra-chave:

Quando o modelo Dark Dragon começou a apresentar problemas?

Resposta:

A perda de treinamento para o modelo "dark-dragon-50" começa a mostrar instabilidade significativa em cerca de 10.000 etapas. Há um pico claro nos valores de perda nesse ponto e outro pico importante em cerca de 20.000 etapas. Esses picos indicam que o processo de treinamento do modelo "dark-dragon-50" começa a ter problemas a partir de aproximadamente 10.000 etapas.

Mais exemplos...

Palavra-chave:

Quais empresas usam IA Mistral O modelo?

Resposta:

As empresas que usam o modelo Mistral AI são mostradas no gráfico e incluem:

BNP Paribas
Corajoso
Cloudflare
CMA CGM (Duffy Shipping Group, França)
frente

Mais uma coisa...

Com o lançamento do Pixtral LargeMistral LargeEm nosso site, nosso modelo de texto de última geração também foi atualizado. O modelo foi atualizado em nosso API incorporado em pixtral-large-latest O uso também está disponível para pesquisa no HuggingFace sob uma Licença de Pesquisa Mistral (MRL) ou para uso comercial por meio de uma licença comercial da Mistral AI.

Esse modelo mais recente é uma atualização significativa do Mistral Large 24.07 anterior, com avanços significativos na compreensão de contextos longos, novas dicas de sistema e chamadas de função mais precisas. O modelo é ideal para RAG e fluxos de trabalho de corpo inteligente que podem ser usados em cenários de aplicativos de nível empresarial, como exploração e compartilhamento de conhecimento, compreensão semântica de documentos, automação de tarefas e aprimoramento da experiência do cliente.

O Mistral Large 24.11 será lançado em breve por meio de nossos parceiros provedores de nuvem, começando com o Google Cloud e o Microsoft Azure, e espera-se que esteja disponível em uma semana.