Mistral AI выпускает модель Small 3.1: очередное обновление мультимодальных возможностей с открытым исходным кодом

Новости ИИОпубликовано 1 год назад Круг обмена ИИ

49.7K 00

Мистраль ИИ недавно объявила о запуске своей последней модели Мистраль Small 3.1, и утверждали, что это лучший выбор среди аналогичных моделей, доступных в продаже.

Эта новая модель создана на основе Mistral Small 3 и значительно улучшает производительность работы с текстом, мультимодальное понимание и контекстную обработку, а контекстное окно расширяется до 128 тыс. лексем.Официальные данные Mistral AI показывают, что Small 3.1 превосходит такие сопоставимые модели, как Джемма 3 и GPT-4o Mini, сохраняя при этом скорость 150 в секунду. жетоны Скорость рассуждений.

Одной из главных особенностей Mistral Small 3.1 является принятие лицензии Apache 2.0 с открытым исходным кодом, что позволяет использовать и изучать модель более широко.

Современные приложения ИИ предъявляют все более высокие требования к возможностям моделей, требуя от них способности обрабатывать текст, понимать мультимодальные данные, поддерживать несколько языков, управлять длинными контекстами и при этом быть малозамедленными и экономичными. Mistral AI считает, что Mistral Small 3.1 - это первая модель с открытым исходным кодом, которая соответствует или превосходит по всем этим параметрам ведущие модели с закрытым исходным кодом. модели с открытым исходным кодом.

Согласно данным о производительности, опубликованным Mistral AI, Mistral Small 3.1 демонстрирует хорошие результаты в ряде эталонных тестов. Для обеспечения сопоставимости данных Mistral AI по возможности использовала данные, представленные другими производителями ранее, в противном случае модель оценивалась с помощью своего общего инструмента оценки.

Выполнение инструкций

Бенчмаркинг текстовых команд

Ниже приведено сравнение производительности текстового обучения Mistral Small 3.1 с другими моделями, включая Gemma 3-it (27B), Cohere Aya-Vision (32B), GPT-4o Mini и Claude-3.5 Haiku.