Mistral AI выпускает модель Small 3.1: очередное обновление мультимодальных возможностей с открытым исходным кодом
Мистраль ИИ недавно объявила о запуске своей последней модели Мистраль Small 3.1, и утверждали, что это лучший выбор среди аналогичных моделей, доступных в продаже.
Эта новая модель создана на основе Mistral Small 3 и значительно улучшает производительность работы с текстом, мультимодальное понимание и контекстную обработку, а контекстное окно расширяется до 128 тыс. лексем.Официальные данные Mistral AI показывают, что Small 3.1 превосходит такие сопоставимые модели, как Джемма 3 и GPT-4o Mini, сохраняя при этом скорость 150 в секунду. жетоны Скорость рассуждений.
Одной из главных особенностей Mistral Small 3.1 является принятие лицензии Apache 2.0 с открытым исходным кодом, что позволяет использовать и изучать модель более широко.

Современные приложения ИИ предъявляют все более высокие требования к возможностям моделей, требуя от них способности обрабатывать текст, понимать мультимодальные данные, поддерживать несколько языков, управлять длинными контекстами и при этом быть малозамедленными и экономичными. Mistral AI считает, что Mistral Small 3.1 - это первая модель с открытым исходным кодом, которая соответствует или превосходит по всем этим параметрам ведущие модели с закрытым исходным кодом. модели с открытым исходным кодом.
Согласно данным о производительности, опубликованным Mistral AI, Mistral Small 3.1 демонстрирует хорошие результаты в ряде эталонных тестов. Для обеспечения сопоставимости данных Mistral AI по возможности использовала данные, представленные другими производителями ранее, в противном случае модель оценивалась с помощью своего общего инструмента оценки.
Выполнение инструкций
Бенчмаркинг текстовых команд
Ниже приведено сравнение производительности текстового обучения Mistral Small 3.1 с другими моделями, включая Gemma 3-it (27B), Cohere Aya-Vision (32B), GPT-4o Mini и Claude-3.5 Haiku.
Таблицы данных о производительности


Сравнительный анализ мультимодального обучения
Ниже приведены результаты бенчмарка Multimodal Command Benchmark с масштабированием MM-MT-Bench от 0 до 100. В сравнение также включены модели Gemma 3-it (27B), Cohere Aya-Vision (32B), GPT-4o Mini и Claude-3.5 Haiku.
Таблицы данных о производительности


многоязычие
Mistral Small 3.1 также демонстрирует сильные стороны в обработке многоязычной информации, сравнивая его с такими моделями, как Gemma 3-it (27B), Cohere Aya-Vision (32B) и GPT-4o Mini.
Таблицы данных о производительности

возможность длительной обработки контекста
Для обработки длинных контекстов Mistral Small 3.1 сравнивался с Gemma 3-it (27B), GPT-4o Mini и Claude-3.5 Haiku, чтобы подтвердить его эффективность в обработке длинных текстов.
Таблицы данных о производительности

Предтренировочные показатели
Компания Mistral AI также выпустила предварительно обученную базовую модель для Mistral Small 3.1.
Все данные предварительного обучения
Mistral Small 3.1 Base (24B) сравнивался с Gemma 3-pt (27B) по эффективности перед тренировкой.
Таблицы данных о производительности

сценарий применения
Mistral Small 3.1 позиционируется как универсальная модель, предназначенная для решения широкого спектра задач генеративного ИИ, включая выполнение команд, помощь в диалоге, понимание изображений и вызов функций, и Mistral AI считает, что она закладывает прочную основу для корпоративных и потребительских приложений ИИ.
Ключевые атрибуты и возможности
- Легкий вес. Mistral Small 3.1 работает на одной видеокарте RTX 4090 или на устройстве Mac с 32 ГБ оперативной памяти. Это делает его идеальным для сценариев на стороне устройства.
- Диалог быстрого реагирования Помощь. Идеально подходит для виртуальных помощников и других приложений, требующих быстрых и точных ответов.
- Вызовы функций с низкой задержкой. Способность быстро выполнять функции в автоматизированном или агентском рабочем процессе.
- Тонкая настройка для конкретных областей. Mistral Small 3.1 может быть тонко настроен для конкретных областей, чтобы создавать точные модели специализированных областей. Это особенно полезно в таких областях, как юридическое консультирование, медицинская диагностика и техническая поддержка.
- Основы расширенного мышления. Компания Mistral AI утверждает, что способность сообщества создавать модели Mistral с открытым исходным кодом впечатляет. За последние несколько недель появилось несколько отличных моделей вывода, построенных на основе Mistral Small 3, например, модель Nous Research DeepHermes 24B.. В связи с этим Mistral AI выпустила базовую модель и контрольные точки командной модели для Mistral Small 3.1 для дальнейшей поддержки последующей настройки модели.
Mistral Small 3.1 имеет широкий спектр сценариев применения, охватывающий корпоративные и потребительские приложения, требующие мультимодального понимания, такие как проверка документов, диагностика, обработка изображений на стороне устройства, визуальный осмотр для проверки качества, обнаружение объектов в системах безопасности, поддержка клиентов на основе изображений и ассистенты общего назначения.
юзабилити
Mistral Small 3.1 доступен для загрузки на сайте Hugging Face:Мистраль Малый 3.1 База ответить пением Мистраль малый 3.1 инструкция. Для развертывания корпоративных систем, требующих частной и оптимизированной инфраструктуры вывода, обращайтесь в Mistral AI.
Пользователи также могут использовать платформу для разработчиков Mistral AI, чтобы La Plateforme Попробуйте вызовы API. Модель также доступна в Google Cloud Vertex AI. Mistral Small 3.1 появится в NVIDIA NIM и Microsoft Azure AI Foundry в ближайшие недели.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...