Meta выпускает Llama 3.3, 70B Параметры сильнее, чем у Llama 3.1 405B - меньше, быстрее, сильнее

Новости ИИОпубликовано 9 месяцев назад Круг обмена ИИ
10.9K 00

Meta представляет Llama 3.3, большую языковую модель с 70 миллиардами параметров, которая превосходит по производительности свою предшественницу, Llama 3.1 с 405B параметров, и имеет в 10 раз меньшую стоимость ввода, чем Llama 3.1 405B! Приверженность инструкциям превосходит GPT-4o, Claude 3.5 Sonnet.

Meta发布Llama 3.3,70B参数强过Llama3.1 405B——更小、更快、更强

 

Эффективность разрушительных вычислений

Традиционно высокопроизводительные модели ИИ часто подразумевали большие вычислительные требования и высокую стоимость оборудования. llama 3.3 полностью меняет эту логику. Несмотря на вдвое меньший размер параметров, чем у ее предшественницы, Llama 3.1, ее производительность в ключевых бенчмарках просто потрясающая.

Ключевые показатели эффективности

- 70B параметров, 128K контекстов

- Поддерживаемые языки: 8, включая английский, немецкий, французский, итальянский, португальский, хинди, испанский, тайский.

- Оценка теста IFEval: 92.1%, лучше, чем у Llama 3.1 (405B)

- Удобство локального развертывания: значительное улучшение

Meta发布Llama 3.3,70B参数强过Llama3.1 405B——更小、更快、更强

 

Самая большая привлекательность Llama 3.3 - это ее удивительная доступность. Теперь малым и средним командам разработчиков и стартапам не нужно стесняться дорогих вычислительных ресурсов. Стандартная рабочая станция теперь может обеспечить работу передовых технологий искусственного интеллекта.

Многочисленные сценарии применения

Спектр применения этой модели впечатляет:

- Диалоговый искусственный интеллект

- Генерация синтетических данных

- многоязычная обработка

- Исследования и инновационные приложения

безопасность

Meta включила в Llama 3.3 более мощные механизмы безопасности:

- Интеграция тонко настроенных механизмов отторжения

- Llama Guard 3 Инструмент контроля рисков

- Отлаженные механизмы согласования этических норм

Эти инициативы гарантируют, что модели будут оставаться ответственными и контролируемыми интеллектом, но при этом будут находиться в открытом доступе.

Влияние на промышленность

Цифры говорят сами за себя: совокупное количество загрузок моделей Llama превысило 650 миллионов, что является не просто цифрой, а доказательством того, что ИИ с открытым исходным кодом не остановить. Это не просто цифра, это доказательство того, что ИИ с открытым исходным кодом не остановить, а Llama 3.3 превращает высококлассные технологии ИИ из "элитного клуба" в "вечеринку для масс".

Стратегический план Марка Цукерберга

В то время как Llama 4 запланирована на 2025 год, Llama 3.3 уже закладывает прочный фундамент для будущего. Meta активно инвестирует в инфраструктуру, например, в центр обработки данных мощностью 2 гигаватта в Луизиане, США, что подчеркивает ее твердую приверженность долгосрочному развитию искусственного интеллекта.

Скачать развертывание

Llama 3.3 была добавлена в библиотеку моделей Ollam с размером модели 42G, которую можно загрузить и развернуть напрямую.

Meta发布Llama 3.3,70B参数强过Llama3.1 405B——更小、更快、更强

 

Разработчики, которые еще не развернули Llama 3.3, могут посетить репозиторий Meta на GitHub или загрузить файлы модели на Hugging Face.

 

Модели карт:

github.com/meta-llama/llama-models/blob/main/models/llama3_3/MODEL_CARD.md

Файлы модели:

huggingface.co/meta-llama/Llama-3.3-70B-Instruct

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...