Meta выпускает Llama 3.3, 70B Параметры сильнее, чем у Llama 3.1 405B - меньше, быстрее, сильнее

Новости ИИОпубликовано 1 год назад Круг обмена ИИ

67.8K 00

Meta представляет Llama 3.3, большую языковую модель с 70 миллиардами параметров, которая превосходит по производительности свою предшественницу, Llama 3.1 с 405B параметров, и имеет в 10 раз меньшую стоимость ввода, чем Llama 3.1 405B! Приверженность инструкциям превосходит GPT-4o, Claude 3.5 Sonnet.

Meta发布Llama 3.3，70B参数强过Llama3.1 405B——更小、更快、更强

Эффективность разрушительных вычислений

Традиционно высокопроизводительные модели ИИ часто подразумевали большие вычислительные требования и высокую стоимость оборудования. llama 3.3 полностью меняет эту логику. Несмотря на вдвое меньший размер параметров, чем у ее предшественницы, Llama 3.1, ее производительность в ключевых бенчмарках просто потрясающая.

Ключевые показатели эффективности

- 70B параметров, 128K контекстов

- Поддерживаемые языки: 8, включая английский, немецкий, французский, итальянский, португальский, хинди, испанский, тайский.

- Оценка теста IFEval: 92.1%, лучше, чем у Llama 3.1 (405B)

- Удобство локального развертывания: значительное улучшение

Самая большая привлекательность Llama 3.3 - это ее удивительная доступность. Теперь малым и средним командам разработчиков и стартапам не нужно стесняться дорогих вычислительных ресурсов. Стандартная рабочая станция теперь может обеспечить работу передовых технологий искусственного интеллекта.

Многочисленные сценарии применения

Спектр применения этой модели впечатляет:

- Диалоговый искусственный интеллект

- Генерация синтетических данных

- многоязычная обработка

- Исследования и инновационные приложения

безопасность

Meta включила в Llama 3.3 более мощные механизмы безопасности:

- Интеграция тонко настроенных механизмов отторжения

- Llama Guard 3 Инструмент контроля рисков

- Отлаженные механизмы согласования этических норм

Эти инициативы гарантируют, что модели будут оставаться ответственными и контролируемыми интеллектом, но при этом будут находиться в открытом доступе.

Влияние на промышленность

Цифры говорят сами за себя: совокупное количество загрузок моделей Llama превысило 650 миллионов, что является не просто цифрой, а доказательством того, что ИИ с открытым исходным кодом не остановить. Это не просто цифра, это доказательство того, что ИИ с открытым исходным кодом не остановить, а Llama 3.3 превращает высококлассные технологии ИИ из "элитного клуба" в "вечеринку для масс".

Стратегический план Марка Цукерберга

В то время как Llama 4 запланирована на 2025 год, Llama 3.3 уже закладывает прочный фундамент для будущего. Meta активно инвестирует в инфраструктуру, например, в центр обработки данных мощностью 2 гигаватта в Луизиане, США, что подчеркивает ее твердую приверженность долгосрочному развитию искусственного интеллекта.

Скачать развертывание

Llama 3.3 была добавлена в библиотеку моделей Ollam с размером модели 42G, которую можно загрузить и развернуть напрямую.

Разработчики, которые еще не развернули Llama 3.3, могут посетить репозиторий Meta на GitHub или загрузить файлы модели на Hugging Face.

Модели карт:

github.com/meta-llama/llama-models/blob/main/models/llama3_3/MODEL_CARD.md

Файлы модели:

huggingface.co/meta-llama/Llama-3.3-70B-Instruct

Новости ИИ

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Репликация DeepSeek-R1: 8K математических примеров помогают маленьким моделям достичь прорыва в выводах благодаря обучению с подкреплением

Новости ИИ

1 год назад

056K

OpenAI запускает проект NextGenAI: будущее образования с использованием искусственного интеллекта

Новости ИИ

1 год назад

042.2K

全新 Qwen2.5-VL-32B-Instruct 多模态模型发布，性能超72B！

Выпущена новая мультимодальная модель Qwen2.5-VL-32B-Instruct с характеристиками Super 72B!

Новости ИИ

1 год назад

054.4K

Выпущен Qwen3: новое поколение больших языковых моделей для глубокого мышления и быстрого реагирования

Новости ИИ

11 месяцев назад

096.1K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Meta выпускает Llama 3.3, 70B Параметры сильнее, чем у Llama 3.1 405B - меньше, быстрее, сильнее

Семейство базовых моделей Amazon Nova: предоставление комплексных услуг генеративного искусственного интеллекта (Gen AI)

Мини-модель с открытым исходным кодом 1.6B "Little Fox", превосходящая аналогичные модели Qwen и Gemma

Похожие статьи

Репликация DeepSeek-R1: 8K математических примеров помогают маленьким моделям достичь прорыва в выводах благодаря обучению с подкреплением

OpenAI запускает проект NextGenAI: будущее образования с использованием искусственного интеллекта

Выпущена новая мультимодальная модель Qwen2.5-VL-32B-Instruct с характеристиками Super 72B!

Выпущен Qwen3: новое поколение больших языковых моделей для глубокого мышления и быстрого реагирования

Нет комментариев

Последние коллекции

Последние статьи

Meta выпускает Llama 3.3, 70B Параметры сильнее, чем у Llama 3.1 405B - меньше, быстрее, сильнее

Семейство базовых моделей Amazon Nova: предоставление комплексных услуг генеративного искусственного интеллекта (Gen AI)

Мини-модель с открытым исходным кодом 1.6B "Little Fox", превосходящая аналогичные модели Qwen и Gemma

Похожие статьи

Репликация DeepSeek-R1: 8K математических примеров помогают маленьким моделям достичь прорыва в выводах благодаря обучению с подкреплением

OpenAI запускает проект NextGenAI: будущее образования с использованием искусственного интеллекта

Выпущена новая мультимодальная модель Qwen2.5-VL-32B-Instruct с характеристиками Super 72B!

Выпущен Qwen3: новое поколение больших языковых моделей для глубокого мышления и быстрого реагирования

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи