Together: облачная платформа для создания и запуска платформ обучения генеративных моделей ИИ
Общее введение
Together AI - это платформа, ориентированная на генеративные модели искусственного интеллекта и предоставляющая полный спектр услуг, начиная с обучения моделей, их тонкой настройки и заканчивая выводами. Пользователи могут использовать высокоэффективный механизм вычислений Together AI и кластеры GPU для быстрого развертывания и запуска различных моделей с открытым исходным кодом. Платформа поддерживает различные архитектуры моделей для удовлетворения различных требований приложений ИИ.

Демонстрационный интерфейс чата большой модели
Список функций
- API для выводов: Поддерживает рассуждения на более чем 100 моделях с открытым исходным кодом и предоставляет как бессерверные, так и выделенные модели экземпляров.
- функция точной настройки: Позволяет пользователям точно настраивать генеративные модели ИИ на основе собственных данных, сохраняя право собственности на данные.
- Кластер GPU: Предоставляет передовые кластеры от 16 до 1000+ GPU для поддержки крупномасштабного обучения моделей.
- Обучение индивидуальной модели: Создание передовых моделей с нуля и поддержка различных архитектур моделей.
- мультимодальная модель: Поддерживает распознавание образов, вывод образов, генерацию образов и многое другое.
- Эффективный механизм вывода: Интеграция новейших технологий вывода, таких как FlashAttention-3 и Flash-Decoding, для предоставления быстрых и точных услуг вывода.
Использование помощи
Установка и использование
- Регистрация и вход::
- Зайдите на сайт Together AI (https://www.together.ai/) и нажмите кнопку "Начать строительство", чтобы зарегистрироваться.
- После завершения регистрации войдите в свою учетную запись и перейдите в панель управления пользователя.
- Выберите услугу::
- В панели управления выберите модуль сервиса, который необходимо использовать, например API для выводов, функцию тонкой настройки или кластер GPU.
- Выберите режим бессерверного или выделенного экземпляра в зависимости от необходимости.
- Использование API для выводов::
- Выберите модель с открытым исходным кодом, которую вам нужно запустить, например Llama-3, RedPajama и т. д.
- Интегрируйте модель в свое приложение с помощью интерфейса API, предоставляемого Together AI.
- Создайте собственное приложение RAG, используя встроенные конечные точки Together AI.
- функция точной настройки::
- Загрузите набор данных и выберите модели, которые нуждаются в тонкой настройке.
- Настройте параметры тонкой настройки, чтобы запустить процесс тонкой настройки.
- По завершении тонкой настройки загрузите модель с точной настройкой и разверните ее.
- Использование кластера GPU::
- Выберите необходимый размер кластера GPU и настройте параметры оборудования.
- Загрузите учебные данные и код модели, чтобы начать обучение.
- По завершении обучения подготовленная модель загружается для выводов или дальнейшей доработки.
- Обучение индивидуальной модели::
- Выберите модуль Custom Model Training, чтобы настроить архитектуру модели и параметры обучения.
- Загрузите набор данных и начните процесс обучения.
- По завершении обучения модель загружается для развертывания и проведения расчетов.
рабочий процесс
- Доступ к панели управления: После входа в систему перейдите на панель управления и выберите нужный сервисный модуль.
- Параметры конфигурации: Настройте параметры вывода, тонкой настройки или обучения, если это необходимо.
- Загрузка данных: Загрузите необходимый набор данных или код модели.
- Начало миссииИнициируйте задачи по рассуждению, тонкой настройке или обучению и отслеживайте ход их выполнения в режиме реального времени.
- Результаты загрузки: После выполнения задания модель или результаты выводов загружаются для интеграции в приложение.
общие проблемы
- Как выбрать подходящую модель?
- Выберите подходящую модель с открытым исходным кодом в зависимости от сценария применения, например для генерации текста, распознавания изображений и т. д.
- Что делать, если при тонкой настройке возникла ошибка?
- Проверьте формат набора данных и конфигурацию параметров, а также обратитесь к официальной документации для внесения изменений.
- Низкая производительность при использовании кластера GPU?
- Убедитесь, что конфигурация оборудования соответствует требованиям, и настройте параметры обучения для повышения эффективности.
пригодная для использования модель
Бессерверные конечные точки | Автор | Тип | Ценообразование (за 1 млн) жетоны) | |
---|---|---|---|---|
Meta Llama 3.2 11B Vision Instruct Turbo | ||||
Мета | чат | $0.18 | ||
Meta Llama 3.2 90B Vision Инструкция Turbo | ||||
Мета | чат | $1.20 | ||
Qwen2.5 7B Instruct Turbo | ||||
Qwen | чат | $0.30 | ||
Qwen2.5 72B Instruct Turbo | ||||
Qwen | чат | $1.20 | ||
FLUX.1 [schnell] | ||||
Лаборатории Шварцвальда | изображение | Посмотреть цены | ||
FLUX 1.1 [pro] | ||||
Лаборатории Шварцвальда | изображение | Посмотреть цены | ||
FLUX.1 [pro] | ||||
Лаборатории Шварцвальда | изображение | Посмотреть цены | ||
FLUX.1 [schnell] Бесплатно | ||||
Лаборатории Шварцвальда | изображение | Посмотреть цены | ||
Meta Llama 3.2 3B Instruct Turbo | ||||
Мета | чат | $0.06 | ||
Meta Llama Vision Free | ||||
Мета | чат | Бесплатно | ||
Meta Llama Guard 3 11B Vision Turbo | ||||
Мета | модерация | $0.18 | ||
Meta Llama 3.1 8B Instruct Turbo | ||||
Мета | чат | $0.18 | ||
Mixtral-8x22B Инструкция v0.1 | ||||
мистрали | чат | $1.20 | ||
Стабильная диффузия XL 1.0 | ||||
Стабильность AI | изображение | Посмотреть цены | ||
Meta Llama 3.1 70B Инструкция Turbo | ||||
Мета | чат | $0.88 | ||
Meta Llama 3.1 405B Инструкция Turbo | ||||
Мета | чат | $3.50 | ||
Gryphe MythoMax L2 Lite (13B) | ||||
Gryphe | чат | $0.10 | ||
Salesforce Llama Rank V1 (8B) | ||||
salesforce | пересмотреть | $0.10 | ||
Страж Мета Лламы 3 8B | ||||
Мета | модерация | $0.20 | ||
Meta Llama 3 70B Instruct Turbo | ||||
Мета | чат | $0.88 | ||
Meta Llama 3 70B Instruct Lite | ||||
Мета | чат | $0.54 | ||
Meta Llama 3 8B Instruct Lite | ||||
Мета | чат | $0.10 | ||
Meta Llama 3 8B Instruct Turbo | ||||
Мета | чат | $0.18 | ||
Meta Llama 3 70B Ссылка на инструкцию | ||||
Мета | чат | $0.90 | ||
Meta Llama 3 8B Ссылка на инструкцию | ||||
Мета | чат | $0.20 | ||
Инструкция Qwen 2 (72B) | ||||
Qwen | чат | $0.90 | ||
Инструкция Гемма-2 (27B) | ||||
Интернет-компания Google | чат | $0.80 | ||
Инструкция Гемма-2 (9B) | ||||
чат | $0.30 | |||
Мистраль (7B) Инструкция v0.3 | ||||
мистрали | чат | $0.20 | ||
Qwen 1.5 Chat (110B) | ||||
Qwen | чат | $1.80 | ||
Охранник Мета Лламы 2 8B | ||||
Мета | модерация | $0.20 | ||
WizardLM-2 (8x22B) | ||||
microsoft | чат | $1.20 | ||
Инструкция DBRX | ||||
Databricks | чат | $1.20 | ||
DeepSeek Чат LLM (67B) | ||||
DeepSeek | чат | $0.90 | ||
Джемма Инструктор (2B) | ||||
Интернет-компания Google | чат | $0.10 | ||
Мистраль (7B) Инструкция v0.2 | ||||
мистрали | чат | $0.20 | ||
Инструкция Mixtral-8x7B v0.1 | ||||
мистрали | чат | $0.60 | ||
Mixtral-8x7B v0.1 | ||||
мистрали | язык | $0.60 | ||
Qwen 1.5 Chat (72B) | ||||
Qwen | чат | $0.90 | ||
Страж ламы (7B) | ||||
Мета | модерация | $0.20 | ||
Nous Hermes 2 - Mixtral 8x7B-DPO | ||||
NousResearch | чат | $0.60 | ||
Мистраль (7B) Инструкция | ||||
мистрали | чат | $0.20 | ||
Мистраль (7B) | ||||
мистрали | язык | $0.20 | ||
Чат LLaMA-2 (13B) | ||||
Мета | чат | $0.22 | ||
Чат LLaMA-2 (7B) | ||||
Мета | чат | $0.20 | ||
LLaMA-2 (70B) | ||||
Мета | язык | $0.90 | ||
Код Инструкции Лламы (34B) | ||||
Мета | чат | $0.78 | ||
Upstage SOLAR Instruct v1 (11B) | ||||
на сцене | чат | $0.30 | ||
M2-BERT-Retrieval-32k | ||||
Вместе | встраивание | $0.01 | ||
M2-BERT-Retrieval-8k | ||||
Вместе | встраивание | $0.01 | ||
M2-BERT-Retrieval-2K | ||||
Вместе | встраивание | $0.01 | ||
ОАЭ-большой-V1 | ||||
WhereIsAI | встраивание | $0.02 | ||
BAAI-Bge-Large-1p5 | ||||
БААИ | встраивание | $0.02 | ||
BAAI-Bge-Base-1p5 | ||||
БААИ | встраивание | $0.01 | ||
MythoMax-L2 (13B) | ||||
Gryphe | чат | $0.30 |
Пример использования
Примеры рассуждений о моделях
import os
import requests
url = "https://api.together.xyz/v1/chat/completions"
payload = {
"model": "mistralai/Mixtral-8x7B-Instruct-v0.1",
"max_tokens": 512,
"temperature": 0.7,
"top_p": 0.7,
"top_k": 50,
"repetition_penalty": 1
}
headers = {
"accept": "application/json",
"content-type": "application/json",
"Authorization": "Bearer TOGETHER_API_KEY"
}
response = requests.post(url, json=payload, headers=headers)
print(response.text)
Пример точной настройки модели
import os
import requests
url = "https://api.together.xyz/v1/fine-tune"
payload = {
"model": "togethercomputer/llama-2-70b-chat",
"data": "path/to/your/data",
"epochs": 3,
"batch_size": 8
}
headers = {
"accept": "application/json",
"content-type": "application/json",
"Authorization": "Bearer TOGETHER_API_KEY"
}
response = requests.post(url, json=payload, headers=headers)
print(response.text)
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...