Together: облачная платформа для создания и запуска платформ обучения генеративных моделей ИИ

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

81.2K 00

Общее введение

Together AI - это платформа, ориентированная на генеративные модели искусственного интеллекта и предоставляющая полный спектр услуг, начиная с обучения моделей, их тонкой настройки и заканчивая выводами. Пользователи могут использовать высокоэффективный механизм вычислений Together AI и кластеры GPU для быстрого развертывания и запуска различных моделей с открытым исходным кодом. Платформа поддерживает различные архитектуры моделей для удовлетворения различных требований приложений ИИ.

Демонстрационный интерфейс чата большой модели

Список функций

API для выводов: Поддерживает рассуждения на более чем 100 моделях с открытым исходным кодом и предоставляет как бессерверные, так и выделенные модели экземпляров.
функция точной настройки: Позволяет пользователям точно настраивать генеративные модели ИИ на основе собственных данных, сохраняя право собственности на данные.
Кластер GPU: Предоставляет передовые кластеры от 16 до 1000+ GPU для поддержки крупномасштабного обучения моделей.
Обучение индивидуальной модели: Создание передовых моделей с нуля и поддержка различных архитектур моделей.
мультимодальная модель: Поддерживает распознавание образов, вывод образов, генерацию образов и многое другое.
Эффективный механизм вывода: Интеграция новейших технологий вывода, таких как FlashAttention-3 и Flash-Decoding, для предоставления быстрых и точных услуг вывода.

Использование помощи

Установка и использование

Регистрация и вход::
- Зайдите на сайт Together AI (https://www.together.ai/) и нажмите кнопку "Начать строительство", чтобы зарегистрироваться.
- После завершения регистрации войдите в свою учетную запись и перейдите в панель управления пользователя.
Выберите услугу::
- В панели управления выберите модуль сервиса, который необходимо использовать, например API для выводов, функцию тонкой настройки или кластер GPU.
- Выберите режим бессерверного или выделенного экземпляра в зависимости от необходимости.
Использование API для выводов::
- Выберите модель с открытым исходным кодом, которую вам нужно запустить, например Llama-3, RedPajama и т. д.
- Интегрируйте модель в свое приложение с помощью интерфейса API, предоставляемого Together AI.
- Создайте собственное приложение RAG, используя встроенные конечные точки Together AI.
функция точной настройки::
- Загрузите набор данных и выберите модели, которые нуждаются в тонкой настройке.
- Настройте параметры тонкой настройки, чтобы запустить процесс тонкой настройки.
- По завершении тонкой настройки загрузите модель с точной настройкой и разверните ее.
Использование кластера GPU::
- Выберите необходимый размер кластера GPU и настройте параметры оборудования.
- Загрузите учебные данные и код модели, чтобы начать обучение.
- По завершении обучения подготовленная модель загружается для выводов или дальнейшей доработки.
Обучение индивидуальной модели::
- Выберите модуль Custom Model Training, чтобы настроить архитектуру модели и параметры обучения.
- Загрузите набор данных и начните процесс обучения.
- По завершении обучения модель загружается для развертывания и проведения расчетов.

рабочий процесс

Доступ к панели управления: После входа в систему перейдите на панель управления и выберите нужный сервисный модуль.
Параметры конфигурации: Настройте параметры вывода, тонкой настройки или обучения, если это необходимо.
Загрузка данных: Загрузите необходимый набор данных или код модели.
Начало миссииИнициируйте задачи по рассуждению, тонкой настройке или обучению и отслеживайте ход их выполнения в режиме реального времени.
Результаты загрузки: После выполнения задания модель или результаты выводов загружаются для интеграции в приложение.

общие проблемы

Как выбрать подходящую модель?
- Выберите подходящую модель с открытым исходным кодом в зависимости от сценария применения, например для генерации текста, распознавания изображений и т. д.
Что делать, если при тонкой настройке возникла ошибка?
- Проверьте формат набора данных и конфигурацию параметров, а также обратитесь к официальной документации для внесения изменений.
Низкая производительность при использовании кластера GPU?
- Убедитесь, что конфигурация оборудования соответствует требованиям, и настройте параметры обучения для повышения эффективности.

пригодная для использования модель

Бессерверные конечные точки	Автор	Тип
Meta Llama 3.2 11B Vision Instruct Turbo
Мета	чат	$0.18
Meta Llama 3.2 90B Vision Инструкция Turbo
Мета	чат	$1.20
Qwen2.5 7B Instruct Turbo
Qwen	чат	$0.30
Qwen2.5 72B Instruct Turbo
Qwen	чат	$1.20
FLUX.1 [schnell]
Лаборатории Шварцвальда	изображение	Посмотреть цены
FLUX 1.1 [pro]
Лаборатории Шварцвальда	изображение	Посмотреть цены
FLUX.1 [pro]
Лаборатории Шварцвальда	изображение	Посмотреть цены
FLUX.1 [schnell] Бесплатно
Лаборатории Шварцвальда	изображение	Посмотреть цены
Meta Llama 3.2 3B Instruct Turbo
Мета	чат	$0.06
Meta Llama Vision Free
Мета	чат	Бесплатно
Meta Llama Guard 3 11B Vision Turbo
Мета	модерация	$0.18
Meta Llama 3.1 8B Instruct Turbo
Мета	чат	$0.18
Mixtral-8x22B Инструкция v0.1
мистрали	чат	$1.20
Стабильная диффузия XL 1.0
Стабильность AI	изображение	Посмотреть цены
Meta Llama 3.1 70B Инструкция Turbo
Мета	чат	$0.88
Meta Llama 3.1 405B Инструкция Turbo
Мета	чат	$3.50
Gryphe MythoMax L2 Lite (13B)
Gryphe	чат	$0.10
Salesforce Llama Rank V1 (8B)
salesforce	пересмотреть	$0.10
Страж Мета Лламы 3 8B
Мета	модерация	$0.20
Meta Llama 3 70B Instruct Turbo
Мета	чат	$0.88
Meta Llama 3 70B Instruct Lite
Мета	чат	$0.54
Meta Llama 3 8B Instruct Lite
Мета	чат	$0.10
Meta Llama 3 8B Instruct Turbo
Мета	чат	$0.18
Meta Llama 3 70B Ссылка на инструкцию
Мета	чат	$0.90
Meta Llama 3 8B Ссылка на инструкцию
Мета	чат	$0.20
Инструкция Qwen 2 (72B)
Qwen	чат	$0.90
Инструкция Гемма-2 (27B)
Интернет-компания Google	чат	$0.80
Инструкция Гемма-2 (9B)
google	чат	$0.30
Мистраль (7B) Инструкция v0.3
мистрали	чат	$0.20
Qwen 1.5 Chat (110B)
Qwen	чат	$1.80
Охранник Мета Лламы 2 8B
Мета	модерация	$0.20
WizardLM-2 (8x22B)
microsoft	чат	$1.20
Инструкция DBRX
Databricks	чат	$1.20
DeepSeek Чат LLM (67B)
DeepSeek	чат	$0.90
Джемма Инструктор (2B)
Интернет-компания Google	чат	$0.10
Мистраль (7B) Инструкция v0.2
мистрали	чат	$0.20
Инструкция Mixtral-8x7B v0.1
мистрали	чат	$0.60
Mixtral-8x7B v0.1
мистрали	язык	$0.60
Qwen 1.5 Chat (72B)
Qwen	чат	$0.90
Страж ламы (7B)
Мета	модерация	$0.20
Nous Hermes 2 - Mixtral 8x7B-DPO
NousResearch	чат	$0.60
Мистраль (7B) Инструкция
мистрали	чат	$0.20
Мистраль (7B)
мистрали	язык	$0.20
Чат LLaMA-2 (13B)
Мета	чат	$0.22
Чат LLaMA-2 (7B)
Мета	чат	$0.20
LLaMA-2 (70B)
Мета	язык	$0.90
Код Инструкции Лламы (34B)
Мета	чат	$0.78
Upstage SOLAR Instruct v1 (11B)
на сцене	чат	$0.30
M2-BERT-Retrieval-32k
Вместе	встраивание	$0.01
M2-BERT-Retrieval-8k
Вместе	встраивание	$0.01
M2-BERT-Retrieval-2K
Вместе	встраивание	$0.01
ОАЭ-большой-V1
WhereIsAI	встраивание	$0.02
BAAI-Bge-Large-1p5
БААИ	встраивание	$0.02
BAAI-Bge-Base-1p5
БААИ	встраивание	$0.01
MythoMax-L2 (13B)
Gryphe	чат	$0.30

Пример использования

Примеры рассуждений о моделях

import os
import requests

url = "https://api.together.xyz/v1/chat/completions"
payload = {
    "model": "mistralai/Mixtral-8x7B-Instruct-v0.1",
    "max_tokens": 512,
    "temperature": 0.7,
    "top_p": 0.7,
    "top_k": 50,
    "repetition_penalty": 1
}
headers = {
    "accept": "application/json",
    "content-type": "application/json",
    "Authorization": "Bearer TOGETHER_API_KEY"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

Пример точной настройки модели

import os
import requests

url = "https://api.together.xyz/v1/fine-tune"
payload = {
    "model": "togethercomputer/llama-2-70b-chat",
    "data": "path/to/your/data",
    "epochs": 3,
    "batch_size": 8
}
headers = {
    "accept": "application/json",
    "content-type": "application/json",
    "Authorization": "Bearer TOGETHER_API_KEY"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)