Xorbits Inference: развертывание нескольких моделей искусственного интеллекта одним щелчком мыши, распределенная система выводов

Последние ресурсы по искусственному интеллекту2年前更新 Круг обмена ИИ

Общее введение

Xorbits Inference (Xinference) - это мощный и всеобъемлющий фреймворк распределенного вывода, который поддерживает вывод для широкого спектра моделей ИИ, таких как большие языковые модели (LLM), модели распознавания речи и мультимодальные модели. С помощью Xorbits Inference пользователи могут легко развернуть свои собственные модели одним щелчком мыши или использовать встроенные передовые модели с открытым исходным кодом, независимо от того, работают ли они в облаке, на локальном сервере или на ПК.

Список функций

Поддержка рассуждений с использованием нескольких моделей ИИ, включая большие языковые модели, модели распознавания речи и мультимодальные модели
Модели развертывания и обслуживания одним щелчком мыши упрощают настройку экспериментальных и производственных сред
Поддерживает работу в облаке, на локальных серверах и на ПК.
Встроенные разнообразные передовые модели с открытым исходным кодом для удобства пользователей
Обеспечьте богатую документацию и поддержку сообщества

Использование помощи

Процесс установки

Подготовка к защите окружающей среды: Убедитесь, что установлен Python 3.7 или выше.
Установка Xorbits Inference::
```
pip install xorbits-inference
```
Конфигурационная среда: При необходимости настройте переменные окружения и зависимости.

Процесс использования

Модели для погрузки::

from xinference import InferenceEngine
engine = InferenceEngine(model_name="gpt-3")

рассуждения о беге::

result = engine.infer("你好，世界！")
print(result)

модель развертывания::

xinference deploy --model gpt-3 --host 0.0.0.0 --port 8080

Детальное управление функциями

Выбор модели: Пользователи могут выбирать из широкого спектра встроенных передовых моделей с открытым исходным кодом, таких как GPT-3, BERT и т.д., или загружать собственные модели для проведения расчетов.
Конфигурация параметров: При развертывании модели вы можете настроить параметры модели, такие как размер партии, использование GPU и т. д., в соответствии с вашими потребностями.
Мониторинг и управление: С помощью интерфейса управления пользователи могут отслеживать состояние работы модели и показатели производительности в режиме реального времени, что облегчает оптимизацию и настройку.
Поддержка общества: Присоединяйтесь к Slack-сообществу Xorbits Inference, чтобы делиться опытом и вопросами с другими пользователями и получать своевременную помощь и поддержку.

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct