llama.cpp: эффективный инструмент для вывода, поддерживает множество аппаратных средств, легко реализует вывод LLM

Последние ресурсы по искусственному интеллектуОбновлено 10 месяцев назад Круг обмена ИИ

47.5K 00

Общее введение

llama.cpp - это библиотека, реализованная на чистом языке C/C++ и предназначенная для упрощения процесса вывода для больших языковых моделей (LLM). Она поддерживает широкий спектр аппаратных платформ, включая Apple Silicon, NVIDIA GPU и AMD GPU, и предоставляет несколько вариантов квантования для увеличения скорости вычислений и уменьшения использования памяти. Целью проекта является достижение высокопроизводительного вывода LLM с минимальными настройками как для локальных, так и для облачных сред.

Список функций

Поддержка различных аппаратных платформ, включая Apple Silicon, GPU NVIDIA и AMD GPU.
Обеспечивает возможность квантования от 1,5 до 8 бит целых чисел
Поддерживает множество моделей LLM, таких как LLaMA, Mistral, Falcon и др.
Предоставьте интерфейс REST API для легкой интеграции
Поддержка смешанных рассуждений на основе CPU+GPU
Обеспечьте привязку к нескольким языкам программирования, таким как Python, Go, Node.js и др.
Обеспечение поддержки различных инструментов и инфраструктуры, таких как инструменты преобразования моделей, балансировщики нагрузки и т. д.

Использование помощи

Процесс установки

Хранилище клонирования:

   git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp

Скомпилируйте проект:

   make

Руководство по использованию

преобразование модели

llama.cpp предоставляет множество инструментов для преобразования и квантования моделей для эффективной работы на различном оборудовании. Например, модель Hugging Face можно преобразовать в формат GGML с помощью следующей команды:

python3 convert_hf_to_gguf.py --model <model_name>

Пример рассуждений

После компиляции вы можете использовать следующие команды для выводов:

./llama-cli -m models/llama-13b-v2/ggml-model-q4_0.gguf -p "你好，世界！"

Использование REST API

llama.cpp также предоставляет совместимый с OpenAI API HTTP-сервер, который можно использовать для локальных сервисов вывода моделей. Запустите сервер:

./llama-server -m models/llama-13b-v2/ggml-model-q4_0.gguf --port 8080

Доступ к базовому веб-интерфейсу можно получить через браузер или с помощью API для запросов выводов:

curl -X POST http://localhost:8080/v1/chat -d '{"prompt": "你好，世界！"}'

Подробный порядок работы функций

Загрузка модели: Сначала необходимо загрузить файл модели и поместить его в указанную директорию, а затем загрузить модель с помощью инструмента командной строки.
Конфигурация рассуждений: Соответствующие параметры для вывода, такие как длина контекста, размер партии и т.д., могут быть установлены через конфигурационные файлы или параметры командной строки.
Интеграция API: Через интерфейс REST API llama.cpp может быть интегрирован в существующие приложения для создания автоматизированных сервисов рассуждений.
оптимизация производительности: Использование возможностей квантования и аппаратного ускорения позволяет значительно повысить скорость и эффективность вычислений.

Последние ресурсы по искусственному интеллекту # Локально развернутый инструмент с открытым исходным кодом для создания крупных моделей

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Zed: высокопроизводительный многопользовательский редактор кода для совместной работы, разработанный Rust

Последние ресурсы по искусственному интеллекту # AI IDE # AI Java Open Source Projecct # Программирование искусственного интеллекта

1 год назад

044.1K

Glarity AI: ассистент чтения с искусственным интеллектом для быстрого конспектирования веб-страниц и видео

Последние ресурсы по искусственному интеллекту Интегрированная многомодельная диалоговая платформа # AI # Браузерный помощник искусственного интеллекта

9 месяцев назад

043.8K

Project G-Assist: ИИ-помощник, использующий голос и текст для оптимизации производительности ПК

Последние ресурсы по искусственному интеллекту # AI Помощник по повышению эффективности жизни

9 месяцев назад

037.5K

LuminaBrush: добавление иллюминации к изображениям с помощью инструментов Smart Paint

Последние ресурсы по искусственному интеллекту # AI Image Style Control # AI Java Open Source Projecct

12 месяцев назад

037.2K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

llama.cpp: эффективный инструмент для вывода, поддерживает множество аппаратных средств, легко реализует вывод LLM

Общее введение

Список функций

Использование помощи

Процесс установки

Руководство по использованию

преобразование модели

Пример рассуждений

Использование REST API

Подробный порядок работы функций

Jan: ИИ-ассистент с открытым исходным кодом, замена ChatGPT, запуск локальных моделей ИИ или подключение к облачному ИИ

Веб-интерфейс для генерации текста: чат-интерфейс на основе большой языковой модели Gradio с поддержкой нескольких внутренних сервисов

Похожие статьи

Zed: высокопроизводительный многопользовательский редактор кода для совместной работы, разработанный Rust

Glarity AI: ассистент чтения с искусственным интеллектом для быстрого конспектирования веб-страниц и видео

Project G-Assist: ИИ-помощник, использующий голос и текст для оптимизации производительности ПК

LuminaBrush: добавление иллюминации к изображениям с помощью инструментов Smart Paint

Нет комментариев

Последние коллекции

Последние статьи

llama.cpp: эффективный инструмент для вывода, поддерживает множество аппаратных средств, легко реализует вывод LLM

Общее введение

Список функций

Использование помощи

Процесс установки

Руководство по использованию

преобразование модели

Пример рассуждений

Использование REST API

Подробный порядок работы функций

Jan: ИИ-ассистент с открытым исходным кодом, замена ChatGPT, запуск локальных моделей ИИ или подключение к облачному ИИ

Веб-интерфейс для генерации текста: чат-интерфейс на основе большой языковой модели Gradio с поддержкой нескольких внутренних сервисов

Похожие статьи

Zed: высокопроизводительный многопользовательский редактор кода для совместной работы, разработанный Rust

Glarity AI: ассистент чтения с искусственным интеллектом для быстрого конспектирования веб-страниц и видео

Project G-Assist: ИИ-помощник, использующий голос и текст для оптимизации производительности ПК

LuminaBrush: добавление иллюминации к изображениям с помощью инструментов Smart Paint

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи