MNN-LLM-Android: Мультимодальное моделирование языка с помощью MNN для Android

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

68.3K 00

Общее введение

MNN (Mobile Neural Network) - это эффективная и легкая система глубокого обучения, разработанная компанией Alibaba и оптимизированная для мобильных устройств. MNN не только позволяет быстро делать выводы на мобильных устройствах, но и поддерживает мультимодальные задачи, включая генерацию текста, изображений, обработку аудио и т. д. MNN была интегрирована в несколько приложений Alibaba, таких как Taobao, Tmall, Youku, Nail и Idle Fish, охватывая более 70 сценариев использования, таких как прямая трансляция, захват короткого видео, поисковые рекомендации и поиск изображений продуктов.

Список функций

мультимодальная поддержка: Поддерживает широкий спектр задач, таких как генерация текста, создание изображений и обработка звука.
Оптимизация выводов на процессоре: Достигнута отличная производительность процессорных выводов на мобильных устройствах.
Легкий каркас: Фреймворк спроектирован таким образом, чтобы быть легким и подходить для ограниченных ресурсов мобильных устройств.
широко используемый: Он интегрирован в несколько приложений Alibaba, охватывая широкий спектр бизнес-сценариев.
открытый исходный кодПолный открытый исходный код и документация предоставляются для легкой интеграции и вторичной разработки.

Использование помощи

Процесс установки

Загрузка и установка: Клонируйте код проекта из репозитория GitHub.
```
git clone https://github.com/alibaba/MNN.git
cd MNN
```


2. **编译项目**：根据项目提供的README文档，配置编译环境并编译项目。
```bash
mkdir build
cd build
cmake ..
make -j4

Интеграция в приложения для Android: Интегрируйте скомпилированные файлы библиотек в проект Android, изменив файлbuild.gradleфайл для настройки.

Использование

мультимодальные возможности

MNN поддерживает множество мультимодальных задач, включая генерацию текста, изображений и обработку аудио. Ниже приведены примеры использования этих функций:

Генерация текста: Генерация текста с использованием предварительно обученных языковых моделей.

import MNN
interpreter = MNN.Interpreter("text_model.mnn")
session = interpreter.createSession()
input_tensor = interpreter.getSessionInput(session)
# 输入文本进行预处理
input_data = preprocess_text("输入文本")
input_tensor.copyFrom(input_data)
interpreter.runSession(session)
output_tensor = interpreter.getSessionOutput(session)
output_data = output_tensor.copyToHostTensor()
result = postprocess_text(output_data)
print(result)

Генерация изображений: Генерация изображений с помощью предварительно обученных генеративных моделей.

import MNN
interpreter = MNN.Interpreter("image_model.mnn")
session = interpreter.createSession()
input_tensor = interpreter.getSessionInput(session)
# 输入数据进行预处理
input_data = preprocess_image("输入图像")
input_tensor.copyFrom(input_data)
interpreter.runSession(session)
output_tensor = interpreter.getSessionOutput(session)
output_data = output_tensor.copyToHostTensor()
result = postprocess_image(output_data)
print(result)

обработка звука: Генерация или обработка аудио с использованием предварительно обученных аудиомоделей.

import MNN
interpreter = MNN.Interpreter("audio_model.mnn")
session = interpreter.createSession()
input_tensor = interpreter.getSessionInput(session)
# 输入音频数据进行预处理
input_data = preprocess_audio("输入音频")
input_tensor.copyFrom(input_data)
interpreter.runSession(session)
output_tensor = interpreter.getSessionOutput(session)
output_data = output_tensor.copyToHostTensor()
result = postprocess_audio(output_data)
print(result)

Подробная процедура работы

Создание экземпляра Reasoning: Инициализация модели MNN и создание сеанса вывода.
```
import MNN
interpreter = MNN.Interpreter("model.mnn")
session = interpreter.createSession()
```
Предварительная обработка исходных данных: Предварительная обработка входных данных в соответствии с типом модели.
```
input_tensor = interpreter.getSessionInput(session)
input_data = preprocess_data("输入数据")
input_tensor.copyFrom(input_data)
```
исполнительное мышление: Запустите сессию для обоснования.
```
interpreter.runSession(session)
```

Постобработка выходных данных: Получение выходных данных и их постобработка.

output_tensor = interpreter.getSessionOutput(session)
output_data = output_tensor.copyToHostTensor()
result = postprocess_data(output_data)
print(result)