Чатбот Xiaozhi AI: создайте своего собеседника с искусственным интеллектом, простой голосовой диалог и интеллектуальное взаимодействие

Общее введение

Xiaozhi AI Chatbot - это проект с открытым исходным кодом на базе платы разработки ESP32, призванный помочь пользователям создать собственный чат-компаньон с искусственным интеллектом. Проект был разработан компанией Shrimp и в основном используется в учебных целях, чтобы помочь большему количеству людей начать разработку аппаратных средств ИИ и понять, как применить большую языковую модель к реальным аппаратным устройствам. Проект поддерживает функции распознавания речи и ведения диалога на нескольких языках, включая мандаринский, кантонский, английский, японский и корейский. Пользователи могут узнать, как разрабатывать с помощью ESP-IDF и испытать различные функции чатботов ИИ через этот проект.

ИИ-чатбот Xiaozhi портирован на ПК: https://github.com/Huang-junsen/py-xiaozhi.

ИИ-чатбот Xiaozhi портирован на Android: https://github.com/TOM88812/xiaozhi-android-client.

Учебник по настройке бэкэнд-сервиса:xiaozhi-esp32-server: открытый сервис бэкэнд-службы чатбота Xiaozhi AI

小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

 

Список функций

  • Wi-Fi / ML307 Cat.1 4G: Поддерживает Wi-Fi и связь 4G.
  • Проснуться с голосом: Поддерживает функцию автономного голосового пробуждения.
  • многоязычное распознавание: Поддерживает распознавание голоса на пяти языках: мандаринском, кантонском, английском, японском и корейском.
  • распознавание голоса: Определите, кто выкрикивает имя ИИ.
  • Большая модель TTS: Поддерживает функцию преобразования текста в речь в Volcano Engine или CosyVoice.
  • Большая модель LLM: Поддерживает Qwen 2.5 72B или большую языковую модель beanbag API.
  • Пользовательские роли: Настраиваемые сигналы и мелодии для создания индивидуальных ролей.
  • кратковременная память: Самоанализ после каждого раунда диалога.
  • экран дисплея: Поддерживает OLED или ЖК-дисплеи для отображения уровня сигнала или содержания диалога.
  • Поддержка аппаратного обеспечения: Поддерживает широкий спектр аппаратных средств, таких как плата разработки Litronix-Realistic ESP32-S3, Loxin ESP32-S3-BOX3, M5Stack CoreS3 и др.

 

Использование помощи

Процесс установки

  1. Подготовительное оборудование: Убедитесь, что у вас есть необходимое оборудование, такое как плата разработки ESP32, модуль микрофона, модуль динамика и дисплей.
  2. Скачать прошивку: Посетите страницу проекта на GitHub, чтобы загрузить последнюю версию прошивки.
  3. Прошивка для записи: Используйте инструмент Flash для записи прошивки на плату разработки ESP32. Для этого необходимо выполнить следующие шаги:
    • Подключите плату разработки ESP32 к компьютеру.
    • Откройте программу Flash tool и выберите загруженный файл прошивки.
    • Нажмите кнопку "Записать" и дождитесь завершения записи.
  4. Настройка сети: После завершения записи нажмите кнопку BOOT на плате разработки, чтобы войти в режим настройки сети и подключиться к сети Wi-Fi или 4G.
  5. Установка зависимостей: Установите необходимые программные зависимости, такие как среда разработки ESP-IDF, в соответствии с проектной документацией.
  6. Текущие проекты: После выполнения описанных выше действий запустите проект и начните пользоваться функцией чата AI.

Инструкция по применению

  1. Проснуться с голосом: Произнесите слово пробуждения в микрофон, чтобы разбудить чатбота с искусственным интеллектом.
  2. голосовой диалог: После пробуждения вы можете вести голосовой диалог непосредственно с искусственным интеллектом, поддерживающим несколько языков.
  3. Пользовательские роли: Настройка пользовательских сигналов и мелодий персонажей с помощью файлов конфигурации.
  4. Функция дисплея: Просмотр содержимого диалога и уровня сигнала на OLED- или ЖК-дисплее.
  5. распознавание голосаИИ может распознать, кто обращается к нему по имени, и дать индивидуальный ответ.
  6. кратковременная память: После каждого раунда диалога ИИ проводит самоанализ, чтобы улучшить впечатления от диалога.

Подробная процедура работы

  1. Голосовое пробуждение и диалог::
    • Убедитесь, что устройство подключено к сети.
    • Произнесите в микрофон слово пробуждения, например "Xiaozhi", и устройство перейдет в режим ожидания.
    • Произнесите свой вопрос или команду, и искусственный интеллект распознает голос и ответит на него.
  2. Настройка пользовательских ролей::
    • Откройте файл конфигурации и найдите раздел Role Settings.
    • Введите пользовательские сигналы и параметры тембра и сохраните файл.
    • Перезагрузите устройство, и новые настройки роли вступят в силу.
  3. Использование дисплея::
    • Когда устройство активировано, на дисплее отображается текущий уровень сигнала сети.
    • Во время диалога на дисплее отображается его содержание для удобства просмотра.
  4. функция распознавания голоса::
    • В файле конфигурации задайте параметры распознавания голоса.
    • Когда устройство активируется, оно автоматически распознает отпечаток голоса говорящего и выдает индивидуальный ответ.
  5. функция кратковременной памяти::
    • После каждого раунда диалога ИИ будет автоматически подводить итоги и улучшать впечатления от диалога.
    • Параметры сводки можно настроить в файле конфигурации, чтобы оптимизировать эффект памяти.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...