Xiaozhi AI Chatbot: Construye tu compañero de chat AI, diálogo de voz fácil e interacción inteligente.

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

218.3K 00

Introducción general

Xiaozhi AI Chatbot es un proyecto de código abierto basado en la placa de desarrollo ESP32, diseñado para ayudar a los usuarios a construir su propio compañero de chat de IA. El proyecto fue desarrollado por Shrimp y se utiliza principalmente con fines didácticos para ayudar a más personas a iniciarse en el desarrollo de hardware de IA y comprender cómo aplicar el gran modelo de lenguaje a dispositivos de hardware reales. El proyecto admite funciones de reconocimiento de voz y diálogo en varios idiomas, como mandarín, cantonés, inglés, japonés y coreano. Los usuarios pueden aprender a desarrollar con ESP-IDF y experimentar las diversas funciones de los chatbots de IA a través de este proyecto.

Xiaozhi AI chatbot portado a PC: https://github.com/Huang-junsen/py-xiaozhi

Xiaozhi AI chatbot portado a Android: https://github.com/TOM88812/xiaozhi-android-client

Tutorial de configuración del servicio backend:xiaozhi-esp32-server: servicio backend de código abierto del chatbot de IA Xiaozhi

Lista de funciones

Wi-Fi / ML307 Cat.1 4G: Admite conectividad Wi-Fi y comunicaciones 4G.
despertar con voz: Admite la función de despertador por voz sin conexión.
reconocimiento multilingüe: Admite el reconocimiento de voz en cinco idiomas: mandarín, cantonés, inglés, japonés y coreano.
reconocimiento de vozIdentifica quién grita el nombre de AI.
Modelo grande TTSCompatible con la función de conversión de texto a voz de Volcano Engine o CosyVoice.
Modelo grande LLM: Soporta Qwen 2.5 72B o el modelo de lenguaje grande de la API beanbag.
Funciones personalizadas: Señales y tonos configurables para crear roles personalizados.
memoria a corto plazoAuto-resumen después de cada ronda de diálogo.
pantalla de visualización: Admite pantallas OLED o LCD para mostrar la intensidad de la señal o el contenido de los diálogos.
Soporte de hardware: Soporta una amplia gama de hardware como Litronix-Realistic ESP32-S3 placa de desarrollo, Loxin ESP32-S3-BOX3, M5Stack CoreS3, y más.

Utilizar la ayuda

Proceso de instalación

Preparación HardwareAsegúrese de que dispone del hardware necesario, como la placa de desarrollo ESP32, el módulo de micrófono, el módulo de altavoz y la pantalla.
Descargar FirmwareVisita la página GitHub del proyecto para descargar la última versión del firmware.
Grabación de firmwareUtilice la herramienta Flash para grabar el firmware en la placa de desarrollo ESP32. Los pasos específicos son los siguientes:
- Conecte la placa de desarrollo ESP32 al PC.
- Abra la herramienta Flash y seleccione el archivo de firmware descargado.
- Pulsa el botón "Grabar" y espera a que se complete la grabación.
Configurar la redUna vez finalizada la grabación, pulsa el botón BOOT de la placa de desarrollo para entrar en el modo de configuración de red y conectarte a una red Wi-Fi o 4G.
Instalación de dependenciasInstale las dependencias de software necesarias, como el entorno de desarrollo ESP-IDF, de acuerdo con la documentación del proyecto.
Proyectos en cursoDespués de completar los pasos anteriores, ejecute el proyecto y comience a experimentar la función de chat AI.

Instrucciones de uso

despertar con vozDi la palabra "despertar" en el micrófono para despertar al chatbot.
diálogo de voz: Después de despertarte, puedes mantener un diálogo de voz directamente con la IA, compatible con varios idiomas.
Funciones personalizadas: Configuración de señales y tonos de caracteres personalizados mediante archivos de configuración.
Función de visualización: Visualiza el contenido del diálogo y la intensidad de la señal en la pantalla OLED o LCD.
reconocimiento de vozLa inteligencia artificial es capaz de reconocer quién le llama por su nombre y darle una respuesta personalizada.
memoria a corto plazoLa IA realiza un auto-resumen después de cada ronda de diálogo para mejorar la experiencia de diálogo.

Procedimiento de funcionamiento detallado

Llamada de atención y diálogo::
- Asegúrese de que el dispositivo está conectado a la red.
- Di una palabra de despertador en el micrófono, como "Xiaozhi", y el dispositivo pasará al modo de espera.
- Diga su pregunta o comando y la IA hará el reconocimiento de voz y responderá.
Configuración personalizada de funciones::
- Abra el archivo de configuración y busque la sección Role Settings.
- Introduce las señales personalizadas y los parámetros de tono y guarda el archivo.
- Reinicie el dispositivo y la nueva configuración de roles surtirá efecto.
Uso de la pantalla::
- Cuando se activa el dispositivo, la pantalla muestra la intensidad actual de la señal de red.
- Durante el diálogo, la pantalla muestra el contenido del mismo para facilitar su visualización.
función de reconocimiento de voz::
- En el archivo de configuración, establezca los parámetros de reconocimiento de voz.
- Cuando se activa, el dispositivo reconoce automáticamente la huella vocal del interlocutor y ofrece una respuesta personalizada.
función de la memoria a corto plazo::
- Después de cada ronda de diálogo, la IA resumirá y mejorará automáticamente la experiencia de diálogo.
- Los parámetros de resumen pueden ajustarse en el archivo de configuración para optimizar el efecto memoria.

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Producto interactivo multimodal en tiempo real

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Puestos relacionados

llamafile：使用单个文件分发和运行 LLMs，简化LLM部署，跨平台支持LLMs

llamafile: Distribuye y ejecuta LLMs utilizando un único archivo, simplifica el despliegue de LLMs, soporte multiplataforma para LLMs.

Últimos recursos sobre IA # Herramienta de modelos de gran tamaño de código abierto desplegada localmente

Hace 1 año

058.2K

Manus: una inteligencia de propósito general para la entrega autónoma de tareas al usuario final

Últimos recursos sobre IA # Aplicación de carrocería inteligente

hace 10mos

089.7K

NeverEnds: generar vídeos realistas con descripciones de texto

Últimos recursos sobre IA # AI Imagen a Vídeo # AI de texto a vídeo

Hace 2 años

044.9K

Orama: un motor de búsqueda vectorial y de libros a texto completo de alto rendimiento

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Recuperación de conocimientos y marco RAG

Hace 1 año

078.5K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Xiaozhi AI Chatbot: Construye tu compañero de chat AI, diálogo de voz fácil e interacción inteligente.

Introducción general

Lista de funciones