gibberlink: un proyecto de demostración de comunicación de audio eficaz entre dos inteligencias artificiales

Introducción general

gibberlink es un proyecto de código abierto en GitHub del desarrollador PennyroyalTea que se centra en optimizar la comunicación entre dos inteligencias conversacionales de IA. Cuando dos inteligencias IA hablen por teléfono y se reconozcan mutuamente como IA, pasarán del lenguaje humano (inglés) a un protocolo basado en el sonido para intercambiar datos de forma más eficiente. El proyecto está escrito en TypeScript e incorpora la tecnología ggwave para ofrecer una forma innovadora de comunicación entre inteligencias artificiales. Lo más destacado de gibberlink es que demuestra cómo las inteligencias artificiales pueden comunicarse rápidamente a través de lenguajes no humanos, para escenarios que requieren una transferencia de datos eficiente, como las interacciones telefónicas o la colaboración en tiempo real. El proyecto ha sido iniciado cientos de veces y bifurcado decenas de veces en GitHub, atrayendo mucha atención de desarrolladores y entusiastas de la tecnología.

gibberlink:两个AI智能体间高效音频通信的演示项目

 

Lista de funciones

  • Identidad AIDos inteligencias IA se identifican mediante un diálogo inicial durante una llamada.
  • Cambio de idioma: Cambio del protocolo de nivel de tono basado en inglés a ggwave para la comunicación.
  • Transferencia eficaz de datos: Utilización de señales sonoras para permitir una comunicación más rápida que el habla humana.
  • Soporte de código abiertoProporciona el código fuente completo de TypeScript, lo que permite a los desarrolladores modificarlo y ampliarlo libremente.
  • Demostración y prueba: Permite descodificar el contenido de las comunicaciones y verificar su funcionalidad mediante demostraciones de páginas web ggwave.
  • Compatible con varios dispositivos: Puede ejecutarse entre distintos dispositivos, como ordenadores portátiles y teléfonos móviles.

 

Utilizar la ayuda

Preparación del entorno y proceso de instalación

gibberlink es un proyecto de código abierto basado en GitHub. Puedes ver el código y la documentación sin instalarlo localmente, pero si necesitas ejecutarlo o probar su funcionalidad, debes seguir los pasos que se indican a continuación:

  1. Acceso a los repositorios de GitHub
    Abra su navegador e introduzca la URL https://github.com/PennyroyalTea/gibberlinkHaz clic en el botón verde "Código" y selecciona "Descargar ZIP" para descargar el código fuente. Haga clic en el botón verde "Código" y seleccione "Descargar ZIP" para descargar el código fuente, o utilice el comando Git para clonar el repositorio:

    git clone https://github.com/PennyroyalTea/gibberlink.git

Una vez finalizada la descarga, descomprima el archivo en un directorio local.

  1. Instalación de Node.js
    El proyecto está desarrollado en TypeScript y requiere un entorno Node.js. Vaya al sitio web oficial de Node.js para descargar e instalar la última versión LTS (se recomienda v18.x o superior). Tras la instalación, ejecuta el siguiente comando en el terminal para comprobar la versión:

    node -v
    npm -v
    

    Asegúrese de que aparece el número de versión para indicar que la instalación se ha realizado correctamente.

  2. Instalación de dependencias
    Vaya a la carpeta del proyecto extraído, abra un terminal y ejecute el siguiente comando para instalar las dependencias del proyecto:

    cd gibberlink
    npm install
    

    Se basará en package.json instala todas las librerías necesarias, incluyendo ggwave y otros módulos de soporte.

  3. Proyectos en curso
    Después de instalar las dependencias, inicie el proyecto utilizando el siguiente comando:

    npm start
    

    Si necesitas construir el proyecto, puedes ejecutarlo:

    npm run build
    

    Una vez iniciado correctamente, el terminal muestra un estado de ejecución que indica que el servidor local está listo.

Uso de la función de demostración de ggwave

Una de las características de gibberlink es la posibilidad de descodificar el contenido de las comunicaciones AI a través de la herramienta de presentación web de ggwave. He aquí cómo hacerlo:

  1. Abrir la página de demostración de ggwave
    Acceso en el navegador https://waver.ggerganov.com/Se trata de una herramienta en línea ggwave de acceso público para descodificar datos de protocolo a nivel de tono.
  2. Preparar dos unidades
    Para simular la comunicación entre IAs, se recomienda utilizar dos dispositivos (por ejemplo, dos portátiles o un ordenador más un teléfono móvil). Ejecuta el proyecto gibberlink en un dispositivo y abre la página de demostración ggwave en el otro.
  3. Cambio de modos de comunicación
    En un proyecto en marcha, la inteligencia artificial entablará primero un diálogo sencillo (por ejemplo, para confirmar su identidad) en inglés. Una vez que ambas partes hayan confirmado que son IA, pasará automáticamente al modo de protocolo por tonos. En este punto, oirás un sonido de alta frecuencia similar al de un módem dial-up, que es la señal codificada por ggwave para la transmisión de datos.
  4. Descodificar el contenido de la comunicación
    Coloque el dispositivo en el que se está ejecutando el proyecto cerca del dispositivo de la página de demostración de ggwave, asegurándose de que el micrófono puede captar el sonido. La página de ggwave descodifica la señal de audio en tiempo real y muestra el contenido transmitido en la pantalla, por ejemplo, un mensaje del tipo "¿Ahora va mejor?

Funciones principales

  • Identidad y conmutación de IA
    Cuando se inicia el proyecto, se simula por defecto el diálogo entre dos inteligencias AI. Puede modificar el src/components/ConvAI.tsx La lógica de diálogo del archivo personaliza el contenido inicial de las preguntas y respuestas en inglés. Ejemplo:

    const initialMessage = "Are you an AI agent?";
    

    Cuando las dos inteligencias respondan "Sí", el programa llamará al startRecording() para entrar en el modo de protocolo de nivel de tono.

  • Personalizar el contenido de las comunicaciones
    existe src en el código, puede editar el contenido del mensaje. Por ejemplo, en el directorio ConvAI.tsx Modificado en:

    const nextMessage = "Let’s discuss the plan.";
    

    Guarda y vuelve a ejecutar el proyecto, los nuevos mensajes se transmitirán por audio tras cambiar de modo.

  • Depuración y visualización de registros
    El proyecto tiene una función de depuración integrada que mostrará registros en el terminal cuando se ejecute, por ejemplo:

    Conversation ended successfully in gibbMode
    

    Si se produce un error, compruebe console.error de salida, los problemas más comunes son que los privilegios del micrófono no estén activados o que la conexión de red no funcione.

advertencia

  • Asegúrese de que el micrófono y los altavoces del dispositivo funcionan correctamente, de lo contrario no se podrá completar la transmisión de audio.
  • Las pruebas en un entorno ruidoso pueden provocar fallos de descodificación, se recomienda operar en un entorno silencioso.
  • Si realiza la prueba con un teléfono móvil, ajuste el volumen a un nivel moderado para evitar la distorsión de la señal.

Siguiendo estos pasos, puedes experimentar las capacidades de comunicación de IA de gibberlink en su totalidad, cambiando de conversaciones en inglés a protocolos de audio de alta eficiencia de un vistazo. Los desarrolladores también pueden participar en las mejoras del proyecto aportando código (por ejemplo, Pull Request).

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...