Babelfish.ai: aplicación de transcripción y traducción de voz en tiempo real para navegadores
Últimos recursos sobre IAPublicado hace 11 meses Círculo de intercambio de inteligencia artificial 2.6K 00
Introducción general
Babelfish.ai es una aplicación basada en Huggingface TransformadorUna aplicación de transcripción y traducción en tiempo real construida con .js y Supabase Realtime. La aplicación puede cargar grandes modelos en el navegador y ejecutarse localmente para conseguir funciones de transcripción de voz a texto y traducción en tiempo real. Con una configuración y un funcionamiento sencillos, los usuarios pueden transcribir rápidamente contenido de voz a texto y traducirlo a varios idiomas, lo que resulta adecuado para diversos escenarios, como grabaciones de reuniones, comunicación entre varios idiomas, etc.

Lista de funciones
- Voz a texto en tiempo real: con OpenAI Susurro Permite una eficaz función de voz a texto.
- Traducción en tiempo real: admite la traducción del texto transcrito a 200 idiomas, utilizando el modelo NLLB-200 de Meta.
- Difusión multicliente: Difunda contenidos transcritos y traducidos en tiempo real a clientes suscritos a través de Supabase Realtime.
- Funcionamiento local: No se requiere soporte de servidor, todas las operaciones se realizan localmente en el navegador.
- Despliegue sencillo: admite la ejecución local y el despliegue en páginas de GitHub.
Utilizar la ayuda
Instalación y funcionamiento
- funcionamiento local::
- Almacén de clonación:
git clone https://github.com/supabase-community/babelfish.ai.git
- Vaya al catálogo de proyectos:
cd babelfish.ai
- Copie el archivo de variables de entorno:
cp .env.local.example .env.local
- Configuración de las credenciales de Supabase: En la ventana
.env.local
Introduzca sus credenciales de Supabase en el archivo. - Instale la dependencia:
npm install
- Ejecute el servidor de desarrollo:
npm run dev
- Abra su navegador para acceder a
http://localhost:3000
Disponible.
- Almacén de clonación:
- Despliegue en páginas de GitHub::
- Configura tus secretos en los ajustes de tu repositorio de GitHub.
- Empuje el código a la
main
GitHub Actions se despliega automáticamente en GitHub Pages.
Funciones de uso
- conversión de voz a texto en tiempo real::
- Tras abrir la aplicación, haz clic en el botón "Iniciar transcripción".
- Permite que el navegador acceda al micrófono y empieza a hablar.
- Los contenidos de voz se muestran como texto en tiempo real.
- traducción en tiempo real::
- Durante el proceso de transcripción, se selecciona la lengua de destino.
- El texto transcrito se traduce automáticamente al idioma seleccionado y se muestra en la interfaz.
- Difusión multicliente::
- Los clientes suscritos pueden recibir contenidos transcritos y traducidos a través de Supabase Realtime.
- Abre la aplicación en otro dispositivo e inicia sesión en la misma cuenta de Supabase para sincronizar los contenidos que recibes.
Configuración avanzada
- Modelos personalizados: se encuentran en la
translationWorker.js
se sustituye por otro modelo de traducción compatible. - Personalización de la interfazModificación
index.html
responder cantandosrc
Las fichas del catálogo pueden personalizarse con interfaces y funciones de aplicación.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...