Reunión: transcripción local en tiempo real y generación de actas de reunión del cliente de código abierto
Últimos recursos sobre IAActualizado hace 5 meses Círculo de intercambio de inteligencia artificial 1.5K 00
Introducción general
Meeting Minutes (también conocida como Meetily) es una herramienta gratuita y de código abierto desarrollada por Zackriya Solutions que se centra en la captura de audio de reuniones en tiempo real, la generación de texto transcrito y la extracción automática de resúmenes de reuniones. La herramienta se ejecuta de forma totalmente local en macOS y Windows (la compatibilidad con Linux está en desarrollo), sin necesidad de servidores externos, lo que garantiza la privacidad y seguridad de los datos de los usuarios. Es compatible con las principales plataformas de reuniones, como Google Meet, Zoom y Microsoft Teams, y cuenta con una función de SusurroMotor de transcripción .cpp y soporte múltiple de Large Language Model (LLM) para la colaboración en equipo y usuarios profesionales que necesitan proteger información sensible. Desde marzo de 2025, la última versión es v0.0.3 pre-release, ya 1000+ starred en GitHub y licenciada bajo la licencia MIT.


Lista de funciones
- Captura de audio en tiempo real: Admite la captura del contenido de la conferencia desde el micrófono y el audio del sistema para una amplia gama de plataformas de conferencia.
- transcripción en tiempo realConvierte audio a texto desde un modelo Whisper.cpp ejecutado de forma nativa, con soporte para múltiples tamaños de modelo (de pequeño a grande).
- Generación automática de resúmenesUtilización del LLM (por ejemplo, antrópico, Groq o local) Ollama (Modelización) Análisis del contenido transcrito para extraer los puntos clave, los elementos de acción y las decisiones.
- procesamiento localEl tratamiento de datos se realiza en el dispositivo del usuario sin necesidad de conexión a Internet, lo que garantiza la privacidad.
- búsqueda semánticaRecuperación inteligente de contenidos históricos de conferencias mediante el almacenamiento vectorial y el grafo de conocimiento ChromaDB.
- Soporte multiplataformaLas aplicaciones empaquetadas están disponibles para macOS y Windows, y pronto lo estarán para Linux.
- Función de exportación (en desarrollo)Soporte para exportar transcripciones y resúmenes a formatos Markdown, PDF y HTML.
- modernización: Proporciona una interfaz de usuario receptiva con actualizaciones en tiempo real del contenido de la transcripción y el resumen.
Utilizar la ayuda
Proceso de instalación
Meeting Minutes es una herramienta autoalojada que requiere que el usuario complete la instalación del front-end y del back-end en un dispositivo local. A continuación se detallan los pasos basados en la versión de pre-lanzamiento v0.0.3:
condiciones previas
- sistema operativomacOS o Windows (compatibilidad con Linux en desarrollo).
- dependencia del software::
- adelantar parte de algo: No se requieren dependencias adicionales, basta con utilizar el instalador precompilado.
- parte trasera::
- Python 3.10 a 3.12.
- FFmpeg (procesamiento de audio).
- CMake y compilador C++ (build Whisper.cpp).
- Los usuarios de Windows deben instalar Visual Studio Build Tools (con cargas de trabajo de desarrollo C++).
- requisitos de hardwareSe recomiendan 8 GB de RAM o más, un procesador multinúcleo y compatibilidad con la aceleración por GPU para mejorar el rendimiento.
Pasos de la instalación
1. Instalación del front-end
El front-end proporciona paquetes de instalación precompilados para Windows y macOS, que pueden descargarse e instalarse directamente.
Instalación en Windows
- Descargar el paquete de instalación: Acceso v0.0.3 Página de versionesSeleccione uno de los siguientes documentos:
- Opción 1 (recomendada)::
meeting-minutes-frontend_0.1.0_x64-setup.exe
. - Opción 2::
meeting-minutes-frontend_0.1.0_x64_en-US.msi
.
- Opción 1 (recomendada)::
- Ejecutar el instalador::
- Haga doble clic en el archivo
.exe
tal vez.msi
Documentación. - Windows mostrará el mensaje "Windows Protege tu Ordenador" que dice "Microsoft Defender SmartScreen está bloqueando aplicaciones no reconocidas":
- Haga clic en "Más información".
- Selecciona "Sigue funcionando".
- Si sigue sin ejecutarse, haz clic con el botón derecho en el archivo de instalación:
- Seleccione Propiedades.
- Marque la casilla "Desbloquear" en la parte inferior y haga clic en "Aceptar".
- Siga el asistente de instalación para completar la instalación y la aplicación aparecerá en el escritorio.
- Haga doble clic en el archivo
- Otorgamiento de poderesPermitir permisos de micrófono y captura de audio en la primera ejecución.
Instalación en macOS
- Descargar el paquete de instalación: De v0.0.3 Página de versiones descargando
dmg_darwin_arch64.zip
. - Pasos de la instalación::
- descompresión (en tecnología digital)
dmg_darwin_arch64.zip
consigameeting-minutes-frontend_0.1.0_aarch64.dmg
. - doble clic
.dmg
Documentación. - comandante en jefe (militar)
meeting-minutes-frontend.app
Arrastre a la carpeta Aplicaciones. - Ejecute el siguiente comando en un terminal para eliminar el atributo de cuarentena:
xattr -c /Applications/meeting-minutes-frontend.app
- descompresión (en tecnología digital)
- Otorgamiento de poderesPermitir permisos de micrófono y captura de audio en la primera ejecución.
2. Instalación del back-end
El back-end necesita ser desplegado manualmente, aquí están los pasos completos:
- almacén de clones
git clone https://github.com/Zackriya-Solutions/meeting-minutes.git
cd meeting-minutes/backend
- Instalación de dependencias predecesoras
- macOS::
- Instala FFmpeg a través de Homebrew:
brew install ffmpeg
. - Instala CMake:
brew install cmake
.
- Instala FFmpeg a través de Homebrew:
- Windows (ordenador)::
- Instala FFmpeg con Chocolatey:
choco install ffmpeg
. - Instale Visual Studio Build Tools (con cargas de trabajo C++).
- Asegúrese de que Python 3.10+ está añadido al PATH.
- Instala FFmpeg con Chocolatey:
- Configurar variables de entorno (opcional)
Si utiliza Antrópico tal vez Groq LLM, es necesario crear el.env
y añada la clave API:
- Coge la llave:
- Antrópico: https://www.anthropic.com/.
- Groq: https://console.groq.com/.
- Configuración:
- macOS:
echo -e "ANTHROPIC_API_KEY=your_api_key\nGROQ_API_KEY=your_groq_api_key" > .env
- Windows (PowerShell):
"ANTHROPIC_API_KEY=your_api_key`nGROQ_API_KEY=your_groq_api_key" | Out-File -FilePath .env -Encoding utf8
- macOS:
- Establezca la variable de entorno Groq:
- macOS/Linux:
export GROQ_API_KEY=your_groq_api_key
- Windows (PowerShell):
$env:GROQ_API_KEY="your_groq_api_key"
- Windows (símbolo del sistema):
set GROQ_API_KEY=your_groq_api_key
- macOS/Linux:
- Construyendo Whisper.cpp
- macOS:
chmod +x build_whisper.sh
./build_whisper.sh
- Ventanas:
.\build_whisper.bat
(Si el script falla, ejecute los comandos del script manualmente)
- Inicio de los servicios de back-end
- macOS:
./clean_start_backend.sh
- Ventanas:
.\start_with_output.ps1
Utilización
Una vez finalizada la instalación, los usuarios pueden utilizar Meeting Minutes siguiendo los pasos que se indican a continuación:
1. Transcripción en tiempo real de las reuniones
- lanzar una aplicaciónHaga doble clic en la aplicación front-end de su escritorio o ejecute el servicio back-end.
- Selección de la fuente de audio: Selecciona "Micrófono" o "Audio del sistema" en la interfaz.
- Iniciar grabaciónHaga clic en el botón "Inicio" y la transcripción en directo aparecerá en la interfaz.
- Parar y ahorrarPulse "Detener" al final de la reunión y la transcripción se guardará automáticamente a nivel local.
2. Generación de resúmenes de reuniones
- Configuración de LLM: Seleccione el modelo local o el servicio externo en la configuración (obligatorio)
.env
(Configuración). Se recomiendan los modelos con parámetros 32B o superiores. - Generar un resumenHaga clic en "Generar resumen" cuando termine la transcripción para ver los puntos clave, las acciones y las decisiones.
- Guardar resultadosActualmente se guarda como archivo local. La función de exportación (Markdown/PDF) está en desarrollo.
3. Búsqueda semántica
- Ver historialHaga clic en "Historial" para ver las reuniones guardadas.
- Buscar contenidoIntroduzca una palabra clave y la herramienta le devolverá el fragmento correspondiente.
- Saltar a la vistaHaga clic en los resultados para ver los detalles.
habilidad operativa
- Mejorar la calidad de la transcripción: Para utilizar un micrófono claro, seleccione la versión grande del modelo Whisper.
- optimizar el rendimientoSi no tienes suficiente hardware, utiliza la API de Groq para acelerar las cosas.
- compatibilidadAjuste el dispositivo de entrada de audio en el software de conferencia.
advertencia
- Problemas conocidos::
- Los LLM más pequeños (<32B parámetros) tienen menor calidad de resumen.
- CMake y C++ son necesarios para las compilaciones backend, y la configuración inicial es complicada.
- adyuvante: Las preguntas pueden responderse a través del Discordia o GitHub Feedback.
© declaración de copyright
El artículo está protegido por derechos de autor y no debe reproducirse sin autorización.
Artículos relacionados
Sin comentarios...