Vexa: 실시간 회의 트랜스크립션 및 지능형 지식 추출 도구

최신 AI 리소스4 개월 전에 게시 됨 AI 공유 서클
1.3K 00

일반 소개

벡사는 기업과 개인에게 효율적인 회의 녹음과 지능형 지식 추출 서비스를 제공하도록 설계된 오픈 소스 실시간 회의 녹취 및 지식 관리 플랫폼입니다. 음성을 실시간으로 텍스트로 변환하고 99개 언어를 지원하는 API 기반 회의 로봇을 통해 Google Meet, Zoom 및 기타 플랫폼에 자동으로 연결되며, 확장성이 뛰어나고 대량의 동시 전사 작업을 처리하는 데 적합한 마이크로서비스 아키텍처를 사용합니다. 엔터프라이즈급 데이터 보안을 강조하며 규정 준수를 보장하는 로컬 배포 옵션을 제공합니다. 현재 클로즈 베타 버전으로 공식 웹사이트를 통해 무료로 제공되는 Vexa는 고성능과 풍부한 기능을 결합한 엔터프라이즈급 recall.ai의 대안이 되는 것을 목표로 합니다.

Vexa:实时会议转录与智能知识提取工具

 

기능 목록

  • 실시간 회의 녹취록구글 미트, 줌, 마이크로소프트 팀 회의에 자동으로 참여하고 실시간으로 음성을 텍스트로 변환하세요.
  • 다국어 지원글로벌 팀을 위한 99개 언어의 트랜스크립션 지원.
  • 회의 로봇API를 통해 봇이 미팅에 참여하도록 제어하여 운영을 간소화하세요.
  • 지식 추출RAG(검색 증강 생성) 기술을 사용하여 트랜스크립트에서 핵심 정보를 추출하여 검색 가능한 지식창고를 생성합니다.
  • 엔터프라이즈 보안로컬 배포를 지원하고, 데이터 개인 정보를 보호하며, 규정 준수 요구 사항을 충족합니다.
  • 높은 확장성대규모 동시 전사 작업을 지원하는 마이크로서비스 아키텍처.
  • 직접 스트리밍웹 페이지 또는 모바일 앱에서 직접 오디오 캡처 지원(개발 중).
  • 오픈 소스 기여개발자는 GitHub를 통해 개발에 참여하고 기능을 확장할 수 있습니다.

 

도움말 사용

설치 및 배포

Vexa는 기술력을 갖춘 사용자 또는 기업이 로컬 배포하기에 적합한 오픈 소스 프로젝트입니다. 아래는 자세한 설치 과정입니다:

  1. 클론 창고
    터미널을 열고 다음 명령을 실행하여 Vexa 리포지토리를 복제합니다:

    git clone https://github.com/Vexa-ai/vexa.git
    cd vexa
    
  2. 하위 모듈 초기화하기
    벡사는 Git 서브모듈을 사용하여 종속성(예: services/vexa-bot 및 services/WhisperLive)을 관리합니다. 실행:

    make submodules
    
  3. 환경 변수 구성
    환경 구성 파일을 만들고 편집합니다:

    make env
    

    .env 파일에서 ADMIN_API_TOKEN(관리자 API 키)과 같은 매개변수를 설정합니다. 매개 변수를 조정합니다. Whisper 모델 경로 또는 데이터베이스 구성.

  4. 위스퍼 모델 다운로드
    벡사는 음성 녹취에 위스퍼 모델을 사용합니다. 다음 명령을 실행합니다:

    make download-model
    

    모델은 . /hub 디렉터리에 저장되고 WhisperLive 컨테이너에 마운트됩니다.

  5. 회의 로봇 거울 만들기
    벡사 로봇용 도커 이미지 빌드하기:

    docker build -t vexa-bot:latest -f services/vexa-bot/core/Dockerfile ./services/vexa-bot/core
    
  6. 서비스 시작
    Docker Compose를 사용하여 서비스를 빌드하고 실행합니다:

    docker compose build
    docker compose up -d
    

    서비스가 시작되면 API 게이트웨이는 http://localhost:8056, 관리 인터페이스는 http://localhost:8057 에서 실행됩니다.

핵심 기능 작동

실시간 회의 녹취록

벡사의 핵심 기능은 회의 로봇을 통해 회의 음성을 실시간으로 전사하는 것입니다. 절차는 다음과 같습니다:

  1. API 키 요청하기
    비공개 테스트를 위한 API 키를 요청하려면 https://api.dev.vexa.ai/pricing 을 방문하세요. 요청을 제출한 후 X-API 키를 받습니다.
  2. 로봇을 미팅에 참여하도록 보내기
    API 요청을 사용하여 봇이 미팅에 참여하도록 합니다. 예를 들어 Google Meet에 참여합니다:

    curl -X POST https://gateway.dev.vexa.ai/bots \
    -H "Content-Type: application/json" \
    -H "X-API-Key: YOUR_CLIENT_API_KEY" \
    -d '{"native_meeting_id": "xxx-xxxx-xxx", "platform": "google_meet"}'
    

    성공하면 미팅_id와 로봇 상태가 포함된 JSON이 반환됩니다.

  3. 트랜스크립션 데이터에 액세스
    세션 ID를 사용하여 녹취록을 받습니다:

    curl -H "X-API-Key: YOUR_CLIENT_API_KEY" \
    https://gateway.dev.vexa.ai/transcripts/google_meet/xxx-xxxx-xxx
    

    예제로 돌아가기:

    {
    "data": {
    "meeting_id": "meet_abc123",
    "transcripts": [
    {"time": "00:01:15", "speaker": "John Smith", "text": "Let's discuss the quarterly results."},
    {"time": "00:01:23", "speaker": "Sarah Johnson", "text": "The Q3 revenue exceeded our projections by 15%."}
    ]
    }
    }
    

다국어 지원

벡사는 99개 언어의 실시간 트랜스크립션을 지원합니다. 설정 방법:

  • .env 파일에 언어를 지정합니다(예: LANGUAGE=en).
  • API 요청에 언어 매개변수를 추가합니다:
    curl -X POST -H "Content-Type: application/octet-stream" \
    -d '{"language": "es"}' \
    http://localhost:8033/
    

    시스템이 지정된 언어로 회의를 자동으로 트랜스크립트합니다.

지식 추출

벡사의 RAG 함수는 트랜스크립트에서 주요 정보를 추출하여 구조화된 지식창고를 생성합니다:

  1. 기술 자료 보기
    생성된 지식창고 항목은 관리 인터페이스(http://localhost:8057) 또는 API를 통해 액세스할 수 있습니다.
  2. 정보 검색
    키워드를 사용하여 지식창고를 검색하면 RAG가 관련 회의록과 컨텍스트를 반환합니다.
  3. 데이터 내보내기
    API를 통해 지식 항목을 분석 또는 보관을 위해 JSON 또는 CSV 형식으로 내보내세요.

직접 스트리밍(개발 중)

벡사는 웹 또는 모바일 애플리케이션에서 직접 오디오를 캡처할 수 있도록 지원할 계획입니다. 사용자가 SDK 또는 API를 통해 오디오 스트림을 업로드하면 시스템이 이를 실시간으로 트랜스크립션합니다. 이 기능은 2025년에 출시될 예정입니다.

기타 기능

  • 엔터프라이즈 보안로컬로 배포된 분리된 데이터, X-Admin-API-Key를 사용하여 보호되는 관리 인터페이스. 기업은 규정 준수 요구사항에 따라 액세스 권한을 구성할 수 있습니다.
  • 높은 확장성마이크로서비스 아키텍처가 자동으로 작업을 할당합니다. 수동 개입 없이도 시스템은 수천 개의 동시 트랜스크립션을 처리할 수 있습니다.
  • 커뮤니티 기여https://github.com/Vexa-ai/vexa 를 방문하세요. 개발자는 Discord(https://discord.gg/Ga9duGkVz9)를 통해 작업을 논의하거나 코드를 제출할 수 있습니다.

주의

  • 하드웨어 요구 사항16GB RAM 및 4코어 CPU를 갖춘 NVIDIA GPU 장착 서버를 권장합니다.
  • 유지 관리 업데이트최신 기능을 얻으려면 주기적으로 git pull 및 docker compose up --build를 실행하세요.
  • 비공개 테스트API 액세스에는 키가 필요하며 사용 가능한 테스트 슬롯 수가 제한되어 있습니다.
  • 개발 진행 상황화자 인식은 개발 중이며, Microsoft Teams와 Zoom 봇은 각각 2025년 4월과 5월에 출시될 예정입니다.

 

애플리케이션 시나리오

  1. 다국적 기업 관련 컨퍼런스
    다국적 팀은 벡사를 사용하여 다국어 회의를 기록하고, 실시간으로 영어로 번역하고, 의사 결정 포인트를 추출하고, 검색 가능한 지식 기반을 생성하여 손쉽게 글로벌 협업을 진행할 수 있습니다.
  2. 프로젝트 관리
    개발팀은 기술 회의를 기록하고, 벡사는 작업 할당과 타임라인을 추출하여 자동화된 보고서를 생성하고 수동 데이터 정렬을 줄입니다.
  3. 고객 지원 최적화
    고객 서비스 팀은 고객 통화를 기록하여 일반적인 문제와 해결책을 추출하고 지식창고를 구축하여 응답 속도와 일관성을 개선합니다.
  4. 학술 연구 기록
    연구자가 인터뷰나 워크숍을 녹화하면 Vexa가 그 내용을 전사하고 분석하여 논문 작성을 지원하는 구조화된 데이터를 생성합니다.

 

QA

  1. 벡사는 어떤 플랫폼을 지원하나요?
    현재 Google Meet, Microsoft Teams 및 Zoom 봇에 대한 지원은 2025년에 제공될 예정입니다.
  2. 테스트 키는 어떻게 요청하나요?
    무료 테스트 X-API 키 요청을 제출하려면 https://api.dev.vexa.ai/pricing 을 방문하세요.
  3. 로컬 배포에는 어떤 리소스가 필요하나요?
    NVIDIA GPU, 최소 16GB RAM 및 4코어 CPU를 갖춘 서버를 권장합니다.
  4. 벡사는 실시간 번역을 지원하나요?
    현재 99개 언어가 트랜스크립션에 지원되며, 실시간 번역은 2025년에 출시될 예정입니다.
  5. 개발에 참여하려면 어떻게 해야 하나요?
    Discord(https://discord.gg/Ga9duGkVz9)에 가입하고 CONTRIBUTING.md를 확인한 후 풀 리퀘스트를 제출하세요.
© 저작권 정책
AiPPT

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...