Voice-Pro: 오픈 소스 다기능 비디오 번역 도구, 음성 전사 및 여러 언어로의 번역, Windows 원클릭 설치
일반 소개
Voice-Pro는 음성-텍스트, 텍스트-음성, 실시간 번역, YouTube 동영상 다운로드 및 사람 목소리 분리를 지원하는 Gradio WebUI 기반의 다기능 도구입니다. 속삭임, 속삭임 및 속삭임 타임스탬프 기술을 통합하여 여러 언어와 시나리오에 대해 효율적인 오디오 처리 및 번역을 제공합니다.


기능 목록
- 음성-텍스트 변환귓속말, 속삭임, 귓속말 타임스탬프 기능을 지원하여 매우 정확한 음성 인식을 제공합니다.
- 텍스트 음성 변환다양한 언어와 음성 선택, 속도, 음량, 피치 조절을 지원하는 Edge-TTS 및 F5-TTS를 지원합니다.
- 실시간 번역실시간 음성 인식 및 여러 언어에 대한 번역을 지원합니다.
- YouTube 다운로드YouTube 동영상을 다운로드하고 오디오(mp3, wav, flac)를 추출할 수 있습니다.
- 보컬 분리MDX-Net 및 Demucs 엔진을 사용한 보컬 및 배경 사운드 분리.
- 배치 파일대량의 파일에 대한 자막 생성, 번역 및 텍스트 음성 변환 처리를 지원합니다.
- 자막 생성90개 이상의 언어로 자막 생성 및 편집을 지원합니다.
- 멀티 포맷 지원ffmpeg에서 지원하는 모든 비디오 및 오디오 형식이 지원됩니다.
도움말 사용
설치 프로세스
- 스타터 팩GitHub에서 소스 코드의 최신 버전을 복제하거나 다운로드합니다.
git clone https://github.com/abus-aikorea/voice-pro.git
- 프로그램 설치 및 실행::
- 움직여야 합니다.
configure.bat
필요한 종속성(예: git, ffmpeg 및 CUDA)을 설치합니다. - 움직여야 합니다.
start.bat
Voice-Pro를 시작하면 WebUI가 자동으로 실행됩니다. - 처음 실행하면 Voice-Pro가 먼저 설치되며, 이 과정에서 1시간 이상 소요될 수 있으므로 이 시간 동안 Windows 명령 창을 닫지 마세요.
- 움직여야 합니다.
사용 기능
- 음성-텍스트 변환::
- 스튜디오 탭에서 다음을 선택합니다. Whisper 모델 및 계산 유형
- 오디오 파일을 업로드하거나 오디오 입력 소스(예: 마이크)를 선택합니다.
- '시작' 버튼을 클릭하고 음성 인식 및 자막 생성이 완료될 때까지 기다립니다.
- 렌더링::
- 번역 탭에서 번역할 텍스트 또는 자막 파일을 업로드합니다.
- 대상 언어를 선택하고 '번역' 버튼을 클릭합니다.
- 번역이 완료되면 번역된 파일을 다운로드할 수 있습니다.
- 텍스트 음성 변환::
- TTS 탭에서 Edge-TTS 또는 F5-TTS를 선택합니다.
- 변환할 텍스트를 입력하고 음성 매개변수(예: 속도, 음량, 높낮이)를 선택합니다.
- '음성 생성' 버튼을 클릭하고 음성 생성이 완료될 때까지 기다립니다.
- YouTube 다운로드::
- YouTube 다운로더 탭에서 YouTube 동영상 링크를 입력합니다.
- 오디오 형식(mp3, wav, flac)을 선택하고 '다운로드' 버튼을 클릭합니다.
- 다운로드가 완료되면 지정된 폴더에서 오디오 파일을 찾을 수 있습니다.
- 사운드 분리::
- 보컬 리무버 탭에서 오디오 파일을 업로드합니다.
- MDX-Net 또는 Demucs 엔진을 선택하고 시작 버튼을 클릭합니다.
- 사운드 분리가 완료될 때까지 기다리면 분리된 오디오 파일을 다운로드할 수 있습니다.
- 배치 파일::
- 배치 탭에서 여러 파일을 업로드합니다.
- 원하는 작업(자막, 번역, 텍스트 음성 변환)을 선택합니다.
- '시작' 버튼을 클릭하고 일괄 처리가 완료될 때까지 기다립니다.
일반적인 문제
- 브라우저가 자동으로 실행되지 않음Windows 명령 창을 닫고 다시 실행합니다.
start.bat
를 클릭하거나 브라우저에 표시된 주소를 직접 입력합니다(예: http://127.0.0.1:7892). - CUDA 메모리 부족 오류GPU 메모리 상태를 확인하고 노이즈 감소 수준 또는 계산 유형을 조정합니다.
- 윈도우 디펜더 경고배치 파일을 예외로 추가하거나 일시적으로 Windows Defender를 비활성화합니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...