일반 소개
TRV는 사용자가 슬라이드와 강의 노트를 내레이션이 포함된 동영상으로 빠르게 전환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 수신되는 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션 비디오를 빠르게 제작해야 하는 교육자, 콘텐츠 제작자 또는 개발자에게 적합합니다. 트랜스포머 팀이 개발한 이 프로젝트는 다양한 오디오 생성 모델과 형식을 지원하며, 로컬 배포 또는 온라인 서비스를 통해 사용자가 사용할 수 있습니다. TRV는 효율성과 유연성을 염두에 두고 설계되었으며, 오픈 소스 특성상 기술 애호가들이 자유롭게 기능을 사용자 지정하고 확장할 수 있습니다.

기능 목록
- 비디오로 슬라이드Typst 형식의 슬라이드 파일을 내레이션이 있는 동영상으로 변환합니다.
- 자동 오디오 생성여러 음성 모델과 스타일을 지원하는 텍스트 기반 음성 생성.
- 멀티 포맷 지원출력 오디오는 WAV 및 기타 형식을 지원하며, 동영상은 MP4를 지원합니다.
- 여러 서비스 제공업체와의 호환성OpenAI, DeepInfra 등과 같은 서비스에 연결하여 오디오를 생성합니다.
- 사용자 지정 구성해상도, 음성 스타일 및 기타 매개변수 조정 지원.
- 도커 지원신속한 로컬 배포를 위해 Docker 이미지가 제공됩니다.
- 세로 및 가로 화면 적응YouTube 쇼트와 같은 플랫폼에 적합한 세로형 동영상 생성을 지원합니다.
도움말 사용
설치 프로세스
TRV는 설치 및 사용에 약간의 기술력이 필요한 명령줄 도구입니다. 자세한 설치 단계는 다음과 같습니다:
1. 전제 조건
- 시스템 요구 사항macOS, Linux 또는 Windows 지원(명령줄 환경 필요).
- 종속 도구::
- Git: 코드 리포지토리를 복제하는 데 사용됩니다.
- Docker(선택 사항): 컨테이너화된 배포용.
- Python(선택 사항): 일부 종속성을 수동으로 설치하는 경우.
- 네트워크 연결일부 기능은 온라인 서비스에 액세스해야 합니다.
2. GitHub를 통해 소스 코드 가져오기
- 터미널을 열고 다음 명령을 입력하여 리포지토리를 복제합니다:
git clone https://github.com/transformrs/trv.git
- 프로젝트 카탈로그로 이동합니다:
cd trv
3. 장착 방법 선택
- 방법 1: Docker 사용(권장)
- Docker가 설치되어 실행 중인지 확인합니다.
- Docker 이미지를 빌드합니다:
docker build --rm -t trv .
- 컨테이너를 실행합니다:
docker run -it --rm trv
- TRV 명령은 컨테이너 내에서 사용할 수 있습니다.
- 모드 2: 수동 설치(로컬 환경)
- 필요한 종속성(예: 시스템에 따라 FFmpeg, Typst 등)을 설치합니다.
- 환경 변수 및 도구는 GitHub 페이지의 지침에 따라 구성합니다.
- TRV 실행 파일을 직접 실행합니다(사전 빌드된 버전의 컴파일 또는 다운로드 필요).
4. 서비스 키 구성(선택 사항)
딥인프라 또는 다른 온라인 서비스를 사용하여 오디오를 생성하는 경우 API 키를 구성해야 합니다:
- 키 가져오기(예: DeepInfra의
DEEPINFRA_KEY
). - 터미널에서 환경 변수를 설정합니다:
export DEEPINFRA_KEY="你的密钥"
사용법
TRV의 핵심 기능은 슬라이드 파일을 동영상으로 변환하는 것이며, 구체적인 작동 절차는 다음과 같습니다:
1. 입력 문서 준비
- Typst 형식의 데모 파일을 만듭니다(예
presentation.typ
), 슬라이드 콘텐츠와 프레젠테이션 노트가 포함되어 있습니다. - 파일 내용 예시:
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]
2. 동영상 생성
- 기본 명령::
trv --input=presentation.typ --output=out.mp4
이렇게 하면 기본 구성의 동영상 파일이 생성됩니다. out.mp4
.
- 온라인 서비스 사용::
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav
코코로스 서비스를 사용하여 WAV 오디오를 생성하고 동영상을 합성할 수 있습니다.
- 딥인프라 사용::
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male
설정했는지 확인해야 합니다. DEEPINFRA_KEY
.
3. 사용자 지정 설정
- 해상도 조정::
세로 화면 동영상(예: YouTube 쇼트)의 경우 이를 설정할 수 있습니다:
trv --input=presentation.typ --page=1080x1920
- 음성 스타일 선택::
명확하고 확실하게 표시--voice
매개 변수에american_male
어쩌면bm_lewis
서비스 지원에 따라 다릅니다.
4. 출력 보기
- 생성된 동영상은 기본값으로
_out/out.mp4
(경로는 다음을 통해 사용할 수 있습니다.--output
(지정). - 로그 메시지를 확인하여 각 슬라이드의 오디오 및 비디오 클립이 올바르게 생성되었는지 확인합니다.
주요 기능 작동
자동 오디오 생성
- 프레젠테이션을 위한 메모를 작성하면 TRV가 메모에서 음성을 생성합니다.
- 통과(청구서 또는 검사 등)
--model
음성 모델 지정(예tts-1
)를 통해--voice
톤을 선택합니다. - 예시:
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis
출력 대역 bm_lewis
보이스오버 비디오의 톤.
로컬에서 실행되는 Docker
- Docker 컨테이너 내부에서 실행됩니다:
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
-v
매개변수는 로컬 디렉터리를 마운트하여 파일에 액세스할 수 있도록 합니다.
세로 화면 비디오 제작
- 페이지 크기를 1080x1920으로 설정합니다:
trv --input=presentation.typ --page=1080x1920
- 짧은 동영상 플랫폼에 적합한 MP4 파일을 출력합니다.
주의
- 파일 형식입력은 Typst 파일이어야 하며, Typst에 익숙하지 않은 경우 공식 문서를 참조하세요.
- 네트워크 종속성온라인 서비스에는 안정적인 네트워크가 필요하며 로컬 테스트에는 Docker를 사용하는 것이 좋습니다.
- 하드웨어 요구 사항고급 모델(예: 지프라 조노스)을 사용하는 경우 8GB의 VRAM 또는 클라우드 서비스를 권장합니다.
위의 단계를 통해 사용자는 TRV를 빠르게 시작하여 슬라이드를 전문적인 동영상으로 변환하고 콘텐츠 제작의 효율성을 높일 수 있습니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...