TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

최신 AI 리소스게시됨 6 개월 전 AI 공유 서클
1.3K 00

일반 소개

TRV는 사용자가 슬라이드와 강의 노트를 내레이션이 포함된 동영상으로 빠르게 전환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 수신되는 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션 비디오를 빠르게 제작해야 하는 교육자, 콘텐츠 제작자 또는 개발자에게 적합합니다. 트랜스포머 팀이 개발한 이 프로젝트는 다양한 오디오 생성 모델과 형식을 지원하며, 로컬 배포 또는 온라인 서비스를 통해 사용자가 사용할 수 있습니다. TRV는 효율성과 유연성을 염두에 두고 설계되었으며, 오픈 소스 특성상 기술 애호가들이 자유롭게 기능을 사용자 지정하고 확장할 수 있습니다.

TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

 

기능 목록

  • 비디오로 슬라이드Typst 형식의 슬라이드 파일을 내레이션이 있는 동영상으로 변환합니다.
  • 자동 오디오 생성여러 음성 모델과 스타일을 지원하는 텍스트 기반 음성 생성.
  • 멀티 포맷 지원출력 오디오는 WAV 및 기타 형식을 지원하며, 동영상은 MP4를 지원합니다.
  • 여러 서비스 제공업체와의 호환성OpenAI, DeepInfra 등과 같은 서비스에 연결하여 오디오를 생성합니다.
  • 사용자 지정 구성해상도, 음성 스타일 및 기타 매개변수 조정 지원.
  • 도커 지원신속한 로컬 배포를 위해 Docker 이미지가 제공됩니다.
  • 세로 및 가로 화면 적응YouTube 쇼트와 같은 플랫폼에 적합한 세로형 동영상 생성을 지원합니다.

 

도움말 사용

설치 프로세스

TRV는 설치 및 사용에 약간의 기술력이 필요한 명령줄 도구입니다. 자세한 설치 단계는 다음과 같습니다:

1. 전제 조건

  • 시스템 요구 사항macOS, Linux 또는 Windows 지원(명령줄 환경 필요).
  • 종속 도구::
    • Git: 코드 리포지토리를 복제하는 데 사용됩니다.
    • Docker(선택 사항): 컨테이너화된 배포용.
    • Python(선택 사항): 일부 종속성을 수동으로 설치하는 경우.
  • 네트워크 연결일부 기능은 온라인 서비스에 액세스해야 합니다.

2. GitHub를 통해 소스 코드 가져오기

  1. 터미널을 열고 다음 명령을 입력하여 리포지토리를 복제합니다:
git clone https://github.com/transformrs/trv.git
  1. 프로젝트 카탈로그로 이동합니다:
cd trv

3. 장착 방법 선택

  • 방법 1: Docker 사용(권장)
  1. Docker가 설치되어 실행 중인지 확인합니다.
  2. Docker 이미지를 빌드합니다:
docker build --rm -t trv .
  1. 컨테이너를 실행합니다:
docker run -it --rm trv
  1. TRV 명령은 컨테이너 내에서 사용할 수 있습니다.
  • 모드 2: 수동 설치(로컬 환경)
  1. 필요한 종속성(예: 시스템에 따라 FFmpeg, Typst 등)을 설치합니다.
  2. 환경 변수 및 도구는 GitHub 페이지의 지침에 따라 구성합니다.
  3. TRV 실행 파일을 직접 실행합니다(사전 빌드된 버전의 컴파일 또는 다운로드 필요).

4. 서비스 키 구성(선택 사항)

딥인프라 또는 다른 온라인 서비스를 사용하여 오디오를 생성하는 경우 API 키를 구성해야 합니다:

  1. 키 가져오기(예: DeepInfra의 DEEPINFRA_KEY).
  2. 터미널에서 환경 변수를 설정합니다:
export DEEPINFRA_KEY="你的密钥"

사용법

TRV의 핵심 기능은 슬라이드 파일을 동영상으로 변환하는 것이며, 구체적인 작동 절차는 다음과 같습니다:

1. 입력 문서 준비

  • Typst 형식의 데모 파일을 만듭니다(예 presentation.typ), 슬라이드 콘텐츠와 프레젠테이션 노트가 포함되어 있습니다.
  • 파일 내용 예시:
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]

2. 동영상 생성

  • 기본 명령::
trv --input=presentation.typ --output=out.mp4

이렇게 하면 기본 구성의 동영상 파일이 생성됩니다. out.mp4.

  • 온라인 서비스 사용::
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav

코코로스 서비스를 사용하여 WAV 오디오를 생성하고 동영상을 합성할 수 있습니다.

  • 딥인프라 사용::
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male

설정했는지 확인해야 합니다. DEEPINFRA_KEY.

3. 사용자 지정 설정

  • 해상도 조정::
    세로 화면 동영상(예: YouTube 쇼트)의 경우 이를 설정할 수 있습니다:
trv --input=presentation.typ --page=1080x1920
  • 음성 스타일 선택::
    명확하고 확실하게 표시 --voice 매개 변수에 american_male 어쩌면 bm_lewis서비스 지원에 따라 다릅니다.

4. 출력 보기

  • 생성된 동영상은 기본값으로 _out/out.mp4(경로는 다음을 통해 사용할 수 있습니다. --output (지정).
  • 로그 메시지를 확인하여 각 슬라이드의 오디오 및 비디오 클립이 올바르게 생성되었는지 확인합니다.

주요 기능 작동

자동 오디오 생성

  1. 프레젠테이션을 위한 메모를 작성하면 TRV가 메모에서 음성을 생성합니다.
  2. 통과(청구서 또는 검사 등) --model 음성 모델 지정(예 tts-1)를 통해 --voice 톤을 선택합니다.
  3. 예시:
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis

출력 대역 bm_lewis 보이스오버 비디오의 톤.

로컬에서 실행되는 Docker

  1. Docker 컨테이너 내부에서 실행됩니다:
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
  1. -v 매개변수는 로컬 디렉터리를 마운트하여 파일에 액세스할 수 있도록 합니다.

세로 화면 비디오 제작

  1. 페이지 크기를 1080x1920으로 설정합니다:
trv --input=presentation.typ --page=1080x1920
  1. 짧은 동영상 플랫폼에 적합한 MP4 파일을 출력합니다.

주의

  • 파일 형식입력은 Typst 파일이어야 하며, Typst에 익숙하지 않은 경우 공식 문서를 참조하세요.
  • 네트워크 종속성온라인 서비스에는 안정적인 네트워크가 필요하며 로컬 테스트에는 Docker를 사용하는 것이 좋습니다.
  • 하드웨어 요구 사항고급 모델(예: 지프라 조노스)을 사용하는 경우 8GB의 VRAM 또는 클라우드 서비스를 권장합니다.

위의 단계를 통해 사용자는 TRV를 빠르게 시작하여 슬라이드를 전문적인 동영상으로 변환하고 콘텐츠 제작의 효율성을 높일 수 있습니다.

© 저작권 정책
AiPPT

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...