TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

75.9K 00

일반 소개

TRV는 사용자가 슬라이드와 강의 노트를 내레이션이 포함된 동영상으로 빠르게 전환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 수신되는 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션 비디오를 빠르게 제작해야 하는 교육자, 콘텐츠 제작자 또는 개발자에게 적합합니다. 트랜스포머 팀이 개발한 이 프로젝트는 다양한 오디오 생성 모델과 형식을 지원하며, 로컬 배포 또는 온라인 서비스를 통해 사용자가 사용할 수 있습니다. TRV는 효율성과 유연성을 염두에 두고 설계되었으며, 오픈 소스 특성상 기술 애호가들이 자유롭게 기능을 사용자 지정하고 확장할 수 있습니다.

기능 목록

비디오로 슬라이드Typst 형식의 슬라이드 파일을 내레이션이 있는 동영상으로 변환합니다.
자동 오디오 생성여러 음성 모델과 스타일을 지원하는 텍스트 기반 음성 생성.
멀티 포맷 지원출력 오디오는 WAV 및 기타 형식을 지원하며, 동영상은 MP4를 지원합니다.
여러 서비스 제공업체와의 호환성OpenAI, DeepInfra 등과 같은 서비스에 연결하여 오디오를 생성합니다.
사용자 지정 구성해상도, 음성 스타일 및 기타 매개변수 조정 지원.
도커 지원신속한 로컬 배포를 위해 Docker 이미지가 제공됩니다.
세로 및 가로 화면 적응YouTube 쇼트와 같은 플랫폼에 적합한 세로형 동영상 생성을 지원합니다.

도움말 사용

설치 프로세스

TRV는 설치 및 사용에 약간의 기술력이 필요한 명령줄 도구입니다. 자세한 설치 단계는 다음과 같습니다:

1. 전제 조건

시스템 요구 사항macOS, Linux 또는 Windows 지원(명령줄 환경 필요).
종속 도구::
- Git: 코드 리포지토리를 복제하는 데 사용됩니다.
- Docker(선택 사항): 컨테이너화된 배포용.
- Python(선택 사항): 일부 종속성을 수동으로 설치하는 경우.
네트워크 연결일부 기능은 온라인 서비스에 액세스해야 합니다.

2. GitHub를 통해 소스 코드 가져오기

터미널을 열고 다음 명령을 입력하여 리포지토리를 복제합니다:

git clone https://github.com/transformrs/trv.git

프로젝트 카탈로그로 이동합니다:

cd trv

3. 장착 방법 선택

방법 1: Docker 사용(권장)

Docker가 설치되어 실행 중인지 확인합니다.
Docker 이미지를 빌드합니다:

docker build --rm -t trv .

컨테이너를 실행합니다:

docker run -it --rm trv

TRV 명령은 컨테이너 내에서 사용할 수 있습니다.

모드 2: 수동 설치(로컬 환경)

필요한 종속성(예: 시스템에 따라 FFmpeg, Typst 등)을 설치합니다.
환경 변수 및 도구는 GitHub 페이지의 지침에 따라 구성합니다.
TRV 실행 파일을 직접 실행합니다(사전 빌드된 버전의 컴파일 또는 다운로드 필요).

4. 서비스 키 구성(선택 사항)

딥인프라 또는 다른 온라인 서비스를 사용하여 오디오를 생성하는 경우 API 키를 구성해야 합니다:

키 가져오기(예: DeepInfra의 DEEPINFRA_KEY).
터미널에서 환경 변수를 설정합니다:

export DEEPINFRA_KEY="你的密钥"

사용법

TRV의 핵심 기능은 슬라이드 파일을 동영상으로 변환하는 것이며, 구체적인 작동 절차는 다음과 같습니다:

1. 입력 문서 준비

Typst 형식의 데모 파일을 만듭니다(예 presentation.typ), 슬라이드 콘텐츠와 프레젠테이션 노트가 포함되어 있습니다.
파일 내용 예시:

#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示，欢迎体验 TRV 的自动化功能。]

2. 동영상 생성

기본 명령::

trv --input=presentation.typ --output=out.mp4

이렇게 하면 기본 구성의 동영상 파일이 생성됩니다. out.mp4.

온라인 서비스 사용::

trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav

코코로스 서비스를 사용하여 WAV 오디오를 생성하고 동영상을 합성할 수 있습니다.

딥인프라 사용::

trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male

설정했는지 확인해야 합니다. DEEPINFRA_KEY.

3. 사용자 지정 설정

해상도 조정::
세로 화면 동영상(예: YouTube 쇼트)의 경우 이를 설정할 수 있습니다:

trv --input=presentation.typ --page=1080x1920

음성 스타일 선택::
명확하고 확실하게 표시 --voice 매개 변수에 american_male 어쩌면 bm_lewis서비스 지원에 따라 다릅니다.

4. 출력 보기

생성된 동영상은 기본값으로 _out/out.mp4(경로는 다음을 통해 사용할 수 있습니다. --output (지정).
로그 메시지를 확인하여 각 슬라이드의 오디오 및 비디오 클립이 올바르게 생성되었는지 확인합니다.

주요 기능 작동

자동 오디오 생성

프레젠테이션을 위한 메모를 작성하면 TRV가 메모에서 음성을 생성합니다.
통과(청구서 또는 검사 등) --model 음성 모델 지정(예 tts-1)를 통해 --voice 톤을 선택합니다.
예시:

trv --input=presentation.typ --model=tts-1 --voice=bm_lewis

출력 대역 bm_lewis 보이스오버 비디오의 톤.

로컬에서 실행되는 Docker

Docker 컨테이너 내부에서 실행됩니다:

docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ

-v 매개변수는 로컬 디렉터리를 마운트하여 파일에 액세스할 수 있도록 합니다.

세로 화면 비디오 제작

페이지 크기를 1080x1920으로 설정합니다:

trv --input=presentation.typ --page=1080x1920

짧은 동영상 플랫폼에 적합한 MP4 파일을 출력합니다.

주의

파일 형식입력은 Typst 파일이어야 하며, Typst에 익숙하지 않은 경우 공식 문서를 참조하세요.
네트워크 종속성온라인 서비스에는 안정적인 네트워크가 필요하며 로컬 테스트에는 Docker를 사용하는 것이 좋습니다.
하드웨어 요구 사항고급 모델(예: 지프라 조노스)을 사용하는 경우 8GB의 VRAM 또는 클라우드 서비스를 권장합니다.

위의 단계를 통해 사용자는 TRV를 빠르게 시작하여 슬라이드를 전문적인 동영상으로 변환하고 콘텐츠 제작의 효율성을 높일 수 있습니다.

Cloudworld AI: 이미지 생성 도구를 무료로 사용하여 고품질의 AI 그림을 빠르게 만들 수 있습니다(만료).

최신 AI 리소스 # AI 온라인 이미지 생성

1 년 전

047.1K

self.so: 클릭 한 번으로 멋진 이력서 페이지를 생성하세요!

11개월 전

049.7K

Auto-Coder.Chat：基于终端命令行的AI辅助编程助手，提供VSCode插件

Auto-Coder.Chat: 터미널 명령줄 기반 AI 지원 프로그래밍 도우미(VSCode 플러그인 포함)

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

11개월 전

048.2K

Flot AI: 쓰기, 읽기 및 기억의 효율성을 향상시키는 AI 보조 도구이자 모든 인터페이스에서 선택한 콘텐츠를 불러오는 도구입니다.

최신 AI 리소스 # AI 통합 다중 모델 대화 플랫폼

1 년 전

050.9K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

지금 로그인

댓글 없음...

TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

일반 소개

기능 목록

도움말 사용

설치 프로세스

1. 전제 조건

2. GitHub를 통해 소스 코드 가져오기

3. 장착 방법 선택

4. 서비스 키 구성(선택 사항)

사용법

1. 입력 문서 준비

2. 동영상 생성

3. 사용자 지정 설정

4. 출력 보기

주요 기능 작동

자동 오디오 생성

로컬에서 실행되는 Docker

세로 화면 비디오 제작

주의

Cardog: 차량 정보 조사 및 자동차 시장 데이터의 지능형 분석

arXiv 논문 시각화 도구: arXiv 논문 추천 및 시각적 해석

관련 문서

Cloudworld AI: 이미지 생성 도구를 무료로 사용하여 고품질의 AI 그림을 빠르게 만들 수 있습니다(만료).

self.so: 클릭 한 번으로 멋진 이력서 페이지를 생성하세요!

Auto-Coder.Chat: 터미널 명령줄 기반 AI 지원 프로그래밍 도우미(VSCode 플러그인 포함)

Flot AI: 쓰기, 읽기 및 기억의 효율성을 향상시키는 AI 보조 도구이자 모든 인터페이스에서 선택한 콘텐츠를 불러오는 도구입니다.

댓글 없음

최신 컬렉션

최신 기사

TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

일반 소개

기능 목록

도움말 사용

설치 프로세스

1. 전제 조건

2. GitHub를 통해 소스 코드 가져오기

3. 장착 방법 선택

4. 서비스 키 구성(선택 사항)

사용법

1. 입력 문서 준비

2. 동영상 생성

3. 사용자 지정 설정

4. 출력 보기

주요 기능 작동

자동 오디오 생성

로컬에서 실행되는 Docker

세로 화면 비디오 제작

주의

Cardog: 차량 정보 조사 및 자동차 시장 데이터의 지능형 분석

arXiv 논문 시각화 도구: arXiv 논문 추천 및 시각적 해석

관련 문서

Cloudworld AI: 이미지 생성 도구를 무료로 사용하여 고품질의 AI 그림을 빠르게 만들 수 있습니다(만료).

self.so: 클릭 한 번으로 멋진 이력서 페이지를 생성하세요!

Auto-Coder.Chat: 터미널 명령줄 기반 AI 지원 프로그래밍 도우미(VSCode 플러그인 포함)

Flot AI: 쓰기, 읽기 및 기억의 효율성을 향상시키는 AI 보조 도구이자 모든 인터페이스에서 선택한 콘텐츠를 불러오는 도구입니다.

댓글 없음

선택한 AI 도구

최신 컬렉션

최신 기사