일반 소개
코코로-ONNX는 ONNX 런타임을 기반으로 하는 오픈 소스 텍스트 음성 변환(TTS) 툴입니다. 효율적이고 빠른 음성 합성 솔루션을 제공하는 것을 목표로 하는 이 프로젝트는 thewh1teagle이 개발했으며, 현재 영어를 포함한 여러 언어를 지원하며 프랑스어, 일본어, 한국어, 중국어도 지원할 예정입니다. 이 도구는 속삭임 모드를 포함한 다양한 음성 선택이 가능하며, macOS M1에서 거의 실시간으로 실행할 수 있는 뛰어난 성능을 갖추고 있습니다. kokoro-ONNX는 가벼운 디자인으로 설치와 사용이 간편하여 효율적인 TTS 솔루션이 필요한 개발자와 연구자에게 적합합니다.
기능 목록
- 여러 언어에 대한 텍스트 음성 변환(TTS) 지원
- 귓속말 모드를 포함한 다양한 음성 옵션
- 효율적인 성능, 실시간에 가까운 운영
- 경량 디자인, 설치 패키지 약 300MB(정량화 후 약 80MB)
- macOS M1과 호환
- MIT 및 Apache 2.0 라이선스 기반의 오픈 소스
도움말 사용
설치 프로세스
- 터미널(PowerShell/Bash)을 엽니다.
- 다음 명령을 실행하여 코코로-ONNX를 설치합니다:
pip install -U kokoro-onnx
- 필요한 서류 다운로드
kokoro-v0_19.onnx
노래로 응답voices.json
를 생성하여 같은 디렉토리에 배치합니다.
사용법
- 터미널에서 다음 명령을 실행하여 코코로-ONNX를 시작합니다:
uv init -p 3.12
uv add kokoro-onnx soundfile
- 최고 사령관(군)
examples/save.py
의 내용을 붙여넣습니다.hello.py
가운데. - 파일 다운로드
kokoro-v0_19.onnx
노래로 응답voices.json
를 생성하여 같은 디렉토리에 배치합니다. - 다음 명령을 실행하여 음성을 생성합니다:
python hello.py
기능 작동 흐름
- 언어 및 음성 선택: in
voices.json
에서 원하는 언어와 음성을 선택합니다. - 입력 텍스트: in
hello.py
에 음성으로 변환할 텍스트를 입력합니다. - 음성 생성: 스크립트를 실행하면 생성된 음성 파일이 지정된 디렉터리에 저장됩니다.
주요 기능
- 다국어 지원현재 영어를 지원하고 있으며 프랑스어, 일본어, 한국어, 중국어 등 더 많은 언어를 지원할 계획입니다.
- 다양한 사운드 옵션귓속말 모드를 포함한 다양한 음성을 선택하여 다양한 시나리오의 요구 사항을 충족할 수 있습니다.
- 고성능빠른 응답이 필요한 애플리케이션 시나리오를 위해 macOS M1에서 거의 실시간으로 실행됩니다.
- 경량 설계설치 패키지의 크기가 작아 배포 및 사용이 간편하고 빠르게 사용할 수 있습니다.
다음 단계에 따라 사용자는 Kokoro-ONNX를 쉽게 설치하여 효율적인 텍스트 음성 변환 기능을 사용할 수 있습니다. 자세한 작동 절차와 풍부한 기능 설명이 제공되므로 사용자는 빠르게 시작하여 도구를 최대한 활용할 수 있습니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...