Kokoro-ONNX: 다국어 및 다중 음성을 지원하는 효율적인 텍스트 음성 변환 도구

최신 AI 리소스7개월 전에 게시 됨 AI 공유 서클
3.2K 00

일반 소개

코코로-ONNX는 ONNX 런타임을 기반으로 하는 오픈 소스 텍스트 음성 변환(TTS) 툴입니다. 효율적이고 빠른 음성 합성 솔루션을 제공하는 것을 목표로 하는 이 프로젝트는 thewh1teagle이 개발했으며, 현재 영어를 포함한 여러 언어를 지원하며 프랑스어, 일본어, 한국어, 중국어도 지원할 예정입니다. 이 도구는 속삭임 모드를 포함한 다양한 음성 선택이 가능하며, macOS M1에서 거의 실시간으로 실행할 수 있는 뛰어난 성능을 갖추고 있습니다. kokoro-ONNX는 가벼운 디자인으로 설치와 사용이 간편하여 효율적인 TTS 솔루션이 필요한 개발자와 연구자에게 적합합니다.

 

기능 목록

  • 여러 언어에 대한 텍스트 음성 변환(TTS) 지원
  • 귓속말 모드를 포함한 다양한 음성 옵션
  • 효율적인 성능, 실시간에 가까운 운영
  • 경량 디자인, 설치 패키지 약 300MB(정량화 후 약 80MB)
  • macOS M1과 호환
  • MIT 및 Apache 2.0 라이선스 기반의 오픈 소스

 

도움말 사용

설치 프로세스

  1. 터미널(PowerShell/Bash)을 엽니다.
  2. 다음 명령을 실행하여 코코로-ONNX를 설치합니다:
   pip install -U kokoro-onnx
  1. 필요한 서류 다운로드kokoro-v0_19.onnx노래로 응답voices.json를 생성하여 같은 디렉토리에 배치합니다.

사용법

  1. 터미널에서 다음 명령을 실행하여 코코로-ONNX를 시작합니다:
   uv init -p 3.12
uv add kokoro-onnx soundfile
  1. 최고 사령관(군)examples/save.py의 내용을 붙여넣습니다.hello.py가운데.
  2. 파일 다운로드kokoro-v0_19.onnx노래로 응답voices.json를 생성하여 같은 디렉토리에 배치합니다.
  3. 다음 명령을 실행하여 음성을 생성합니다:
   python hello.py

기능 작동 흐름

  1. 언어 및 음성 선택: invoices.json에서 원하는 언어와 음성을 선택합니다.
  2. 입력 텍스트: inhello.py에 음성으로 변환할 텍스트를 입력합니다.
  3. 음성 생성: 스크립트를 실행하면 생성된 음성 파일이 지정된 디렉터리에 저장됩니다.

주요 기능

  • 다국어 지원현재 영어를 지원하고 있으며 프랑스어, 일본어, 한국어, 중국어 등 더 많은 언어를 지원할 계획입니다.
  • 다양한 사운드 옵션귓속말 모드를 포함한 다양한 음성을 선택하여 다양한 시나리오의 요구 사항을 충족할 수 있습니다.
  • 고성능빠른 응답이 필요한 애플리케이션 시나리오를 위해 macOS M1에서 거의 실시간으로 실행됩니다.
  • 경량 설계설치 패키지의 크기가 작아 배포 및 사용이 간편하고 빠르게 사용할 수 있습니다.

다음 단계에 따라 사용자는 Kokoro-ONNX를 쉽게 설치하여 효율적인 텍스트 음성 변환 기능을 사용할 수 있습니다. 자세한 작동 절차와 풍부한 기능 설명이 제공되므로 사용자는 빠르게 시작하여 도구를 최대한 활용할 수 있습니다.

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...