はじめに
LiberSonoraは、「自由な音」を意味し、インテリジェントな字幕抽出、AIタイトル生成、GPUアクセラレーションによる多言語翻訳をサポートする強力なAI対応オープンソースオーディオブックツールセットです。このツールセットは、インテリジェントな字幕抽出、AIタイトル生成、多言語翻訳などをサポートし、GPUアクセラレーションによるバッチオフライン処理が可能です。LiberSonoraは、モジュール設計と柔軟なカスタマイズにより、ユーザーに効率的で便利なオーディオブック制作体験を提供するように設計されています。個人ユーザーも企業ユーザーも、LiberSonoraで簡単にオーディオブックコンテンツを作成・管理できます。
機能一覧
- インテリジェント字幕抽出オーディオから自動的に字幕を抽出し、多言語をサポートします。
- AIタイトル生成内容に応じて適切な見出しをつけ、訴求力を高める。
- 多言語翻訳グローバルユーザーのために多言語の翻訳をサポートします。
- GPUアクセラレーションGPUによる高速処理で処理効率を向上。
- バッチオフライン処理オーディオファイルのバッチ処理をサポートし、オフラインで動作し、ユーザーのプライバシーを保護します。
- モジュール設計ユーザーは、必要に応じて機能モジュールを選択し、カスタマイズすることができます。
- 柔軟なカスタマイズユーザーのニーズに合わせて機能をカスタマイズし、拡張することをサポートします。
ヘルプの使用
設置プロセス
- 環境準備::
- GitとPython 3.8以上がインストールされていることを確認してください。
- 必要な依存ライブラリをインストールする:
pip install -r requirements.txt
.
- クローン倉庫::
git clone https://github.com/LiberSonora/LiberSonora.git
cd LiberSonora
- 設定環境::
- 必要に応じて設定ファイルを修正する
config.yaml
GPUアクセラレーション、言語オプション、その他のパラメータを設定します。
- 必要に応じて設定ファイルを修正する
- ランニングプログラム::
python main.py
機能 操作の流れ
- インテリジェント字幕抽出::
- オーディオファイルを指定したディレクトリに置く。
- 字幕抽出モジュールを実行する:
python extract_subtitles.py --input_dir ./audio_files --output_dir ./サブタイトル
. - 抽出された字幕ファイルは
./字幕
カタログ
- AIタイトル生成::
- タイトル生成モジュールを実行する:
python generate_titles.py --input_dir ./subtitles --output_dir ./titles
. - 生成されたヘッダーファイルは
./タイトル
カタログ
- タイトル生成モジュールを実行する:
- 多言語翻訳::
- 翻訳モジュールを実行する:
python translate.py --input_dir ./subtitles --output_dir ./translated_subtitles ---target_lang zh
. - 翻訳された字幕ファイルは
./翻訳された字幕
カタログ
- 翻訳モジュールを実行する:
- バッチオフライン処理::
- 複数のオーディオファイルを指定されたディレクトリに配置します。
- バッチ処理スクリプトを実行する:
python batch_process.py --input_dir ./audio_files --output_dir ./processed_files
. - 処理されたファイルは
./処理済みファイル
カタログ
- モジュラー設計と柔軟なカスタマイズ::
- ユーザーは必要に応じて、各モジュールのコードを変更したり拡張したりすることができる。
- 機能のカスタマイズや拡張については、プロジェクトのドキュメントやサンプルコードを参照してください。