LiberSonora：オーディオブック字幕抽出と多言語翻訳、オーディオブックの多言語書き起こし

48.9K 00

はじめに

LiberSonoraは、「自由な音」を意味し、インテリジェントな字幕抽出、AIタイトル生成、GPUアクセラレーションによる多言語翻訳をサポートする強力なAI対応オープンソースオーディオブックツールセットです。このツールセットは、インテリジェントな字幕抽出、AIタイトル生成、多言語翻訳などをサポートし、GPUアクセラレーションによるバッチオフライン処理が可能です。LiberSonoraは、モジュール設計と柔軟なカスタマイズにより、ユーザーに効率的で便利なオーディオブック制作体験を提供するように設計されています。個人ユーザーも企業ユーザーも、LiberSonoraで簡単にオーディオブックコンテンツを作成・管理できます。

機能一覧

インテリジェント字幕抽出オーディオから自動的に字幕を抽出し、多言語をサポートします。
AIタイトル生成内容に応じて適切な見出しをつけ、訴求力を高める。
多言語翻訳グローバルユーザーのために多言語の翻訳をサポートします。
GPUアクセラレーションGPUによる高速処理で処理効率を向上。
バッチオフライン処理オーディオファイルのバッチ処理をサポートし、オフラインで動作し、ユーザーのプライバシーを保護します。
モジュール設計ユーザーは、必要に応じて機能モジュールを選択し、カスタマイズすることができます。
柔軟なカスタマイズユーザーのニーズに合わせて機能をカスタマイズし、拡張することをサポートします。

ヘルプの使用

設置プロセス

環境準備::
- GitとPython 3.8以上がインストールされていることを確認してください。
- 必要な依存ライブラリをインストールする：pip install -r requirements.txt.
クローン倉庫::

   git clone https://github.com/LiberSonora/LiberSonora.git
cd LiberSonora

設定環境::
- 必要に応じて設定ファイルを修正するconfig.yamlGPUアクセラレーション、言語オプション、その他のパラメータを設定します。
ランニングプログラム::

   python main.py

機能操作の流れ

インテリジェント字幕抽出::
- オーディオファイルを指定したディレクトリに置く。
- 字幕抽出モジュールを実行する：python extract_subtitles.py --input_dir ./audio_files --output_dir ./subtitles.
- 抽出された字幕ファイルは./subtitlesカタログ
AIタイトル生成::
- タイトル生成モジュールを実行する：python generate_titles.py --input_dir ./subtitles --output_dir ./titles.
- 生成されたヘッダーファイルは./titlesカタログ
多言語翻訳::
- 翻訳モジュールを実行する：python translate.py --input_dir ./subtitles --output_dir ./translated_subtitles --target_lang zh.
- 翻訳された字幕ファイルは./translated_subtitlesカタログ
バッチオフライン処理::
- 複数のオーディオファイルを指定されたディレクトリに配置します。
- バッチ処理スクリプトを実行する：python batch_process.py --input_dir ./audio_files --output_dir ./processed_files.
- 処理されたファイルは./processed_filesカタログ
モジュラー設計と柔軟なカスタマイズ::
- ユーザーは必要に応じて、各モジュールのコードを変更したり拡張したりすることができる。
- 機能のカスタマイズや拡張については、プロジェクトのドキュメントやサンプルコードを参照してください。