KrillinAI: многоязычный инструмент глобализации видео с возможностью перевода и дубляжа в один клик
Общее введение
KrillinAI - это инструмент для обработки видео с открытым исходным кодом, в котором искусственный интеллект помогает пользователям переводить видео и автоматически дублировать его. Он может начать с загрузки видео и продолжить генерировать готовые продукты для различных платформ всего за несколько кликов. Разработчики выложили код в свободный доступ на GitHub, чтобы пользователи могли скачать его и запустить локально. KrillinAI использует технологию Large Language Modelling (LLM) для обеспечения высококачественного перевода и создания субтитров. В настоящее время он поддерживает переводы на 56 языков, в том числе на китайский, английский, японский и другие. Кроме того, он настраивает форматы видео и адаптируется к таким платформам, как YouTube, TikTok и Jieyin, что позволяет создателям контента быстро создавать многоязычные видеоролики.

Список функций
- Загрузка и выгрузка видео: Поддерживает загрузку видео с YouTube, Jitterbug, Bilibili или загрузку локальных файлов.
- Точное создание субтитров: Использование Шепот Технология распознает речь и генерирует высокоточные субтитры.
- Интеллектуальное разделение субтитров: Сегментация субтитров осуществляется естественным образом с помощью большой языковой модели, сохраняя при этом семантическую целостность.
- профессиональный перевод: Перевод целых абзацев для обеспечения контекстуальной согласованности и приближения к человеческому уровню.
- Дубляж и клонирование голоса: Предоставлено CosyVoice мужской и женский дубли, или загрузить аудио-клон голоса.
- Настройка формата видео: Автоматическое создание видео в альбомной или портретной ориентации, адаптация к различным платформам.
- Замена терминов: Поддерживает замену лексики в специализированных полях одним щелчком мыши.
Использование помощи
Процесс установки
Для запуска KrillinAI необходимо установить локально, вот подробные шаги:
- Скачать файл
- Открыть https://github.com/krillinai/KrillinAI.
- Нажмите "Релизы" в правом верхнем углу страницы, чтобы загрузить подходящую версию для вашей системы (например, Windows, macOS).
- Распакуйте файлы в пустую папку.
- Конфигурационная среда
- Создайте папку в папке
config
Папка. - существовать
config
Создайте новую папку вconfig.toml
Документация. - С сайта GitHub
config-example.toml
Скопируйте содержимое вconfig.toml
, а затем заполните конфигурацию. - Самая простая конфигурация: используйте только службу OpenAI и заполните следующие поля:
[openai] apikey = "你的OpenAI API密钥" transcription_provider = "openai" llm_provider = "openai"
- Если требуется прокси или пользовательская модель, добавьте
app.proxy
возможноopenai.base_url
.
- Создайте папку в папке
- программа бега
- Windows (компьютер): Дважды щелкните исполняемый файл, чтобы запустить его.
- macOS: Требуется ручное доверие, так как он не подписан:
- Откройте терминал и перейдите в каталог файлов.
- Введите команду:
sudo x'attr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64 sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64 ./KrillinAI_1.0.0_macOS_arm64
- После запуска служба работает на
http://127.0.0.1:8888
(Порт может быть изменен).
- Развертывание Docker (опционально)
- В GitHub's
docs/docker.md
Просмотреть подробные шаги. - Установите Docker, извлеките образ и запустите его.
- В GitHub's
Работа основных функций
Перевод видео и создание субтитров
- перейти::
- После запуска службы браузер получает доступ к
http://127.0.0.1:8888
. - Введите ссылку на видео (например.
https://www.youtube.com/watch?v=xxx
) или загрузить файл. - Выберите язык ввода (например, китайский) и целевой язык (например, английский).
- Нажмите "Старт", и программа автоматически распознает речь, генерирует субтитры и переводит их.
- После запуска службы браузер получает доступ к
- в конце концов: Файлы субтитров сохраняются в
tasks
Папка. - принимать к сведению: Если загрузка не удалась, настройте параметр
cookies.txt
казаться (быть чем-л.)docs/get_cookies.md
.
функция дубляжа
- перейти::
- После того как субтитры будут созданы, нажмите на опцию "Дубляж".
- Выберите мужской или женский голос для CosyVoice или загрузите образец аудиозаписи, чтобы клонировать голос.
- Нажмите "Generate", и программа автоматически синтезирует голос за кадром.
- в конце концов: Голос за кадром и видео объединяются для создания нового файла.
- характеристика: Поддерживается межъязыковое дублирование, а звуковые дорожки и субтитры точно выровнены.
Настройка формата видео
- перейти::
- При создании видео выберите "Пейзаж" или "Портрет".
- Нажмите "Готово", и программа настроит разрешение и расположение субтитров.
- в конце концов: Выводит видео, адаптированное для YouTube (альбомный режим) или TikTok (книжный режим).
- привлекать внимание к чему-л.: Субтитры будут автоматически менять строки, если они слишком длинные, обеспечивая аккуратное изображение.
Функциональное управление
Интеллектуальное разделение субтитров
- Программа анализирует речь с помощью большой языковой модели и разбивает субтитры по семантике. Например, 10-секундный диалог разбивается на сегменты на основе целостности предложения, а не фиксированного временного отрезка.
- Ручная настройка не требуется, обработка выполняется автоматически.
Замена терминов
- перейти::
- существовать
config.toml
Добавьте правило замены, например:[custom_vocab] "AI" = "人工智能" "LLM" = "大语言模型"
- Перезапустите программу и автоматически замените ее при переводе.
- существовать
- использовать: Подходит для таких областей, как технологии, образование и т.д., чтобы обеспечить точную терминологию.
клонирование звука
- перейти::
- Загрузите 10-30-секундный аудиофрагмент на экране озвучивания.
- Выберите "Clone Sound", и программа сгенерирует похожий звук.
- запрос: Если вы используете службу AliCloud, вам необходимо настроить
aliyun.oss
казаться (быть чем-л.)docs/aliyun.md
.
Дополнительные параметры конфигурации
- локальная модель: Настройки
transcription_provider = "fasterwhisper"
Обязательные поляlocal_model.faster_whisper
Модель будет загружена автоматически (macOS пока не поддерживается). - Услуги AliCloud: Если вы используете большие модели AliCloud или дублирование, вам необходимо настроить
aliyun.bailian
возможноaliyun.speech
.
сценарий применения
- Создание многоязычного контента
- Блогеры YouTube хотят перевести китайские видео на английский и французский языки. KrillinAI быстро создает субтитры и закадровый голос в альбомном формате.
- Продвижение короткого видео
- Торговцы используют Jitterbug для рекламы своих товаров, а KrillinAI преобразует видео в вертикальный экран с местным языком для повышения привлекательности.
- Совместное использование образовательных ресурсов
- Преподаватели переводят видеокурсы на множество языков, а KrillinAI обеспечивает точные субтитры и озвучку для студентов по всему миру.
QA
- Почему API отсутствует при запуске?
- нужно быть в
config.toml
Заполните форму OpenAIapikey
Для получения дополнительной информации посетите сайт OpenAI.
- нужно быть в
- Какие языки ввода поддерживаются?
- В настоящее время поддерживаются китайский, английский, японский, немецкий, турецкий и другие языки, находящиеся в разработке.
- Сколько времени занимает перевод и дубляж?
- Обработка 10-минутного видео занимает около 5-10 минут, в зависимости от сети и конфигурации.
- Как исправить неудачную загрузку?
- настроить
cookies.txt
ссылкаdocs/get_cookies.md
Экспорт файлов cookie браузера.
- настроить
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...