ИИ преобразования текста в речь

Всего 79 статей
расставлять по порядку
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成

Sherpa-ONNX: автономное распознавание и синтез речи с помощью ONNXRuntime

Общее представление sherpa-onnx - это проект с открытым исходным кодом, разработанный командой Next-gen Kaldi для обеспечения эффективного распознавания речи и синтеза речи в автономном режиме. Он поддерживает множество платформ, включая Android, iOS, Raspber...
7 месяцев назад
029.8K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)

Kokoro TTS API: докеризованная обертка FastAPI для быстрого преобразования текста в речь (модель Kokoro-82M).

Общее представление Kokoro-FastAPI - это обёртка FastAPI на базе Docker, предназначенная для поддержки модели преобразования текста в речь Kokoro-82M. Проект поддерживает ускорение NVIDIA GPU и обеспечивает обработку очередей и авторазбиение...
8 месяцев назад
018.4K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate: решение для дубляжа видео с открытым исходным кодом, многократный дубляж, регулировка скорости и подражание оригинальному звуку

Общее описание SoniTranslate - это мощный и удобный инструмент для многоязычного дубляжа видео, предназначенный для перевода видео и синхронизации звука. Он использует передовые технологии распознавания речи и машинного перевода для перевода видеоконтента на несколько языков и синхронизации звука. ...
10 месяцев назад
017.2K
海螺语音(MiniMax Audio):生成自然语音的AI工具

Conch Speech (MiniMax Audio): инструмент искусственного интеллекта для генерации естественной речи

Всеобъемлющее представление MiniMax Audio - это инструмент генерации речи с искусственным интеллектом от MiniMax, основной особенностью которого является быстрое преобразование текста в естественную речь с высоким уровнем сходства. Он основан на модели Speech-02, сходство синтеза речи достигает 99...
2 месяца назад
015.8K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker: развертывание Microsoft Speech Synthesis API с помощью Cloudflare, совместимого формата OpenAI и упакованного веб-интерфейса

Общее введение Edge TTS Worker (который полагается на edge-tts) - это прокси-сервис, развернутый на Cloudflare Worker, который инкапсулирует службу Microsoft Edge TTS в OpenAI-совместимый формат ...
8 месяцев назад
015K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: эффективный инструмент преобразования текста в речь с поддержкой нескольких языков и нескольких голосов

Всеобъемлющее введение Kokoro-ONNX - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, основанный на среде исполнения ONNX. Разработанный thewh1teagle, проект нацелен на предоставление эффективных и быстрых решений для синтеза речи.Kokoro-ONNX поддерживает ...
7 месяцев назад
014.1K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: инструмент преобразования текста в речь для генерации естественной китайской речи

Общее представление Orpheus-TTS - это система преобразования текста в речь (TTS) с открытым исходным кодом, разработанная на архитектуре Llama-3b с целью генерации звука, близкого к естественной человеческой речи. Она запущена командой Canopy AI и поддерживает английский, испанский, французский...
5 месяцев назад
013.9K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: Синтез аудио/видео многоязычного перевода и клонирование речи

Всеобъемлющее введение ViiTor AI - это мощная платформа искусственного интеллекта, ориентированная на предоставление высококачественных услуг по переводу видео, клонированию голоса, созданию видео аватаров с помощью искусственного интеллекта и синтезу речи. Платформа поддерживает множество языков и призвана помочь пользователям легко добиться создания многоязычного контента.ViiTo...
8 месяцев назад
013.5K
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具

GizAI: ИИ-ассистент "все-в-одном", объединяющий основные инструменты генеративного ИИ и делающий коммерческие инструменты ИИ бесплатными для всех желающих

Общее представление GizAI - это универсальная платформа с интегрированными возможностями генерации искусственного интеллекта, создания заметок и облачного хранения данных. Пользователи могут генерировать изображения, видео, аудио, тексты, персонажей, истории и игры с помощью GizAI, а также создавать совместные заметки и облачные хранилища на платформе. GizAI обеспечивает мульти...
8 месяцев назад
012.8K
edge-tts:文本转语音Python模块|免费文本转语音服务

edge-tts: модуль преобразования текста в речь на Python | Free Text-to-Speech Service

Общее описание edge-tts - это модуль Python с открытым исходным кодом, который позволяет пользователям использовать онлайн-сервис преобразования текста в речь Microsoft Edge в коде Python без необходимости использования браузера Microsoft Edge, операционной системы Windows или секретного API...
11 месяцев назад
012.7K
Kokoro WebGPU:浏览器中离线运行的文本转语音服务

Kokoro WebGPU: служба преобразования текста в речь для автономной работы в браузерах

Общее представление Kokoro WebGPU - это WebGPU-версия модели преобразования текста в речь (TTS) Kokoro, предоставляемая WebML Community на платформе Hugging Face. Проект использует технологию WebGPU, чтобы позволить пользователям...
7 месяцев назад
012.6K
IndexTTS:支持中英文混合的文本转语音工具

IndexTTS: инструмент преобразования текста в речь с поддержкой китайско-английского смешивания

Общее введение IndexTTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, размещенный на GitHub и разработанный командой index-tts. Он основан на технологиях XTTS и Tortoise, улучшая дизайн модулей, чтобы обеспечить эффективную и ...
5 месяцев назад
012.6K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Weights: платформа для создания кавер-версий песен и преобразования текста в речь

Общее представление Weights - это социальная платформа для творчества с использованием искусственного интеллекта, которая позволяет пользователям создавать голосовые обложки, текст в речь, изображения, музыку и видео с помощью простых действий. Платформа предоставляет множество инструментов и шаблонов, чтобы помочь пользователям быстро начать творить и делиться с сообществом с...
7 месяцев назад
012.3K
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎

EmotiVoice: механизм преобразования текста в речь с управлением несколькими голосами и эмоциональными подсказками

Всеобъемлющее введение EmotiVoice - это движок преобразования текста в речь (TTS) с несколькими голосами и управлением эмоциональными подсказками, разработанный компанией NetEaseYoudao. Этот TTS-движок с открытым исходным кодом поддерживает английский и китайский языки, имеет более 2000 различных голосов и обладает функцией синтеза эмоций для создания голоса с радостными...
5 месяцев назад
012.1K
Vapi:帮助开发者快速构建低延时语音助手

Vapi: помощь разработчикам в быстром создании голосовых помощников с низкой задержкой

Всеобъемлющее введение Vapi - это платформа голосового ИИ для разработчиков. Она позволяет пользователям создавать, тестировать и внедрять голосовые ИИ-помощники за считанные минуты, решая проблему трудоемкой и трудно масштабируемой разработки традиционных голосовых приложений. Vapi предоставляет полный набор инструментов и инфраструктуры для поддержки разговоров в реальном времени, электрических...
5 месяцев назад
012.1K
Descript:一站式视频与播客编辑,简单如编辑文档

Описание: универсальное средство редактирования видео и подкастов, такое же простое, как редактирование документа

Descript Общее описание Descript - это мощный, но простой в использовании инструмент для редактирования видео и подкастов. Он обладает лучшей в отрасли точностью и скоростью транскрипции, мощными инструментами коррекции, а также возможностью транскрибировать видео в текст с помощью технологии искусственного интеллекта и редактировать видео, редактируя текст. В дополнение к...
11 месяцев назад
011.7K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: экспериментальная модель преобразования текста в речь, TTS, реализованная с использованием подхода чистого языкового моделирования

Всеобъемлющее введение OuteTTS - это экспериментальная модель преобразования текста в речь (TTS), которая использует подход чистого языкового моделирования для генерации высококачественной речи. В отличие от традиционных систем TTS, OuteTTS не требует внешних адаптеров или сложных архитектур. Модель основана на архитектуре LLaMa...
7 месяцев назад
011.5K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: бесплатный API преобразования текста в речь с помощью Edge TTS, совместимый с форматами OpenAI.

Общее представление OpenAI Edge TTS - это проект с открытым исходным кодом, который предоставляет собственный API преобразования текста в речь (TTS), совместимый с OpenAI. Проект использует онлайн-сервис преобразования текста в речь Microsoft Edge, чтобы позволить пользователям генерировать высококачественный...
7 месяцев назад
011.2K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: создание цифровых видеороликов человеческой речи с помощью одной фотографии, несколько бесплатных инструментов для создания видео

Общее описание Vidnoz - это бесплатная платформа для создания AI-видео, позволяющая быстро создавать AI-видео менее чем за 1 минуту. Не требуется никаких затрат, загрузки или опыта. Платформа предлагает 500+ AI аватаров, 470+ реалистичных AI озвучек и 500+ шаблонов. С помощью Vidnoz AI видео...
1 год назад
011.1K
Kokoro:高效语音合成模型,生成自然流畅的语音

Kokoro: эффективные модели синтеза речи для создания естественной и плавной речи

Общее представление Kokoro 82M - это эффективная модель синтеза речи, предоставленная компанией Hugging Face, предназначенная для создания высококачественной речи с меньшим количеством параметров и данных. Модель имеет 82 миллиона параметров и лицензирована под Apache 2.0...
7 месяцев назад
011.1K
MLX-Audio:基于 Apple MLX 框架的文本转语音工具

MLX-Audio: инструмент преобразования текста в речь на основе MLX Framework от Apple

Общее представление MLX-Audio - это инструмент с открытым исходным кодом, разработанный на основе фреймворка MLX от Apple и ориентированный на функции преобразования текста в речь (TTS) и речи в речь (STS). Он использует возможности кремния Apple (например, чипы серии M)...
6 месяцев назад
011.1K
Ondoku:在线文本朗读工具|文本转语音|图片转语音朗读

Ондоку: онлайн-читалка текста|Текст в речь|Изображение в речь

Ondoku Общее представление Ondoku - это онлайн-программа преобразования текста в речь, которая позволяет пользователям вводить текстовое содержимое в текстовое поле, предоставляемое веб-сайтом, а программа способна преобразовать статью в голосовое чтение в соответствии с потребностями пользователя, и поддерживает сохранение голоса в виде файла формата MP3. Этот сервис подходит как для мгновенного прослушивания...
11 месяцев назад
011K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: бесплатное клонирование голоса в режиме онлайн всего за 3 секунды!

Общее представление AnyVoice - это передовая платформа для генерации речи с помощью искусственного интеллекта, которая обеспечивает ультрареалистичную генерацию речи и услуги клонирования голоса. Платформа позволяет пользователям преобразовывать текст в естественную речь и выбирать из сотен предустановленных голосов. Если вы не можете найти подходящий голос, просто...
7 месяцев назад
010.9K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: конвертация электронных книг в аудиокниги, инструмент с открытым исходным кодом, многоязыковой поддержкой и клонированием голоса

Общее представление ebook2audiobook - это мощный инструмент для преобразования электронных книг в аудиокниги с открытым исходным кодом. Он способен конвертировать электронные книги в различных форматах в аудиокниги с полными маркерами глав и метаданными. Инструмент использует Calibre для преобразования форматов электронных книг с помощью Co...
8 месяцев назад
010.9K
pyvideotrans:视频翻译配音工具

pyvideotrans: Инструмент для дубляжа видеопереводов

pyVideoTrans Общее представление pyvideotrans - это инструмент для дублирования видеопереводов. Пользователи могут переводить видеоконтент с одного языка на другой, а также добавлять к нему дубляж и субтитры. Он основан на openai-whisper offline...
1 год назад
010.8K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

Tencent Smart Shadow: интеллектуальный инструмент для создания видео | AI Digital Man, Anime Generation Kit

Всеобъемлющее введение Tencent Smart Shadow - это интеллектуальная онлайн-платформа для создания видео, запущенная компанией Tencent, которая может поддерживать дублирование текста, цифровое человеческое вещание, автоматическое распознавание субтитров и другие функции с помощью мощных инструментов искусственного интеллекта, предоставляемых облачными сервисами.Она интегрирует поиск материалов, редактирование видео, экспорт рендеринга и публикацию, предоставляя пользователям удобные визуальные...
1 год назад
010.7K
TTSMaker:免费的在线文本转语音工具

TTSMaker: бесплатный онлайн-инструмент преобразования текста в речь

Общее представление TTSMaker - это бесплатный онлайн-инструмент преобразования текста в речь, поддерживающий более 100 языков и 300 стилей речи. Пользователи могут преобразовывать текст в естественную и плавную речь и загружать аудиофайлы для коммерческого использования. Инструмент подходит для дубляжа видео, аудиокниг, образования и обучения...
1 год назад
010.6K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS: Free Online Text-to-Speech Tool|Audio Enhancement|Audio Clips

FreeTTS Общее описание FreeTTS - это бесплатный онлайновый инструмент преобразования текста в речь, который позволяет пользователям конвертировать текст в естественные голосовые файлы. Поддерживая множество языков и вариантов звучания, пользователи могут конвертировать текст в форматы MP3, WAV, OGG и ACC...
12 месяцев назад
010.5K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: родной клиент для преобразования видео в субтитры, конвертирования многоязычных субтитров

Общее описание MemoAI - это мощный инструмент для перевода видео, предназначенный для преобразования видео- и аудиофайлов в текст, субтитры и заметки. Будь то видео с YouTube, подкаст или локальный файл, MemoAI с легкостью справится с этой задачей. Программа поддерживает более 90 языков, таких как китайский, английский, японский...
9 месяцев назад
010.5K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: создание аудиокниг, преобразование электронных книг в аудиокниги с помощью Kokoro

Общее представление Audiblez - это проект с открытым исходным кодом, предназначенный для преобразования электронных книг (например, в формате .epub) в аудиокниги (например, в формате .m4b). Проект использует высококачественную технологию синтеза речи Kokoro для поддержки нескольких языков и нескольких голосов. Пользователи могут просто...
7 месяцев назад
010.5K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: модель генерации речи, имитирующая голос реального собеседника (пакет ускорения ChatTTS в один клик)

Общее представление ChatTTS - это генеративная модель речи, разработанная для сценариев диалога. Она генерирует естественную и выразительную речь, поддерживает несколько языков и нескольких дикторов и подходит для интерактивных диалогов. Для этого модель предсказывает и контролирует такие тонкие ритмические особенности, как смех, паузы и междометия, а также...
7 месяцев назад
010.5K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: унифицированный API для интеграции известных технологий генерации речи, транскрипции речи и моделирования голоса

Общее представление Orate - это набор инструментов ИИ, ориентированный на генерацию и транскрипцию речи. Он предоставляет унифицированный API, который легко интегрируется с ведущими поставщиками ИИ, такими как OpenAI, ElevenLabs и AssemblyAI, чтобы помочь пользователям создавать принудительные...
7 месяцев назад
010.4K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: модель преобразования текста в речь с открытым исходным кодом для генерации и клонирования речи высокого качества

Общие сведения Введение Llasa-3B - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная аудиолабораторией Гонконгского университета науки и технологий (HKUST Audio). Модель основана на архитектуре Llama 3.2B, которая была тщательно настроена для обеспечения высококачественной генерации речи, которая не только поддерживает множество...
7 месяцев назад
010.4K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: персонализированное обучение и синтез речи в подкастах

Синтез Muyan-TTS - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная для сценариев подкастинга. Она предварительно обучена на более чем 100 000 часах аудиоданных подкастов и поддерживает синтез речи с нулевой выборкой для генерации высококачественной естественной речи. Модель основана на Llama-3.2-3...
4 месяца назад
010.2K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: Многоязычный генератор речи ИИ, преобразующая технология синтеза человеческого голоса

Общее представление Listnr - это программное обеспечение для преобразования текста в речь с генеративным движком AI, который создает синтез речи в 1000+ различных голосов на 142+ языках, включая клонирование вашего собственного голоса. Платформа обслуживает более 1 миллиона пользователей, просматривающих короткие видеоролики, YouTub...
11 месяцев назад
010K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI: Изменение голоса|Перевод речи в текст|Перевод текста в речь|Аудиоредактор

Общее представление Murf AI - это мощный онлайн-инструмент для создания голоса искусственного интеллекта, который преобразует текст в практически реальную человеческую речь. Он предлагает до 120+ вариантов голоса искусственного интеллекта, поддерживает 20+ языков и подходит для различных ситуаций, таких как подкасты, видео, профессиональные презентации и т.д.Му...
11 месяцев назад
010K
NotebookLM:知识笔记检索阅读,多类文档生成语音对话播客

NotebookLM: чтение с извлечением заметок о знаниях, генерация документов нескольких классов, голосовой диалог подкастов

Общее представление NotebookLM - это персонализированный инструмент для совместной работы с искусственным интеллектом от Google, призванный помочь пользователям использовать свой ум в полной мере. Пользователи могут загружать документы, а NotebookLM мгновенно обрабатывает содержимое этих источников, облегчая пользователям чтение...
2 месяца назад
09.8K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: ИИ-генерируемая рэп-музыка и платформа для клонирования голоса | Text to Speech

Общее представление Uberduck AI - это инновационная платформа, которая обеспечивает синтез певческих и разговорных голосов с помощью искусственного интеллекта для творческих агентств, музыкальных продюсеров и программистов. Пользователи могут выбирать различные музыкальные ритмы, генерировать тексты с помощью искусственного интеллекта или писать свои собственные, выбирать определенные звуки и в конечном итоге создавать рэп-песни...
11 месяцев назад
09.8K
csm-mlx:苹果设备专用的 csm 语音生成模型

csm-mlx: модель генерации речи csm для устройств Apple

Всеобъемлющее введение csm-mlx основан на фреймворке MLX, разработанном компанией Apple, специально оптимизированном для модели речевого диалога Apple Silicon (Apple Silicon) CSM (Conversation Speech Model). Этот проект позволяет использовать...
5 месяцев назад
09.7K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: легкая модель для синтеза китайской и английской речи

Введение MegaTTS3 - это инструмент синтеза речи с открытым исходным кодом, разработанный компанией ByteDance в сотрудничестве с Чжэцзянским университетом и предназначенный для генерации высококачественной китайской и английской речи. Его основная модель имеет всего 0.45B параметров, легка и эффективна, поддерживает смешанную генерацию китайской и английской речи и клонирование речи. Проект размещен на ...
5 месяцев назад
09.7K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: расширение возможностей ИИ с помощью распознавания эмоций | Распознавание эмоциональных состояний по звукам и выражениям | Генерирование речи с учетом эмоциональных состояний

Общее представление Hume AI - компания, специализирующаяся на эмоциональном интеллекте, разрабатывающая мультимодальные технологии ИИ, которые понимают и реагируют на человеческие эмоции. Ее флагманский продукт, Empathic Voice Interface (EVI), способен распознавать и реагировать на...
11 месяцев назад
09.6K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

ElevenLabs: Платформа для генерации высококачественной речи на основе искусственного интеллекта, инструменты для дублирования текста и клонирования речи

Общее представление ElevenLabs - это стартап из Нью-Йорка, США, специализирующийся в области генеративного ИИ речи. Компания предлагает ряд мощных сервисов для генерирования текста, речи, клонирования речи и распознавания речи.ElevenLabs преуспевает в...
12 месяцев назад
09.5K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub: видеоредактор с искусственным интеллектом | дубляж | перевод видео | оцифровка фотографий

Общее описание Dupdub - это платформа для создания подкастов и видеопрезентаций, которая предлагает ряд инструментов искусственного интеллекта для поддержки творчества пользователей. Функции охватывают создание текста в видео, предлагая услуги искусственного интеллекта по озвучиванию и дублированию видео, а также редактирование видео, транскрипцию и субтитры. Dupdub также ...
1 год назад
09.5K
PDF2Audio:将PDF转换为音频的工具,PDF转播客

PDF2Audio: инструмент для преобразования PDF в аудио, PDF в подкасты

Общее представление PDF2Audio - это проект с открытым исходным кодом, предназначенный для преобразования PDF-файлов в аудиоконтент, такой как подкасты, лекции и конспекты. Инструмент использует модель OpenAI GPT для генерации текста и преобразования текста в речь, и позволяет пользователям загружать несколько PDF ...
11 месяцев назад
09.4K
Dia:生成超现实多人对话的文本转语音模型

Dia: модель преобразования текста в речь для создания гиперреалистичных многопользовательских диалогов

Общее представление Dia - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Nari Labs и предназначенная для создания гиперреалистичных диалоговых аудио. Она преобразует текстовые сценарии в реалистичные многосимвольные диалоги за один процесс, поддерживает управление эмоциями и интонациями и даже генерирует невербальные представления...
4 месяца назад
09.4K
音剪:喜马拉雅自然人声、多人旁白音频创作平台

Звуковая вырезка: естественный человеческий голос Гималаи, платформа для создания аудиозаписей с несколькими дикторами

Всеобъемлющее представление Himalaya Audio Editor - это комплексная платформа для создания AI-аудио. Она предлагает мощные функции, которые поддерживают пользователей в создании подкастов профессионального уровня, многодорожечной записи, редактировании аудио и возможности преобразования текста в речь. Платформа также содержит множество опций для профессиональной озвучки, помогая пользователям...
1 год назад
09.3K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: универсальная платформа для обработки аудио/видео|генерация видео|AI-субтитров|извлечение звука|передача речи в текст

Всеобъемлющее введение Record Cafe - это универсальная платформа для обработки аудио/видео, предоставляющая услуги по созданию видеодиалогов AI, субтитров AI и преобразованию речи AI в текст. Функции включают запись экрана, редактирование видео, конвертирование GIF/аудио и т.д., а также поддерживают облачное хранение и обмен. Интерфейс интуитивно понятен и прост в использовании, а также поддерживает многоэкранную запись и многоязычный смарт...
9 месяцев назад
09.3K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: профессиональная платформа для озвучивания и создания коротких видеороликов | озвучивание реальных людей | клонирование голоса | создание фильма одним кликом

Всеобъемлющее представление Magic Voice Workshop - это универсальная платформа для дубляжа коротких видеороликов и ИИ, содержащая информацию о программном дубляже, реальном дубляже, звуковых библиотеках, услугах клонирования и многом другом. Платформа объединяет аудиоредактор, генерацию копий ИИ, видеомонтаж и инструменты для совместной работы над аудиоуслугами и созданием контента. Пользователи могут воспользоваться аудиоредактором...
11 месяцев назад
09.3K
Wondercraft:专注广告配音、多人有声读物和播客的文本转音频工具

Wondercraft: инструмент преобразования текста в звук, ориентированный на озвучивание рекламы, многопользовательские аудиокниги и подкасты

Общие сведения Wondercraft - это революционная платформа для создания аудио- и видеоматериалов на основе искусственного интеллекта, которая предоставляет создателям контента универсальное решение для производства аудио- и видеоматериалов. Используя передовые технологии искусственного интеллекта, платформа способна преобразовывать текстовый контент в естественную и плавную речь, поддерживая более 20 языков...
8 месяцев назад
09.2K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...
12 месяцев назад
09.2K
逗哥配音:专注短视频解说、创作的智能配音神器

Тизерный дубляж: интеллектуальный инструмент для дубляжа, ориентированный на создание коротких видеороликов

Всеобъемлющее введение Tease Dubbing - это популярное программное обеспечение для дубляжа AI с более чем 5 миллионами пользователей. Программное обеспечение использует передовую технологию интеллектуального дубляжа AI для обеспечения профессиональных и реалистичных эффектов дубляжа, которые подходят для коротких видеороликов, производства рекламы, образования и обучения и других сценариев. Teaser Dubbing стремится предоставить пользователям быстрый...
10 месяцев назад
09.2K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

Дубляж YouTube: перевод видео на YouTube на разные языки и синхронизация дубляжа в режиме реального времени

Общее представление YouTube Dubbing - это интеллектуальная платформа для дубляжа, предназначенная для предоставления услуг многоязычного дубляжа создателям и зрителям видео. Благодаря технологии искусственного интеллекта платформа способна автоматически переводить и генерировать дубли из видеороликов YouTube, поддерживая множество языков и стилей озвучивания. Пользователям нужно только установить...
10 месяцев назад
09.1K
AivisSpeech:生成情感丰富的日语语音合成软件

AivisSpeech: создание эмоционально насыщенного программного обеспечения для синтеза японской речи

Общее представление AivisSpeech - это программа для синтеза японской речи, основанная на пользовательском интерфейсе редактора VOICEVOX. В него интегрирован движок AivisSpeech Engine, позволяющий легко генерировать эмоционально насыщенную речь.AivisSpeech поддерживает...
9 месяцев назад
09.1K
PlayAI:提供流畅、富有情感的语音对话和语音合成服务(英文)

PlayAI: обеспечение плавного и эмоционального голосового диалога и услуги синтеза речи (на английском языке)

Общее представление PlayAI - это платформа искусственного интеллекта, ориентированная на генерацию речи и ее клонирование. Она предлагает широкий спектр речевых моделей, способных генерировать плавные и эмоциональные диалоги. Пользователи могут использовать платформу для создания персонализированных голосовых агентов, чтобы улучшить интерактивный опыт.Технология PlayAI применяет...
9 месяцев назад
09.1K
猫与星:和孩子一起编写专属童话故事的听故事APP

Кот и Звезда: приложение для прослушивания сказок, позволяющее сочинять эксклюзивные сказки вместе с ребенком

Общее представление "Кот и звезда" (maoyuxing.com) - это интерактивная платформа для создания сказок, предназначенная для детей, помогающая родителям и детям вместе создавать персонализированные сказки с помощью мобильных приложений. Пользователи могут вводить такую информацию, как имя ребенка и его предпочтения, чтобы создавать уникальные сказки...
6 месяцев назад
09K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...
4 месяца назад
09K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: быстрый и управляемый многоязычный (поддерживается 7000+ языков) инструмент преобразования текста в речь

Общее представление IMS Toucan - это современный набор инструментов для преобразования текста в речь (TTS), разработанный Институтом обработки естественного языка (IMS) при Штутгартском университете, Германия. Инструментарий поддерживает более 7000 языков, отличается быстродействием, управляемостью и низкими требованиями к вычислительным ресурсам.IMS...
7 месяцев назад
09K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: конвертация электронных книг epub в аудиокниги m4b

Общее представление Autiobooks - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования электронных книг в формате .epub в аудиокниги в формате .m4b. Он использует высококачественную технологию синтеза речи, предоставленную компанией Kokoro, для создания естественного и плавного аудио. Этот инструмент работает на...
6 месяцев назад
08.9K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: конвертация PDF в подкасты с открытым исходным кодом

Общее представление Open NotebookLM - это проект с открытым исходным кодом, предназначенный для преобразования любого PDF-документа в подкаст. Инструмент использует модели Large Language Model (LLM) и Text-to-Speech (TTS) с открытым исходным кодом для обработки PDF-контента и создания естественного диалога, подходящего для аудиоподкастов...
7 месяцев назад
08.9K
Spark-TTS:生成自然语音的文本转语音工具

Spark-TTS: инструмент преобразования текста в речь для генерации естественной речи

Общее представление Spark-TTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, разработанный командой SparkAudio и размещенный на GitHub, призванный помочь пользователям эффективно преобразовывать текст в естественную и плавную речь...
6 месяцев назад
08.8K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: платформа для синтеза речи на основе искусственного интеллекта | клонирование голоса | глубокое обнаружение фальшивых аудиозаписей

Всеобъемлющее введение Resemble AI - это платформа синтеза речи на основе искусственного интеллекта, предназначенная для предприятий. Платформа обеспечивает передовую технологию генерации голоса ИИ и глубокое обнаружение поддельных аудиозаписей для обеспечения информационной безопасности в будущем. Функции включают клонирование голоса, глубокое обнаружение поддельных аудиозаписей в реальном времени, технологию водяных знаков ИИ...
11 месяцев назад
08.7K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: генерирование моделей преобразования текста в речь с учетом особенностей говорящего на основе входного текста

Общее представление Parler-TTS - это библиотека моделей преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Hugging Face и предназначенная для генерации высококачественной, естественно звучащей речи. Модель способна генерировать речь на основе входного текста с определенным стилем диктора (например, пол, высота тона, манера речи...
7 месяцев назад
08.7K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: интеллектуальный синтез речи и платформа для клонирования голоса

Всеобъемлющее введение Seaweed AI - это интеллектуальный продукт для дубляжа, который может преобразовывать текст в голос в режиме онлайн на базе открытой платформы Yun Zhisheng AI. Пользователи могут самостоятельно добиваться клонирования голоса, предоставлять дикторов ИИ разного пола, акцента и языка, а также напрямую дублировать голос после ввода текста. Он может быстро дублировать короткие...
11 месяцев назад
08.7K
PodLM:将对话、网页或长文本生成多语言音频播客(付费)

PodLM: создание многоязычных аудиоподкастов из диалогов, веб-страниц или длинных текстов (платно)

Общие сведения PodLM - это современная платформа для создания подкастов с искусственным интеллектом, которая помогает пользователям быстро преобразовывать текст, документы или URL-контент в высококачественные аудиоподкасты. Используя передовые технологии искусственного интеллекта, PodLM может автоматически генерировать структурированные и увлекательные сценарии подкастов и...
10 месяцев назад
08.7K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: Профессиональный инструмент для редактирования аудио|Производство аудиокниг|Текст в речь|Разделение аккомпанемента

Общее представление XAudioPro - это профессиональный и портативный инструмент для редактирования и перекодирования аудио в режиме реального времени. Он поддерживает профессиональные функции редактирования аудио, такие как вырезание, обрезка, копирование, удаление, восстановление и контроль усиления амплитуды. Кроме того, он предоставляет услуги по устранению дефектов, такие как спектральное вычитание шума, низкочастотный...
11 месяцев назад
08.7K
Jellypod:制作多语言AI播客,创建、编辑和分发AI播客

Jellypod: производство многоязычных подкастов AI, создание, редактирование и распространение подкастов AI

Общее представление Jellypod - это мощная студия подкастов AI, разработанная для того, чтобы помочь пользователям легко создавать, редактировать и публиковать высококачественные подкасты AI. С помощью Jellypod пользователи могут создавать персональные подкаст-хосты, дорабатывать сценарии и публиковать подкасты на ...
7 месяцев назад
08.7K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: превращение популярных технических статей в готовые к прослушиванию аудиоподкасты

Общее введение Audibit является проектом с открытым исходным кодом, основной функцией является Hacker News, TechCrunch и другие популярные статьи технологии автоматически превращаются в аудио подкасты, так что пользователи в коммутируют, фитнес или занят при прослушивании информации через Интернет или мобильных. Проект делает ...
4 месяца назад
08.5K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy: многоисточниковый контент для многоязычного аудиоразговора, альтернатива с открытым исходным кодом возможностям подкастинга NotebookLM

Общее введение Podcastfy - это пакет Python с открытым исходным кодом, который использует технологию генеративного искусственного интеллекта (GenAI) для преобразования веб-контента, PDF-файлов, текста, изображений, видео с youtube и многих других источников в увлекательные многоязычные...
10 месяцев назад
08.5K
Podcastle:快速创建高质量播客的AI工具

Podcastle: инструмент с искусственным интеллектом для быстрого создания высококачественных подкастов

Общее представление Podcastle - это онлайн-платформа на основе искусственного интеллекта, которая помогает пользователям быстро создавать и редактировать высококачественные подкасты. Она объединяет в себе функции записи, редактирования и публикации, и пользователи могут делать все это через браузер без необходимости использования специализированного оборудования или сложного программного обеспечения. Платформа использует ...
5 месяцев назад
08.3K
PlayHT:生成超真实语音的AI工具

PlayHT: инструмент искусственного интеллекта для создания гиперреалистичной речи

Общее представление PlayHT - это эффективная онлайн-платформа, ориентированная на генерацию речи искусственным интеллектом, помогающая пользователям быстро преобразовывать текст в естественную и реалистичную речь. Она предоставляет более 600 голосов искусственного интеллекта, поддерживающих более 60 языков и различные акценты, для создания подкастов, образовательного контента, маркетингового продвижения...
6 месяцев назад
08.3K
集成多种先进语音合成服务的开源运营项目

Операционный проект с открытым исходным кодом, объединяющий несколько передовых сервисов синтеза речи

Общее представление Open-VoiceCanvas - это платформа синтеза речи с открытым исходным кодом, разработанная командой ItusiAI. Она поддерживает более 50 языков, позволяет преобразовывать текст в естественную речь, а также клонировать персональные голоса путем загрузки аудиозаписей. Проект интегрирует Ope...
5 месяцев назад
08.1K
NotebookLM Podcast:任何文档生成多语言个性化AI播客(付费)

NotebookLM Podcast: создание многоязычного персонализированного подкаста с искусственным интеллектом из любого документа (платно)

Общее описание NotebookLM Podcast - это инновационная платформа, которая использует технологию искусственного интеллекта для преобразования любого текстового контента в динамичные, увлекательные аудиоподкасты. Будь вы студент, педагог, создатель контента или занятой профессионал, NotebookLM...
8 месяцев назад
08K
ElevenLabs MCP:语音生成MCP服务

ElevenLabs MCP: услуга Speech Generation MCP

Общие сведения Введение ElevenLabs MCP - это официальный проект ElevenLabs с открытым исходным кодом, размещенный на GitHub. Это сервис, основанный на протоколе управления моделями (Model Context Protocol, MCP)...
5 месяцев назад
07.9K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer: интеграция служб синтеза речи в программы для чтения

Общее представление TTS Importer - это проект с открытым исходным кодом, предназначенный для легкого импорта сервисов синтеза речи Azure TTS (Text-to-Speech) в различные программы для чтения. Инструмент поддерживает несколько популярных программ для чтения, включая Read (legado...
6 месяцев назад
07.8K
Paper to Podcast:把学术论文转换为多人对话播客

Из бумаги в подкаст: превращение академических статей в подкасты для бесед с несколькими людьми

Общее представление Paper to Podcast - это инструмент с открытым исходным кодом, специализирующийся на преобразовании академических научных работ в живые и увлекательные подкасты. Он использует технологию искусственного интеллекта, чтобы превратить статью в формате PDF в диалог между тремя персонажами - ведущим, учеником и экспертом - и сделать сложные...
5 месяцев назад
07.8K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: графический интерфейс преобразования текста в речь на основе кремниевых потоковых API

Общее представление Text2Voice - это инструмент с открытым исходным кодом, который обеспечивает функциональность преобразования текста в речь на основе кремниевого API потока, с чистым графическим интерфейсом пользователя (GUI) в качестве его лучшей особенности. Он был создан разработчиком Шелдоном Ли на GitHub, чтобы позволить...
5 месяцев назад
07.4K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: ключ для создания аудиокниг с естественным качеством звука, поддержка PDF, epub, docx и других форматов

Введение QuickPiperAudiobook - это проект с открытым исходным кодом, предназначенный для преобразования различных текстовых форматов (например, epub, mobi, txt, PDF, HTML и т.д.) в аудиокниги с естественным звучанием с помощью простой одной команды. Инструмент использует Pi...
11 месяцев назад
07.4K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: онлайн-платформы для генерации речи с помощью искусственного интеллекта и преобразования текста в речь (TTS)

Общее представление Acoust - это онлайн-платформа для генерации речи и преобразования текста в речь (TTS), которая использует новейшие технологии искусственного интеллекта для генерации реалистичной речи. Платформа также предоставляет мощные инструменты для редактирования видео, которые позволяют пользователям завершить создание видео без необходимости использования нескольких программ.Acou...
8 месяцев назад
07.4K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast: ИИ-инструмент для преобразования PDF в подкаст с помощью направляющих слов

Общее представление NVIDIA AI Blueprint: PDF to Podcast - это проект с открытым исходным кодом, разработанный NVIDIA для преобразования PDF-документов в увлекательный аудиоконтент. Проект использует NVIDIA NIM (NVID...
6 месяцев назад
06.9K