ИИ преобразования текста в речь

Всего 79 статей

расставлять по порядку

Sherpa-ONNX: автономное распознавание и синтез речи с помощью ONNXRuntime

Общее представление sherpa-onnx - это проект с открытым исходным кодом, разработанный командой Next-gen Kaldi для обеспечения эффективного распознавания речи и синтеза речи в автономном режиме. Он поддерживает множество платформ, включая Android, iOS, Raspber...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # AI Speech to Text

1 год назад

0319.1K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate: решение для дубляжа видео с открытым исходным кодом, многократный дубляж, регулировка скорости и подражание оригинальному звуку

Общее описание SoniTranslate - это мощный и удобный инструмент для многоязычного дубляжа видео, предназначенный для перевода видео и синхронизации звука. Он использует передовые технологии распознавания речи и машинного перевода для перевода видеоконтента на несколько языков и синхронизации звука. ...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь Перевод # AI # AI Speech to Text

2 года назад

0161K

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # AI Speech to Text

1 год назад

0147.5K

Weights: платформа для создания кавер-версий песен и преобразования текста в речь

Общее представление Weights - это социальная платформа для творчества с использованием искусственного интеллекта, которая позволяет пользователям создавать голосовые обложки, текст в речь, изображения, музыку и видео с помощью простых действий. Платформа предоставляет множество инструментов и шаблонов, чтобы помочь пользователям быстро начать творить и делиться с сообществом с...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

1 год назад

0144.7K

Conch Speech (MiniMax Audio): инструмент искусственного интеллекта для генерации естественной речи

Всеобъемлющее представление MiniMax Audio - это инструмент генерации речи с искусственным интеллектом от MiniMax, основной особенностью которого является быстрое преобразование текста в естественную речь с высоким уровнем сходства. Он основан на модели Speech-02, сходство синтеза речи достигает 99...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

1 год назад

0144.4K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Kokoro TTS API: докеризованная обертка FastAPI для быстрого преобразования текста в речь (модель Kokoro-82M).

Общее представление Kokoro-FastAPI - это обёртка FastAPI на базе Docker, предназначенная для поддержки модели преобразования текста в речь Kokoro-82M. Проект поддерживает ускорение NVIDIA GPU и обеспечивает обработку очередей и авторазбиение...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

0140.3K

IndexTTS: инструмент преобразования текста в речь с поддержкой китайско-английского смешивания

Общее введение IndexTTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, размещенный на GitHub и разработанный командой index-tts. Он основан на технологиях XTTS и Tortoise, улучшая дизайн модулей, чтобы обеспечить эффективную и ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

0138.8K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

Edge TTS Worker: развертывание Microsoft Speech Synthesis API с помощью Cloudflare, совместимого формата OpenAI и упакованного веб-интерфейса

Общее введение Edge TTS Worker (который полагается на edge-tts) - это прокси-сервис, развернутый на Cloudflare Worker, который инкапсулирует службу Microsoft Edge TTS в OpenAI-совместимый формат ...

Последние ресурсы по искусственному интеллекту # AI Side Hustle Money Making Project # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

0132.7K

edge-tts: модуль преобразования текста в речь на Python | Free Text-to-Speech Service

Общее описание edge-tts - это модуль Python с открытым исходным кодом, который позволяет пользователям использовать онлайн-сервис преобразования текста в речь Microsoft Edge в коде Python без необходимости использования браузера Microsoft Edge, операционной системы Windows или секретного API...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

2 года назад

0122.7K

MLX-Audio: инструмент преобразования текста в речь на основе MLX Framework от Apple

Общее представление MLX-Audio - это инструмент с открытым исходным кодом, разработанный на основе фреймворка MLX от Apple и ориентированный на функции преобразования текста в речь (TTS) и речи в речь (STS). Он использует возможности кремния Apple (например, чипы серии M)...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

0117.5K

Kokoro-ONNX: эффективный инструмент преобразования текста в речь с поддержкой нескольких языков и нескольких голосов

Всеобъемлющее введение Kokoro-ONNX - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, основанный на среде исполнения ONNX. Разработанный thewh1teagle, проект нацелен на предоставление эффективных и быстрых решений для синтеза речи.Kokoro-ONNX поддерживает ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

0117K

Ондоку: онлайн-читалка текста|Текст в речь|Изображение в речь

Ondoku Общее представление Ondoku - это онлайн-программа преобразования текста в речь, которая позволяет пользователям вводить текстовое содержимое в текстовое поле, предоставляемое веб-сайтом, а программа способна преобразовать статью в голосовое чтение в соответствии с потребностями пользователя, и поддерживает сохранение голоса в виде файла формата MP3. Этот сервис подходит как для мгновенного прослушивания...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

0111.5K

Orpheus-TTS: инструмент преобразования текста в речь для генерации естественной китайской речи

Общее представление Orpheus-TTS - это система преобразования текста в речь (TTS) с открытым исходным кодом, разработанная на архитектуре Llama-3b с целью генерации звука, близкого к естественной человеческой речи. Она запущена командой Canopy AI и поддерживает английский, испанский, французский...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

0102.7K

GizAI：全能AI助手，集成主流生成式AI工具，让每个人免费使用商业化AI工具

GizAI: ИИ-ассистент "все-в-одном", объединяющий основные инструменты генеративного ИИ и делающий коммерческие инструменты ИИ бесплатными для всех желающих

Общее представление GizAI - это универсальная платформа с интегрированными возможностями генерации искусственного интеллекта, создания заметок и облачного хранения данных. Пользователи могут генерировать изображения, видео, аудио, тексты, персонажей, истории и игры с помощью GizAI, а также создавать совместные заметки и облачные хранилища на платформе. GizAI обеспечивает мульти...

Последние ресурсы по искусственному интеллекту # AI онлайн генерация изображений # AI преобразование текста в речь Интегрированная многомодельная диалоговая платформа # AI

1 год назад

099.5K

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

ebook2audiobook: конвертация электронных книг в аудиокниги, инструмент с открытым исходным кодом, многоязыковой поддержкой и клонированием голоса

Общее представление ebook2audiobook - это мощный инструмент для преобразования электронных книг в аудиокниги с открытым исходным кодом. Он способен конвертировать электронные книги в различных форматах в аудиокниги с полными маркерами глав и метаданными. Инструмент использует Calibre для преобразования форматов электронных книг с помощью Co...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

098.7K

AivisSpeech: создание эмоционально насыщенного программного обеспечения для синтеза японской речи

Общее представление AivisSpeech - это программа для синтеза японской речи, основанная на пользовательском интерфейсе редактора VOICEVOX. В него интегрирован движок AivisSpeech Engine, позволяющий легко генерировать эмоционально насыщенную речь.AivisSpeech поддерживает...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

095.9K

AnyVoice: бесплатное клонирование голоса в режиме онлайн всего за 3 секунды!

Общее представление AnyVoice - это передовая платформа для генерации речи с помощью искусственного интеллекта, которая обеспечивает ультрареалистичную генерацию речи и услуги клонирования голоса. Платформа позволяет пользователям преобразовывать текст в естественную речь и выбирать из сотен предустановленных голосов. Если вы не можете найти подходящий голос, просто...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

1 год назад

094.2K

EmotiVoice: механизм преобразования текста в речь с управлением несколькими голосами и эмоциональными подсказками

Всеобъемлющее введение EmotiVoice - это движок преобразования текста в речь (TTS) с несколькими голосами и управлением эмоциональными подсказками, разработанный компанией NetEaseYoudao. Этот TTS-движок с открытым исходным кодом поддерживает английский и китайский языки, имеет более 2000 различных голосов и обладает функцией синтеза эмоций для создания голоса с радостными...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

1 год назад

094.1K

Vidnoz AI: создание цифровых видеороликов человеческой речи с помощью одной фотографии, несколько бесплатных инструментов для создания видео

Общее описание Vidnoz - это бесплатная платформа для создания AI-видео, позволяющая быстро создавать AI-видео менее чем за 1 минуту. Не требуется никаких затрат, загрузки или опыта. Платформа предлагает 500+ AI аватаров, 470+ реалистичных AI озвучек и 500+ шаблонов. С помощью Vidnoz AI видео...

Последние ресурсы по искусственному интеллекту # AI Преобразование изображений в видео # AI Digital Man # AI текст в видео

2 года назад

093.9K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: бесплатный API преобразования текста в речь с помощью Edge TTS, совместимый с форматами OpenAI.

Общее представление OpenAI Edge TTS - это проект с открытым исходным кодом, который предоставляет собственный API преобразования текста в речь (TTS), совместимый с OpenAI. Проект использует онлайн-сервис преобразования текста в речь Microsoft Edge, чтобы позволить пользователям генерировать высококачественный...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

093.9K

ViiTor AI: Синтез аудио/видео многоязычного перевода и клонирование речи

Всеобъемлющее введение ViiTor AI - это мощная платформа искусственного интеллекта, ориентированная на предоставление высококачественных услуг по переводу видео, клонированию голоса, созданию видео аватаров с помощью искусственного интеллекта и синтезу речи. Платформа поддерживает множество языков и призвана помочь пользователям легко добиться создания многоязычного контента.ViiTo...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI # AI аудио/видеоредактор

1 год назад

092.3K

Tencent Smart Shadow: интеллектуальный инструмент для создания видео | AI Digital Man, Anime Generation Kit

Всеобъемлющее введение Tencent Smart Shadow - это интеллектуальная онлайн-платформа для создания видео, запущенная компанией Tencent, которая может поддерживать дублирование текста, цифровое человеческое вещание, автоматическое распознавание субтитров и другие функции с помощью мощных инструментов искусственного интеллекта, предоставляемых облачными сервисами.Она интегрирует поиск материалов, редактирование видео, экспорт рендеринга и публикацию, предоставляя пользователям удобные визуальные...

Последние ресурсы по искусственному интеллекту # AI Writing # AI Digital Man # AI текст в видео

2 года назад

092.3K

pyvideotrans: Инструмент для дубляжа видеопереводов

pyVideoTrans Общее представление pyvideotrans - это инструмент для дублирования видеопереводов. Пользователи могут переводить видеоконтент с одного языка на другой, а также добавлять к нему дубляж и субтитры. Он основан на openai-whisper offline...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI Speech to Text # AI аудио/видеоредактор

2 года назад

091.4K

Kokoro WebGPU: служба преобразования текста в речь для автономной работы в браузерах

Общее представление Kokoro WebGPU - это WebGPU-версия модели преобразования текста в речь (TTS) Kokoro, предоставляемая WebML Community на платформе Hugging Face. Проект использует технологию WebGPU, чтобы позволить пользователям...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

091K

OuteTTS: экспериментальная модель преобразования текста в речь, TTS, реализованная с использованием подхода чистого языкового моделирования

Всеобъемлющее введение OuteTTS - это экспериментальная модель преобразования текста в речь (TTS), которая использует подход чистого языкового моделирования для генерации высококачественной речи. В отличие от традиционных систем TTS, OuteTTS не требует внешних адаптеров или сложных архитектур. Модель основана на архитектуре LLaMa...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

086.1K

Llasa 1~8B: модель преобразования текста в речь с открытым исходным кодом для генерации и клонирования речи высокого качества

Общие сведения Введение Llasa-3B - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная аудиолабораторией Гонконгского университета науки и технологий (HKUST Audio). Модель основана на архитектуре Llama 3.2B, которая была тщательно настроена для обеспечения высококачественной генерации речи, которая не только поддерживает множество...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # Клонирование голоса AI

1 год назад

085.7K

Dia: модель преобразования текста в речь для создания гиперреалистичных многопользовательских диалогов

Общее представление Dia - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Nari Labs и предназначенная для создания гиперреалистичных диалоговых аудио. Она преобразует текстовые сценарии в реалистичные многосимвольные диалоги за один процесс, поддерживает управление эмоциями и интонациями и даже генерирует невербальные представления...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

084.1K

Hume AI：赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: расширение возможностей ИИ с помощью распознавания эмоций | Распознавание эмоциональных состояний по звукам и выражениям | Генерирование речи с учетом эмоциональных состояний

Общее представление Hume AI - компания, специализирующаяся на эмоциональном интеллекте, разрабатывающая мультимодальные технологии ИИ, которые понимают и реагируют на человеческие эмоции. Ее флагманский продукт, Empathic Voice Interface (EVI), способен распознавать и реагировать на...

Последние ресурсы по искусственному интеллекту # AI Open Services # AI преобразование текста в речь

2 года назад

082.5K

Spark-TTS: инструмент преобразования текста в речь для генерации естественной речи

Общее представление Spark-TTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, разработанный командой SparkAudio и размещенный на GitHub, призванный помочь пользователям эффективно преобразовывать текст в естественную и плавную речь...

1 год назад

081.6K

Vapi: помощь разработчикам в быстром создании голосовых помощников с низкой задержкой

Всеобъемлющее введение Vapi - это платформа голосового ИИ для разработчиков. Она позволяет пользователям создавать, тестировать и внедрять голосовые ИИ-помощники за считанные минуты, решая проблему трудоемкой и трудно масштабируемой разработки традиционных голосовых приложений. Vapi предоставляет полный набор инструментов и инфраструктуры для поддержки разговоров в реальном времени, электрических...

Последние ресурсы по искусственному интеллекту # AI Open Services # AI преобразование текста в речь

1 год назад

081.1K

Muyan-TTS: персонализированное обучение и синтез речи в подкастах

Синтез Muyan-TTS - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная для сценариев подкастинга. Она предварительно обучена на более чем 100 000 часах аудиоданных подкастов и поддерживает синтез речи с нулевой выборкой для генерации высококачественной естественной речи. Модель основана на Llama-3.2-3...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

080.5K

Kokoro: эффективные модели синтеза речи для создания естественной и плавной речи

Общее представление Kokoro 82M - это эффективная модель синтеза речи, предоставленная компанией Hugging Face, предназначенная для создания высококачественной речи с меньшим количеством параметров и данных. Модель имеет 82 миллиона параметров и лицензирована под Apache 2.0...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

080.5K

TTSMaker: бесплатный онлайн-инструмент преобразования текста в речь

Общее представление TTSMaker - это бесплатный онлайн-инструмент преобразования текста в речь, поддерживающий более 100 языков и 300 стилей речи. Пользователи могут преобразовывать текст в естественную и плавную речь и загружать аудиофайлы для коммерческого использования. Инструмент подходит для дубляжа видео, аудиокниг, образования и обучения...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

078.4K

MegaTTS3: легкая модель для синтеза китайской и английской речи

Введение MegaTTS3 - это инструмент синтеза речи с открытым исходным кодом, разработанный компанией ByteDance в сотрудничестве с Чжэцзянским университетом и предназначенный для генерации высококачественной китайской и английской речи. Его основная модель имеет всего 0.45B параметров, легка и эффективна, поддерживает смешанную генерацию китайской и английской речи и клонирование речи. Проект размещен на ...

1 год назад

077.8K

ChatTTS: модель генерации речи, имитирующая голос реального собеседника (пакет ускорения ChatTTS в один клик)

Общее представление ChatTTS - это генеративная модель речи, разработанная для сценариев диалога. Она генерирует естественную и выразительную речь, поддерживает несколько языков и нескольких дикторов и подходит для интерактивных диалогов. Для этого модель предсказывает и контролирует такие тонкие ритмические особенности, как смех, паузы и междометия, а также...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

077.6K

FreeTTS: Free Online Text-to-Speech Tool|Audio Enhancement|Audio Clips

FreeTTS Общее описание FreeTTS - это бесплатный онлайновый инструмент преобразования текста в речь, который позволяет пользователям конвертировать текст в естественные голосовые файлы. Поддерживая множество языков и вариантов звучания, пользователи могут конвертировать текст в форматы MP3, WAV, OGG и ACC...

2 года назад

077.1K

Magic Voice Workshop: профессиональная платформа для озвучивания и создания коротких видеороликов | озвучивание реальных людей | клонирование голоса | создание фильма одним кликом

Всеобъемлющее представление Magic Voice Workshop - это универсальная платформа для дубляжа коротких видеороликов и ИИ, содержащая информацию о программном дубляже, реальном дубляже, звуковых библиотеках, услугах клонирования и многом другом. Платформа объединяет аудиоредактор, генерацию копий ИИ, видеомонтаж и инструменты для совместной работы над аудиоуслугами и созданием контента. Пользователи могут воспользоваться аудиоредактором...

2 года назад

076.4K

Record Cafe: универсальная платформа для обработки аудио/видео|генерация видео|AI-субтитров|извлечение звука|передача речи в текст

Всеобъемлющее введение Record Cafe - это универсальная платформа для обработки аудио/видео, предоставляющая услуги по созданию видеодиалогов AI, субтитров AI и преобразованию речи AI в текст. Функции включают запись экрана, редактирование видео, конвертирование GIF/аудио и т.д., а также поддерживают облачное хранение и обмен. Интерфейс интуитивно понятен и прост в использовании, а также поддерживает многоэкранную запись и многоязычный смарт...

Последние ресурсы по искусственному интеллекту # AI текст в видео # AI преобразование текста в речь # AI Speech to Text

2 года назад

076.3K

Тизерный дубляж: интеллектуальный инструмент для дубляжа, ориентированный на создание коротких видеороликов

Всеобъемлющее введение Tease Dubbing - это популярное программное обеспечение для дубляжа AI с более чем 5 миллионами пользователей. Программное обеспечение использует передовую технологию интеллектуального дубляжа AI для обеспечения профессиональных и реалистичных эффектов дубляжа, которые подходят для коротких видеороликов, производства рекламы, образования и обучения и других сценариев. Teaser Dubbing стремится предоставить пользователям быстрый...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI аудио/видеоредактор

2 года назад

075.4K

YouTube Dubbing：实时将YouTube视频翻译为不同语言并同步配音

Дубляж YouTube: перевод видео на YouTube на разные языки и синхронизация дубляжа в режиме реального времени

Общее представление YouTube Dubbing - это интеллектуальная платформа для дубляжа, предназначенная для предоставления услуг многоязычного дубляжа создателям и зрителям видео. Благодаря технологии искусственного интеллекта платформа способна автоматически переводить и генерировать дубли из видеороликов YouTube, поддерживая множество языков и стилей озвучивания. Пользователям нужно только установить...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

074.8K

Parler-TTS: генерирование моделей преобразования текста в речь с учетом особенностей говорящего на основе входного текста

Общее представление Parler-TTS - это библиотека моделей преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Hugging Face и предназначенная для генерации высококачественной, естественно звучащей речи. Модель способна генерировать речь на основе входного текста с определенным стилем диктора (например, пол, высота тона, манера речи...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

074.7K

Memo AI: родной клиент для преобразования видео в субтитры, конвертирования многоязычных субтитров

Общее описание MemoAI - это мощный инструмент для перевода видео, предназначенный для преобразования видео- и аудиофайлов в текст, субтитры и заметки. Будь то видео с YouTube, подкаст или локальный файл, MemoAI с легкостью справится с этой задачей. Программа поддерживает более 90 языков, таких как китайский, английский, японский...

2 года назад

074.5K

Описание: универсальное средство редактирования видео и подкастов, такое же простое, как редактирование документа

Descript Общее описание Descript - это мощный, но простой в использовании инструмент для редактирования видео и подкастов. Он обладает лучшей в отрасли точностью и скоростью транскрипции, мощными инструментами коррекции, а также возможностью транскрибировать видео в текст с помощью технологии искусственного интеллекта и редактировать видео, редактируя текст. В дополнение к...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI аудио/видеоредактор

2 года назад

073.5K

XAudioPro: Профессиональный инструмент для редактирования аудио|Производство аудиокниг|Текст в речь|Разделение аккомпанемента

Общее представление XAudioPro - это профессиональный и портативный инструмент для редактирования и перекодирования аудио в режиме реального времени. Он поддерживает профессиональные функции редактирования аудио, такие как вырезание, обрезка, копирование, удаление, восстановление и контроль усиления амплитуды. Кроме того, он предоставляет услуги по устранению дефектов, такие как спектральное вычитание шума, низкочастотный...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI аудио/видеоредактор

2 года назад

073.5K

Orate: унифицированный API для интеграции известных технологий генерации речи, транскрипции речи и моделирования голоса

Общее представление Orate - это набор инструментов ИИ, ориентированный на генерацию и транскрипцию речи. Он предоставляет унифицированный API, который легко интегрируется с ведущими поставщиками ИИ, такими как OpenAI, ElevenLabs и AssemblyAI, чтобы помочь пользователям создавать принудительные...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # AI Speech to Text

1 год назад

073K

Audiblez: создание аудиокниг, преобразование электронных книг в аудиокниги с помощью Kokoro

Общее представление Audiblez - это проект с открытым исходным кодом, предназначенный для преобразования электронных книг (например, в формате .epub) в аудиокниги (например, в формате .m4b). Проект использует высококачественную технологию синтеза речи Kokoro для поддержки нескольких языков и нескольких голосов. Пользователи могут просто...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

072.6K

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...

2 года назад

071.8K

PlayAI: обеспечение плавного и эмоционального голосового диалога и услуги синтеза речи (на английском языке)

Общее представление PlayAI - это платформа искусственного интеллекта, ориентированная на генерацию речи и ее клонирование. Она предлагает широкий спектр речевых моделей, способных генерировать плавные и эмоциональные диалоги. Пользователи могут использовать платформу для создания персонализированных голосовых агентов, чтобы улучшить интерактивный опыт.Технология PlayAI применяет...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

071.5K

Звуковая вырезка: естественный человеческий голос Гималаи, платформа для создания аудиозаписей с несколькими дикторами

Всеобъемлющее представление Himalaya Audio Editor - это комплексная платформа для создания AI-аудио. Она предлагает мощные функции, которые поддерживают пользователей в создании подкастов профессионального уровня, многодорожечной записи, редактировании аудио и возможности преобразования текста в речь. Платформа также содержит множество опций для профессиональной озвучки, помогая пользователям...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI аудио/видеоредактор

2 года назад

070.6K

csm-mlx: модель генерации речи csm для устройств Apple

Всеобъемлющее введение csm-mlx основан на фреймворке MLX, разработанном компанией Apple, специально оптимизированном для модели речевого диалога Apple Silicon (Apple Silicon) CSM (Conversation Speech Model). Этот проект позволяет использовать...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

070.4K

Jellypod: производство многоязычных подкастов AI, создание, редактирование и распространение подкастов AI

Общее представление Jellypod - это мощная студия подкастов AI, разработанная для того, чтобы помочь пользователям легко создавать, редактировать и публиковать высококачественные подкасты AI. С помощью Jellypod пользователи могут создавать персональные подкаст-хосты, дорабатывать сценарии и публиковать подкасты на ...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

1 год назад

070.4K

PDF2Audio: инструмент для преобразования PDF в аудио, PDF в подкасты

Общее представление PDF2Audio - это проект с открытым исходным кодом, предназначенный для преобразования PDF-файлов в аудиоконтент, такой как подкасты, лекции и конспекты. Инструмент использует модель OpenAI GPT для генерации текста и преобразования текста в речь, и позволяет пользователям загружать несколько PDF ...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

070.1K

Listnr: Многоязычный генератор речи ИИ, преобразующая технология синтеза человеческого голоса

Общее представление Listnr - это программное обеспечение для преобразования текста в речь с генеративным движком AI, который создает синтез речи в 1000+ различных голосов на 142+ языках, включая клонирование вашего собственного голоса. Платформа обслуживает более 1 миллиона пользователей, просматривающих короткие видеоролики, YouTub...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

2 года назад

069.9K

NotebookLM: чтение с извлечением заметок о знаниях, генерация документов нескольких классов, голосовой диалог подкастов

Общее представление NotebookLM - это персонализированный инструмент для совместной работы с искусственным интеллектом от Google, призванный помочь пользователям использовать свой ум в полной мере. Пользователи могут загружать документы, а NotebookLM мгновенно обрабатывает содержимое этих источников, облегчая пользователям чтение...

Последние ресурсы по искусственному интеллекту Образовательные инструменты # AI # AI преобразование текста в речь # AI Примечания

1 год назад

069.3K

ElevenLabs MCP: услуга Speech Generation MCP

Общие сведения Введение ElevenLabs MCP - это официальный проект ElevenLabs с открытым исходным кодом, размещенный на GitHub. Это сервис, основанный на протоколе управления моделями (Model Context Protocol, MCP)...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь Услуги # MCP

1 год назад

068.8K

Open NotebookLM: конвертация PDF в подкасты с открытым исходным кодом

Общее представление Open NotebookLM - это проект с открытым исходным кодом, предназначенный для преобразования любого PDF-документа в подкаст. Инструмент использует модели Large Language Model (LLM) и Text-to-Speech (TTS) с открытым исходным кодом для обработки PDF-контента и создания естественного диалога, подходящего для аудиоподкастов...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

067.9K

ElevenLabs: Платформа для генерации высококачественной речи на основе искусственного интеллекта, инструменты для дублирования текста и клонирования речи

Общее представление ElevenLabs - это стартап из Нью-Йорка, США, специализирующийся в области генеративного ИИ речи. Компания предлагает ряд мощных сервисов для генерирования текста, речи, клонирования речи и распознавания речи.ElevenLabs преуспевает в...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

2 года назад

067.8K

Uberduck: ИИ-генерируемая рэп-музыка и платформа для клонирования голоса | Text to Speech

Общее представление Uberduck AI - это инновационная платформа, которая обеспечивает синтез певческих и разговорных голосов с помощью искусственного интеллекта для творческих агентств, музыкальных продюсеров и программистов. Пользователи могут выбирать различные музыкальные ритмы, генерировать тексты с помощью искусственного интеллекта или писать свои собственные, выбирать определенные звуки и в конечном итоге создавать рэп-песни...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI # AI Music

2 года назад

067.7K

IMS Toucan: быстрый и управляемый многоязычный (поддерживается 7000+ языков) инструмент преобразования текста в речь

Общее представление IMS Toucan - это современный набор инструментов для преобразования текста в речь (TTS), разработанный Институтом обработки естественного языка (IMS) при Штутгартском университете, Германия. Инструментарий поддерживает более 7000 языков, отличается быстродействием, управляемостью и низкими требованиями к вычислительным ресурсам.IMS...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

066.9K

Операционный проект с открытым исходным кодом, объединяющий несколько передовых сервисов синтеза речи

Общее представление Open-VoiceCanvas - это платформа синтеза речи с открытым исходным кодом, разработанная командой ItusiAI. Она поддерживает более 50 языков, позволяет преобразовывать текст в естественную речь, а также клонировать персональные голоса путем загрузки аудиозаписей. Проект интегрирует Ope...

1 год назад

066.9K

Autiobooks: конвертация электронных книг epub в аудиокниги m4b

Общее представление Autiobooks - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования электронных книг в формате .epub в аудиокниги в формате .m4b. Он использует высококачественную технологию синтеза речи, предоставленную компанией Kokoro, для создания естественного и плавного аудио. Этот инструмент работает на...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

066.5K

Кот и Звезда: приложение для прослушивания сказок, позволяющее сочинять эксклюзивные сказки вместе с ребенком

Общее представление "Кот и звезда" (maoyuxing.com) - это интерактивная платформа для создания сказок, предназначенная для детей, помогающая родителям и детям вместе создавать персонализированные сказки с помощью мобильных приложений. Пользователи могут вводить такую информацию, как имя ребенка и его предпочтения, чтобы создавать уникальные сказки...

Последние ресурсы по искусственному интеллекту Образовательные инструменты # AI # AI преобразование текста в речь

1 год назад

066.3K

Podcastfy：多源内容转多语言音频对话工具，NotebookLM 播客功能的开源替代方案

Podcastfy: многоисточниковый контент для многоязычного аудиоразговора, альтернатива с открытым исходным кодом возможностям подкастинга NotebookLM

Общее введение Podcastfy - это пакет Python с открытым исходным кодом, который использует технологию генеративного искусственного интеллекта (GenAI) для преобразования веб-контента, PDF-файлов, текста, изображений, видео с youtube и многих других источников в увлекательные многоязычные...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

2 года назад

066.1K

Resemble AI: платформа для синтеза речи на основе искусственного интеллекта | клонирование голоса | глубокое обнаружение фальшивых аудиозаписей

Всеобъемлющее введение Resemble AI - это платформа синтеза речи на основе искусственного интеллекта, предназначенная для предприятий. Платформа обеспечивает передовую технологию генерации голоса ИИ и глубокое обнаружение поддельных аудиозаписей для обеспечения информационной безопасности в будущем. Функции включают клонирование голоса, глубокое обнаружение поддельных аудиозаписей в реальном времени, технологию водяных знаков ИИ...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

2 года назад

065.9K

PlayHT: инструмент искусственного интеллекта для создания гиперреалистичной речи

Общее представление PlayHT - это эффективная онлайн-платформа, ориентированная на генерацию речи искусственным интеллектом, помогающая пользователям быстро преобразовывать текст в естественную и реалистичную речь. Она предоставляет более 600 голосов искусственного интеллекта, поддерживающих более 60 языков и различные акценты, для создания подкастов, образовательного контента, маркетингового продвижения...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

1 год назад

065.7K

Murf AI: Изменение голоса|Перевод речи в текст|Перевод текста в речь|Аудиоредактор

Общее представление Murf AI - это мощный онлайн-инструмент для создания голоса искусственного интеллекта, который преобразует текст в практически реальную человеческую речь. Он предлагает до 120+ вариантов голоса искусственного интеллекта, поддерживает 20+ языков и подходит для различных ситуаций, таких как подкасты, видео, профессиональные презентации и т.д.Му...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI Speech to Text

2 года назад

065.3K

Text2Voice: графический интерфейс преобразования текста в речь на основе кремниевых потоковых API

Общее представление Text2Voice - это инструмент с открытым исходным кодом, который обеспечивает функциональность преобразования текста в речь на основе кремниевого API потока, с чистым графическим интерфейсом пользователя (GUI) в качестве его лучшей особенности. Он был создан разработчиком Шелдоном Ли на GitHub, чтобы позволить...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

065.1K

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast: ИИ-инструмент для преобразования PDF в подкаст с помощью направляющих слов

Общее представление NVIDIA AI Blueprint: PDF to Podcast - это проект с открытым исходным кодом, разработанный NVIDIA для преобразования PDF-документов в увлекательный аудиоконтент. Проект использует NVIDIA NIM (NVID...

Новости ИИ # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

065.1K

Podcastle: инструмент с искусственным интеллектом для быстрого создания высококачественных подкастов

Общее представление Podcastle - это онлайн-платформа на основе искусственного интеллекта, которая помогает пользователям быстро создавать и редактировать высококачественные подкасты. Она объединяет в себе функции записи, редактирования и публикации, и пользователи могут делать все это через браузер без необходимости использования специализированного оборудования или сложного программного обеспечения. Платформа использует ...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI аудио/видеоредактор

1 год назад

063.7K

DupDub: видеоредактор с искусственным интеллектом | дубляж | перевод видео | оцифровка фотографий

Общее описание Dupdub - это платформа для создания подкастов и видеопрезентаций, которая предлагает ряд инструментов искусственного интеллекта для поддержки творчества пользователей. Функции охватывают создание текста в видео, предлагая услуги искусственного интеллекта по озвучиванию и дублированию видео, а также редактирование видео, транскрипцию и субтитры. Dupdub также ...

Последние ресурсы по искусственному интеллекту # AI Digital Man # AI преобразование текста в речь # AI Speech to Text

2 года назад

063.5K

Azure TTS Importer: интеграция служб синтеза речи в программы для чтения

Общее представление TTS Importer - это проект с открытым исходным кодом, предназначенный для легкого импорта сервисов синтеза речи Azure TTS (Text-to-Speech) в различные программы для чтения. Инструмент поддерживает несколько популярных программ для чтения, включая Read (legado...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

063K

Acoust: онлайн-платформы для генерации речи с помощью искусственного интеллекта и преобразования текста в речь (TTS)

Общее представление Acoust - это онлайн-платформа для генерации речи и преобразования текста в речь (TTS), которая использует новейшие технологии искусственного интеллекта для генерации реалистичной речи. Платформа также предоставляет мощные инструменты для редактирования видео, которые позволяют пользователям завершить создание видео без необходимости использования нескольких программ.Acou...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI Speech to Text

1 год назад

061.9K

Audibit: превращение популярных технических статей в готовые к прослушиванию аудиоподкасты

Общее введение Audibit является проектом с открытым исходным кодом, основной функцией является Hacker News, TechCrunch и другие популярные статьи технологии автоматически превращаются в аудио подкасты, так что пользователи в коммутируют, фитнес или занят при прослушивании информации через Интернет или мобильных. Проект делает ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

061.3K

Wondercraft: инструмент преобразования текста в звук, ориентированный на озвучивание рекламы, многопользовательские аудиокниги и подкасты

Общие сведения Wondercraft - это революционная платформа для создания аудио- и видеоматериалов на основе искусственного интеллекта, которая предоставляет создателям контента универсальное решение для производства аудио- и видеоматериалов. Используя передовые технологии искусственного интеллекта, платформа способна преобразовывать текстовый контент в естественную и плавную речь, поддерживая более 20 языков...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

1 год назад

060K

Seaweed AI: интеллектуальный синтез речи и платформа для клонирования голоса

Всеобъемлющее введение Seaweed AI - это интеллектуальный продукт для дубляжа, который может преобразовывать текст в голос в режиме онлайн на базе открытой платформы Yun Zhisheng AI. Пользователи могут самостоятельно добиваться клонирования голоса, предоставлять дикторов ИИ разного пола, акцента и языка, а также напрямую дублировать голос после ввода текста. Он может быстро дублировать короткие...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # Клонирование голоса AI

2 года назад

060K

QuickPiperAudiobook：一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: ключ для создания аудиокниг с естественным качеством звука, поддержка PDF, epub, docx и других форматов

Введение QuickPiperAudiobook - это проект с открытым исходным кодом, предназначенный для преобразования различных текстовых форматов (например, epub, mobi, txt, PDF, HTML и т.д.) в аудиокниги с естественным звучанием с помощью простой одной команды. Инструмент использует Pi...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

2 года назад

059.4K

PodLM: создание многоязычных аудиоподкастов из диалогов, веб-страниц или длинных текстов (платно)

Общие сведения PodLM - это современная платформа для создания подкастов с искусственным интеллектом, которая помогает пользователям быстро преобразовывать текст, документы или URL-контент в высококачественные аудиоподкасты. Используя передовые технологии искусственного интеллекта, PodLM может автоматически генерировать структурированные и увлекательные сценарии подкастов и...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

057K

Из бумаги в подкаст: превращение академических статей в подкасты для бесед с несколькими людьми

Общее представление Paper to Podcast - это инструмент с открытым исходным кодом, специализирующийся на преобразовании академических научных работ в живые и увлекательные подкасты. Он использует технологию искусственного интеллекта, чтобы превратить статью в формате PDF в диалог между тремя персонажами - ведущим, учеником и экспертом - и сделать сложные...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

1 год назад

056.2K

NotebookLM Podcast: создание многоязычного персонализированного подкаста с искусственным интеллектом из любого документа (платно)

Общее описание NotebookLM Podcast - это инновационная платформа, которая использует технологию искусственного интеллекта для преобразования любого текстового контента в динамичные, увлекательные аудиоподкасты. Будь вы студент, педагог, создатель контента или занятой профессионал, NotebookLM...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь

2 года назад

056K

Дело не в этом.