ИИ преобразования речи в текст

Всего 56 статей

расставлять по порядку

Abogen: инструмент для преобразования различных текстовых форматов в аудиокниги

Общее представление Abogen - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования файлов ePub, PDF или обычного текста в высококачественный звук. Он использует модель Kokoro-82M для генерации естественной и плавной речи и поддерживает одновременную генерацию субтитров, что подходит для создания аудиокниг...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

11 месяцев назад

077.4K

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # AI Speech to Text

11 месяцев назад

0123.6K

ИИ на устройстве: инструмент для транскрипции голоса и чата с искусственным интеллектом для iPhone

Общее представление On-Device AI - это приложение для искусственного интеллекта, которое работает полностью автономно и предназначено для устройств Apple, поддерживающих iOS, macOS и visionOS. Оно обеспечивает локальный запуск крупномасштабной языковой модели (LLM), транскрипцию речи в реальном времени, анализ документов и т. д. без необходимости связывать...

Последние ресурсы по искусственному интеллекту Локализованное чат-приложение # AI # AI Speech to Text

11 месяцев назад

074.9K

Vexa: транскрипция совещаний в режиме реального времени и интеллектуальный инструмент извлечения знаний

Всеобъемлющее введение Vexa - это платформа для расшифровки встреч в реальном времени и управления знаниями с открытым исходным кодом, предназначенная для обеспечения эффективной записи встреч и интеллектуального извлечения знаний для предприятий и частных лиц. Она автоматически подключается к таким платформам, как Google Meet, Zoom и т. д., с помощью роботов для проведения совещаний, управляемых API...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Инструмент для обобщения текстов и аудио/видео с использованием искусственного интеллекта # AI Speech to Text

12 месяцев назад

0104K

Инструмент с открытым исходным кодом для преобразования речи в текст в реальном времени

Общее введение realtime-transcription-fastrtc - это проект с открытым исходным кодом, ориентированный на преобразование речи в текст в реальном времени. Он использует технологию FastRTC для обработки аудиопотоков с низкой задержкой, в сочетании с локальной моделью Whisper для достижения эффективного ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

067.1K

Транскриптор: интеллектуальный инструмент для транскрибирования с помощью искусственного интеллекта, превращающий аудио и видео в текст

Общее представление Transkriptor - это инструмент транскрипции, управляемый искусственным интеллектом, который ориентирован на быстрое преобразование аудио и видео в текст. Он поддерживает более 100 языков с точностью до 99% и подходит для широкого спектра сценариев, таких как встречи, интервью, заметки в классе и многое другое. Пользователи могут загружать файлы, направлять...

Последние ресурсы по искусственному интеллекту # Инструмент для обобщения текстов и аудио/видео с использованием искусственного интеллекта Перевод # AI # AI Speech to Text

1 год назад

078.5K

Otter.ai: интеллектуальный ассистент для совещаний с инструментом транскрипции голоса в реальном времени

Общее описание Otter.ai - это инструмент для управления совещаниями и расшифровки голоса на основе искусственного интеллекта, основной функцией которого является преобразование голоса в текст в режиме реального времени и автоматическое создание заметок, резюме и пунктов действий. Интеллектуальная поддержка осуществляется с помощью ИИ-агента совещаний, который автоматически добавляет...

Последние ресурсы по искусственному интеллекту # Инструмент для обобщения текстов и аудио/видео с использованием искусственного интеллекта # AI Speech to Text

1 год назад

068.1K

TurboScribe: онлайн-инструмент для быстрого преобразования аудио и видео в текст

Общее описание TurboScribe - это инструмент транскрипции на основе искусственного интеллекта, который предназначен для быстрого преобразования аудио и видео в текст. Он поддерживает более 98 языков с точностью 99,8% для пользователей, которым необходимо эффективно обрабатывать голосовой контент. Пользователи могут загружать файлы, генерировать текстовые заметки...

Последние ресурсы по искусственному интеллекту # AI Speech to Text

1 год назад

087.4K

Aqua Voice: генерация точного текста с помощью речевого ввода в различных приложениях

Общее представление Aqua Voice - это интеллектуальный инструмент для создания текста на основе речи, ориентированный на быстрое преобразование речи пользователя в форматированный текст. Она была создана в 2023 году Финнианом Брауном и Джеком Макинтайром и базируется в Соединенных Штатах...

Последние ресурсы по искусственному интеллекту # AI Speech to Text

1 год назад

0179.2K

Dolphin: распознавание азиатских языков и моделирование преобразования речи в текст для азиатских языков

Всеобъемлющее представление Dolphin - это модель с открытым исходным кодом, разработанная DataoceanAI и Университетом Цинхуа, ориентированная на распознавание речи и языков Азии. Она поддерживает 40 языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

062K

TwinMind: бесплатное автономное приложение для транскрипции голоса в текст

TwinMind - это умный инструмент, разработанный компанией ThirdEar AI, Inc. и "помогающий вам вспомнить все". Он может записывать и преобразовывать разговоры, встречи или лекции в текст в режиме реального времени, на более чем 100 языках, даже если ваш телефон находится в кармане, и...

1 год назад

059.5K

Wispr Flow: используйте голос для быстрого ввода текста в любом приложении

Общее описание Wispr Flow - это инструмент для ввода текста голосом, помогающий пользователям быстро писать на компьютере. Это в 3 раза быстрее, чем печатать, позволяет пользователям вводить текст в любые приложения, такие как Word, Slack или G...

Последние ресурсы по искусственному интеллекту # AI Speech to Text

10 месяцев назад

0126.9K

Совещание: локальная расшифровка в реальном времени и генерация протоколов совещаний в клиенте с открытым исходным кодом

Общее представление Meeting Minutes (также известная как Meetily) - это бесплатный инструмент с открытым исходным кодом, разработанный компанией Zackriya Solutions и предназначенный для захвата аудиозаписей собраний в режиме реального времени, создания транскрибированного текста и автоматического извлечения...

1 год назад

0105.8K

Local-NotebookLM: локальный PDF для создания голосовых подкастов инструментов с открытым исходным кодом

Всеобъемлющее введение Local-NotebookLM - это проект с открытым исходным кодом, целью которого является предоставление локально управляемых интеллектуальных инструментов для обработки документов и создания контента. Он вдохновлен Google NotebookLM, фокусируясь на помощи пользователям в PDF и других документов в различных ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

087.7K

AssemblyAI: высокоточная платформа для анализа речи в текст и аудиоинтеллекта

Общее представление AssemblyAI - это платформа, ориентированная на технологии речевого ИИ, предоставляющая разработчикам и предприятиям эффективные инструменты для анализа речи в текст и аудио. Ее основной изюминкой является семейство моделей Universal, особенно недавно выпущенная модель Universal-2...

Последние ресурсы по искусственному интеллекту # AI Open Services # AI Speech to Text

1 год назад

070.3K

FireRedASR: модель с открытым исходным кодом для многоязычного высокоточного распознавания речи

Общее представление FireRedASR - это модель распознавания речи, разработанная командой Little Red Book FireRed с открытым исходным кодом и направленная на создание высокоточных решений для автоматического распознавания речи (ASR) с поддержкой нескольких языков. Проект размещен на GitHub для разработчиков и исследователей и предлагает...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

0100.1K

WhisperChain: преобразование речи в текст в реальном времени и оптимизация произносимых слов

Общее представление WhisperChain - это проект с открытым исходным кодом на основе ИИ, размещенный на GitHub и возглавляемый разработчиком Крисом Чоем. В основном он используется для преобразования речи в текст и автоматической оптимизации выражения с помощью технологий искусственного интеллекта, удаляя лишние...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

056.9K

LLPlayer: Видеоплеер, генерирующий субтитры в реальном времени с двуязычным переводом

Общее представление LLPlayer - это медиаплеер с открытым исходным кодом для изучающих иностранные языки, размещенный на GitHub и созданный разработчиком umlx5h. В него интегрирован целый ряд полезных функций, таких как отображение субтитров на двух языках, автогенерируемые AI субтитры, перевод в реальном времени и поиск слов...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct Перевод # AI # AI Speech to Text

10 месяцев назад

0213.5K

CapsWriter-Offline: инструмент для ввода речи и транскрипции субтитров для ПК

Общее представление CapsWriter-Offline - это инструмент голосового ввода и транскрипции субтитров для ПК, размещенный на GitHub и созданный разработчиком HaujetZhao. Он работает полностью автономно и не требует подключения к Интернету для преобразования речи в текст и аудиовизуальных...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

067K

Whisper Input: бесплатный и высокоскоростной сервис транскрипции голоса в текст с помощью Groq.

Общее описание Whisper Input - это инструмент транскрипции голоса с открытым исходным кодом, который позволяет пользователям начинать запись голоса нажатием кнопки Option и заканчивать запись поднятием кнопки. Инструмент вызывает Groq Whisper Large V3 Turbo ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

073.6K

LiberSonora: извлечение субтитров аудиокниг и многоязычный перевод, транскрипция аудиокниг на несколько языков

Всеобъемлющее введение LiberSonora, что означает "свободный звук", - это мощный набор инструментов для создания аудиокниг с открытым исходным кодом и поддержкой искусственного интеллекта. Он поддерживает интеллектуальное извлечение субтитров, генерацию заголовков с помощью искусственного интеллекта, перевод на несколько языков и т. д. и способен выполнять пакетную автономную обработку с ускорением GPU.LiberSo...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct Перевод # AI # AI Speech to Text

1 год назад

054.1K

AudioNotes: быстрое извлечение аудио- и видеоматериалов и создание структурированных заметок

Всеобъемлющее введение AudioNotes - это система преобразования аудио/видео в структурированные заметки, построенная на FunASR и Qwen2. Она может быстро извлекать аудио/видео контент и вызывать большую модель для создания структурированных заметок в формате Markdown, что удобно для...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

057.1K

Orate: унифицированный API для интеграции известных технологий генерации речи, транскрипции речи и моделирования голоса

Общее представление Orate - это набор инструментов ИИ, ориентированный на генерацию и транскрипцию речи. Он предоставляет унифицированный API, который легко интегрируется с ведущими поставщиками ИИ, такими как OpenAI, ElevenLabs и AssemblyAI, чтобы помочь пользователям создавать принудительные...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # AI Speech to Text

1 год назад

064.2K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: более компактный и быстрый многоязычный инструмент для преобразования речи в текст, чем Whisper-Large v3

Всеобъемлющее введение PengChengStarling (PengCheng Labs) - это многоязычный инструмент автоматического распознавания речи (ASR), способный преобразовывать речь на разных языках в соответствующий текст. Этот набор инструментов разработан на основе проекта icefall и обеспечивает полный процесс распознавания речи...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

060.5K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: инструмент преобразования речи в текст в реальном времени для потокового распознавания речи с низкой задержкой на основе Whisper

Общее представление RealtimeSTT - это эффективная библиотека преобразования речи в текст в реальном времени с низкой задержкой и расширенными возможностями обнаружения речевой активности и активации слов для пробуждения. Она была разработана Колей Бейгелем для поддержки приложений, которым требуется быстрая и точная передача речи в текст...

Новости ИИ # AI Java Open Source Projecct # AI Speech to Text

1 год назад

089.3K

Sherpa-ONNX: автономное распознавание и синтез речи с помощью ONNXRuntime

Общее представление sherpa-onnx - это проект с открытым исходным кодом, разработанный командой Next-gen Kaldi для обеспечения эффективного распознавания речи и синтеза речи в автономном режиме. Он поддерживает множество платформ, включая Android, iOS, Raspber...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # AI Speech to Text

1 год назад

0285.1K

Acoust: онлайн-платформы для генерации речи с помощью искусственного интеллекта и преобразования текста в речь (TTS)

Общее представление Acoust - это онлайн-платформа для генерации речи и преобразования текста в речь (TTS), которая использует новейшие технологии искусственного интеллекта для генерации реалистичной речи. Платформа также предоставляет мощные инструменты для редактирования видео, которые позволяют пользователям завершить создание видео без необходимости использования нескольких программ.Acou...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI Speech to Text

1 год назад

053.8K

Notta: инструмент для записи совещаний и расшифровки аудиозаписей с помощью искусственного интеллекта для автоматической расшифровки совещаний, интервью или записей

Общее описание Notta - это мощный инструмент для записи совещаний и расшифровки аудиозаписей с искусственным интеллектом, предназначенный для автоматического преобразования совещаний, интервью или аудиозаписей в текст с возможностью поиска. С помощью Notta пользователи могут легко транскрибировать, редактировать, обобщать и сотрудничать для повышения производительности.Notta поддерживает...

1 год назад

077.6K

AI no jimaku gumi: автоматическое создание и перевод многоязычных субтитров для видео с помощью искусственного интеллекта

Общее представление AI no jimaku gumi (AI no subtitle group) - это мощный инструмент командной строки для обработки видео субтитров, предназначенный для автоматического извлечения, транскрипции и перевода видео субтитров. В инструмент интегрированы передовые технологии искусственного интеллекта, в том числе речевая технология Whisper...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct Перевод # AI # AI Speech to Text

1 год назад

063.5K

FunClip: интеллектуальное редактирование видеоконтента в короткометражные фильмы, простое и точное извлечение/обрезание видеоклипов

Всеобъемлющее введение FunClip - это полностью открытый локализованный инструмент для автоматического редактирования видео, разработанный речевой лабораторией TONGYI Института Alibaba Dharma. В инструмент интегрирована промышленная модель распознавания речи Paraformer-Large, которая может точно идентифицировать речь в видео...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text # AI аудио/видеоредактор

1 год назад

0112K

BetterWhisperX: автоматическое распознавание речи отдельно от диктора, обеспечивающее высокую точность временных меток на уровне слов

Общее введение BetterWhisperX - это оптимизированная версия проекта WhisperX, ориентированная на предоставление эффективных и точных услуг автоматического распознавания речи (ASR). Как улучшенное ответвление WhisperX, проект был разработан Федерико ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

076.2K

Freed: ассистент медицинской транскрипции с искусственным интеллектом, который точно расшифровывает разговоры между врачом и пациентом и сокращает объем бумажной работы по ведению документации.

Общее описание Freed - это ассистент медицинской транскрипции с искусственным интеллектом, предназначенный для медицинских работников. Он помогает врачам и другим медицинским работникам автоматизировать запись посещений пациентов, сократить объем бумажной работы и повысить эффективность труда благодаря передовым технологиям искусственного интеллекта.ИИ-транскрипция Freed...

Последние ресурсы по искусственному интеллекту # AI Speech to Text

1 год назад

057.4K

Voicenotes: голосовые заметки с искусственным интеллектом, запись и расшифровка голоса, интеллектуальное управление содержимым совещаний

Общее представление Voicenotes - это интеллектуальное приложение для голосовых заметок, которое помогает пользователям легко записывать и управлять голосовыми заметками и встречами. Приложение поддерживает транскрипцию голоса на более чем 100 языках. Пользователи просто говорят свои мысли, а Voicenotes автоматически транскрибирует их в текст...

Последние ресурсы по искусственному интеллекту # AI Примечания # AI Speech to Text

1 год назад

065.8K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Voice-Pro: многофункциональный инструмент для перевода видео с открытым исходным кодом, транскрипция и перевод голоса на множество языков, установка Windows одним щелчком мыши

Общее представление Voice-Pro - это универсальный инструмент на базе Gradio WebUI, который поддерживает преобразование речи в текст, текст в речь, перевод в реальном времени, загрузку видео с YouTube и разделение человеческого голоса. В него интегрированы технологии Whisper, Faster-Wh...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct Перевод # AI # AI Speech to Text

1 год назад

072.2K

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

Zamzar: Многофункциональный инструмент для конвертирования файлов в форматы, конвертирования видео | аудио | изображений | документов.

Общее представление Zamzar - это мощный онлайн-инструмент для конвертации файлов, поддерживающий более 1200 форматов. Будь то документы, изображения, видео, аудио или электронные книги, Zamzar может сделать это быстро и эффективно. Пользователям не нужно загружать программное обеспечение...

Последние ресурсы по искусственному интеллекту # AI Open Services # AI Speech to Text

1 год назад

079K

AI Hear: программное обеспечение для транскрипции и перевода речи в реальном времени, работающее в автономном режиме

Общее описание Если вы пользуетесь MacBook, попробуйте AI Hear: вы можете записывать звук, преобразовывать местную речь в текст в реальном времени, переводить и, в конечном счете, экспортировать субтитры. С его помощью вы сможете прослушивать встречи в разных странах и аудиокниги на английском языке. AI Hear - это локальное программное обеспечение, которое позволяет одним нажатием кнопки в режиме реального времени...

Последние ресурсы по искусственному интеллекту Перевод # AI # AI Speech to Text

1 год назад

062.6K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

SoniTranslate: решение для дубляжа видео с открытым исходным кодом, многократный дубляж, регулировка скорости и подражание оригинальному звуку

Общее описание SoniTranslate - это мощный и удобный инструмент для многоязычного дубляжа видео, предназначенный для перевода видео и синхронизации звука. Он использует передовые технологии распознавания речи и машинного перевода для перевода видеоконтента на несколько языков и синхронизации звука. ...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь Перевод # AI # AI Speech to Text

1 год назад

0138.2K

FunASR: Инструментарий для распознавания речи с открытым исходным кодом, разделение дикторов / распознавание диалоговой речи нескольких человек

Всеобъемлющее введение FunASR - это набор инструментов для распознавания речи с открытым исходным кодом, разработанный Институтом Дарма компании Alibaba для объединения академических исследований и промышленных приложений. Он поддерживает широкий спектр функций распознавания речи, включая распознавание речи (ASR), обнаружение голосовых точек (VAD), восстановление пунктуации, моделирование языка, говорение...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

0157.7K

AsrTools: инструмент преобразования речи в субтитры, легкий клиент со встроенными интерфейсами для Cutscene, Racer и Must-Cut

Всеобъемлющее введение AsrTools - это интеллектуальный инструмент преобразования речи в текст со встроенными интерфейсами от таких крупных игроков, как Cutscene, QuickScope, MustCut и т.д. Он не требует GPU или громоздкой конфигурации, а также поддерживает эффективную многопоточную пакетную обработку. Он основан на разработке PyQt5, имеет красивый и удобный интерфейс, способен выводить слова в форматах SRT и TXT...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

2 года назад

077.1K

Happy Scribe: Платформа для транскрибирования аудио и субтитрирования видео | Бесплатная программа для субтитрирования видео

Happy Scribe Общее описание Happy Scribe предоставляет услуги по автоматической и ручной транскрипции аудиозаписей для преобразования аудио в текст с высокой точностью и поддержкой множества языков и форматов. Он включает в себя интерактивный редактор, инструменты для совместной работы, несколько форматов экспорта, машинный перевод и другие функции...

Последние ресурсы по искусственному интеллекту # AI Speech to Text # AI аудио/видеоредактор

2 года назад

068.7K

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

Whisper GPGPU: OpenAI Whisper работает под Windows|Whisperdesktop

Общее представление Whisper - это проект с открытым исходным кодом на GitHub, разработанный компанией Const-me и направленный на высокопроизводительный вывод модели автоматического распознавания речи (ASR) Whisper от OpenAI с использованием GPGPU. Этот проект основан на лицензии MPL-2.0...

Последние ресурсы по искусственному интеллекту # AI Speech to Text

2 года назад

0105.9K

Buzz: открытый источник автономной транскрипции аудио инструмент перевода | IOS транскрипции голоса

Buzz Общее представление Buzz - это проект с открытым исходным кодом, созданный chidiwilliams, который позволяет транскрибировать и переводить аудио в автономном режиме на персональных компьютерах. Проект опирается на технологию Whisper от OpenAI, которая позволяет пользователям не зависеть от подключения к интернету при работе с аудиотекстом...

Последние ресурсы по искусственному интеллекту # AI Speech to Text

2 года назад

0142.4K

Deepgram: сервисный API для решений по высокоточному распознаванию и синтезу речи

Общее описание Deepgram - компания, специализирующаяся на технологиях распознавания речи и обработки естественного языка, предлагающая мощные API Speech-to-Text и Text-to-Speech.Платформа использует передовой искусственный интеллект...

Последние ресурсы по искусственному интеллекту # AI Open Services # AI Speech to Text

1 год назад

074.8K

Murf AI: Изменение голоса|Перевод речи в текст|Перевод текста в речь|Аудиоредактор

Общее представление Murf AI - это мощный онлайн-инструмент для создания голоса искусственного интеллекта, который преобразует текст в практически реальную человеческую речь. Он предлагает до 120+ вариантов голоса искусственного интеллекта, поддерживает 20+ языков и подходит для различных ситуаций, таких как подкасты, видео, профессиональные презентации и т.д.Му...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI Speech to Text

2 года назад

056.6K

VideoLingo：视频转录单词级时间轴字幕，视频字幕翻译和本地化配音开源工具

VideoLingo: транскрипция видео на уровне слов, перевод субтитров и локализованный дубляж с открытым исходным кодом.

Общее описание VideoLingo - это универсальный инструмент для перевода и дубляжа видео, предназначенный для создания высококачественных субтитров уровня Netflix, исключающий необработанный машинный перевод и многострочные субтитры, а также добавляющий высококачественные закадровые голоса, что позволяет обмениваться глобальными знаниями, преодолевая языковые барьеры. По...

Последние ресурсы по искусственному интеллекту # AI Side Hustle Money Making Project Перевод # AI # AI Speech to Text

1 год назад

065.1K

ALog: портативное приложение для ведения голосового дневника с искусственным интеллектом и поддержкой преобразования речи в текст.

Общее представление ALog - это приложение для ведения голосового дневника на основе ИИ, призванное помочь пользователям записывать свою повседневную жизнь с помощью голоса. Оно разработано компанией duxins и размещено в открытом доступе на GitHub. Пользователи могут записывать дневниковые записи с помощью голосового ввода, а приложение автоматически преобразует голос в текст...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

060.7K

Record Cafe: универсальная платформа для обработки аудио/видео|генерация видео|AI-субтитров|извлечение звука|передача речи в текст

Всеобъемлющее введение Record Cafe - это универсальная платформа для обработки аудио/видео, предоставляющая услуги по созданию видеодиалогов AI, субтитров AI и преобразованию речи AI в текст. Функции включают запись экрана, редактирование видео, конвертирование GIF/аудио и т.д., а также поддерживают облачное хранение и обмен. Интерфейс интуитивно понятен и прост в использовании, а также поддерживает многоэкранную запись и многоязычный смарт...

Последние ресурсы по искусственному интеллекту # AI текст в видео # AI преобразование текста в речь # AI Speech to Text

1 год назад

066.3K

CrisperWhisper: инструмент для точной стенографической расшифровки речи

Общее описание CrisperWhisper - это продвинутый инструмент распознавания речи, основанный на OpenAI Whisper и ориентированный на быструю, точную и пословную транскрипцию речи. Он обеспечивает точные временные метки на уровне слов, даже в случае заполнения речи и пауз...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

070.7K

Babelfish.ai: приложение для транскрипции и перевода речи в реальном времени, запускаемое через браузер

Общие сведения Введение Babelfish.ai - это приложение для транскрипции и перевода в реальном времени, построенное на Huggingface Transformer.js и Supabase Realtime. Приложение может загружать большие модели в браузер и...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

2 года назад

052.4K

FreeTTS: Free Online Text-to-Speech Tool|Audio Enhancement|Audio Clips

FreeTTS Общее описание FreeTTS - это бесплатный онлайновый инструмент преобразования текста в речь, который позволяет пользователям конвертировать текст в естественные голосовые файлы. Поддерживая множество языков и вариантов звучания, пользователи могут конвертировать текст в форматы MP3, WAV, OGG и ACC...

Последние ресурсы по искусственному интеллекту # AI преобразование текста в речь # AI Speech to Text # AI аудио/видеоредактор

2 года назад

068.2K

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь # Клонирование голоса AI

2 года назад

063.4K

DupDub: видеоредактор с искусственным интеллектом | дубляж | перевод видео | оцифровка фотографий

Общее описание Dupdub - это платформа для создания подкастов и видеопрезентаций, которая предлагает ряд инструментов искусственного интеллекта для поддержки творчества пользователей. Функции охватывают создание текста в видео, предлагая услуги искусственного интеллекта по озвучиванию и дублированию видео, а также редактирование видео, транскрипцию и субтитры. Dupdub также ...

Последние ресурсы по искусственному интеллекту # AI Digital Man # AI преобразование текста в речь # AI Speech to Text

2 года назад

054.9K

Tongyi Слушать и понимать: ИИ-помощник Ali Tongyi для транскрибирования аудио- и видеоконтента

Всеобъемлющее представление Tongyi Listening and Understanding - это ИИ-помощник для работы, запущенный компанией Aliyun, который занимается расшифровкой и анализом аудио- и видеоконтента. Он опирается на мощные модели искусственного интеллекта AliCloud для транскрибирования аудио- и видеоконтента в текст в режиме реального времени, а также обеспечивает перевод, обобщение, позиционирование и другие функции. Tongyi Listening Woo поддерживает множество языков и сценариев...

2 года назад

067.3K

Insanely Fast Whisper: быстрая и эффективная транскрипция речи в текст с открытым исходным кодом

Всеобъемлющее представление insanely-fast-whisper - это аудиопередача, которая сочетает модель Whisper от OpenAI с различными техниками оптимизации (например, Transformers, Optimum, Flash Attention)...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Speech to Text

1 год назад

068.7K

Memo AI: родной клиент для преобразования видео в субтитры, конвертирования многоязычных субтитров

Общее описание MemoAI - это мощный инструмент для перевода видео, предназначенный для преобразования видео- и аудиофайлов в текст, субтитры и заметки. Будь то видео с YouTube, подкаст или локальный файл, MemoAI с легкостью справится с этой задачей. Программа поддерживает более 90 языков, таких как китайский, английский, японский...

1 год назад

065.6K

pyvideotrans: Инструмент для дубляжа видеопереводов

pyVideoTrans Общее представление pyvideotrans - это инструмент для дублирования видеопереводов. Пользователи могут переводить видеоконтент с одного языка на другой, а также добавлять к нему дубляж и субтитры. Он основан на openai-whisper offline...

2 года назад

082.5K

Дело не в этом.