ИИ преобразования речи в текст

Всего 56 статей
расставлять по порядку
Abogen:将多种文本格式转换为有声读物的工具

Abogen: инструмент для преобразования различных текстовых форматов в аудиокниги

Общее представление Abogen - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования файлов ePub, PDF или обычного текста в высококачественный звук. Он использует модель Kokoro-82M для генерации естественной и плавной речи и поддерживает одновременную генерацию субтитров, что подходит для создания аудиокниг...
4 месяца назад
08.4K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...
4 месяца назад
09K
On Device AI:iPhone本地运行的AI语音转录与聊天工具

ИИ на устройстве: инструмент для транскрипции голоса и чата с искусственным интеллектом для iPhone

Общее представление On-Device AI - это приложение для искусственного интеллекта, которое работает полностью автономно и предназначено для устройств Apple, поддерживающих iOS, macOS и visionOS. Оно обеспечивает локальный запуск крупномасштабной языковой модели (LLM), транскрипцию речи в реальном времени, анализ документов и т. д. без необходимости связывать...
4 месяца назад
07.7K
Vexa:实时会议转录与智能知识提取工具

Vexa: транскрипция совещаний в режиме реального времени и интеллектуальный инструмент извлечения знаний

Всеобъемлющее введение Vexa - это платформа для расшифровки встреч в реальном времени и управления знаниями с открытым исходным кодом, предназначенная для обеспечения эффективной записи встреч и интеллектуального извлечения знаний для предприятий и частных лиц. Она автоматически подключается к таким платформам, как Google Meet, Zoom и т. д., с помощью роботов для проведения совещаний, управляемых API...
4 месяца назад
011.3K
实时语音转文字的开源工具

Инструмент с открытым исходным кодом для преобразования речи в текст в реальном времени

Общее введение realtime-transcription-fastrtc - это проект с открытым исходным кодом, ориентированный на преобразование речи в текст в реальном времени. Он использует технологию FastRTC для обработки аудиопотоков с низкой задержкой, в сочетании с локальной моделью Whisper для достижения эффективного ...
5 месяцев назад
010.5K
Transkriptor:将音频和视频转为文字的AI智能转录工具

Транскриптор: интеллектуальный инструмент для транскрибирования с помощью искусственного интеллекта, превращающий аудио и видео в текст

Общее представление Transkriptor - это инструмент транскрипции, управляемый искусственным интеллектом, который ориентирован на быстрое преобразование аудио и видео в текст. Он поддерживает более 100 языков с точностью до 99% и подходит для широкого спектра сценариев, таких как встречи, интервью, заметки в классе и многое другое. Пользователи могут загружать файлы, направлять...
5 месяцев назад
09.7K
Otter.ai:智能会议助手与实时语音转录工具

Otter.ai: интеллектуальный ассистент для совещаний с инструментом транскрипции голоса в реальном времени

Общее описание Otter.ai - это инструмент для управления совещаниями и расшифровки голоса на основе искусственного интеллекта, основной функцией которого является преобразование голоса в текст в режиме реального времени и автоматическое создание заметок, резюме и пунктов действий. Интеллектуальная поддержка осуществляется с помощью ИИ-агента совещаний, который автоматически добавляет...
5 месяцев назад
08.5K
TurboScribe:快速将音频和视频转为文字的在线工具

TurboScribe: онлайн-инструмент для быстрого преобразования аудио и видео в текст

Общее описание TurboScribe - это инструмент транскрипции на основе искусственного интеллекта, который предназначен для быстрого преобразования аудио и видео в текст. Он поддерживает более 98 языков с точностью 99,8% для пользователей, которым необходимо эффективно обрабатывать голосовой контент. Пользователи могут загружать файлы, генерировать текстовые заметки...
5 месяцев назад
010.9K
Aqua Voice:跨应用语音输入生成精准文本

Aqua Voice: генерация точного текста с помощью речевого ввода в различных приложениях

Общее представление Aqua Voice - это интеллектуальный инструмент для создания текста на основе речи, ориентированный на быстрое преобразование речи пользователя в форматированный текст. Она была создана в 2023 году Финнианом Брауном и Джеком Макинтайром и базируется в Соединенных Штатах...
5 месяцев назад
014.2K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: распознавание азиатских языков и моделирование преобразования речи в текст для азиатских языков

Всеобъемлющее представление Dolphin - это модель с открытым исходным кодом, разработанная DataoceanAI и Университетом Цинхуа, ориентированная на распознавание речи и языков Азии. Она поддерживает 40 языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта...
5 месяцев назад
07.7K
TwinMind:免费离线语音转录文字的APP

TwinMind: бесплатное автономное приложение для транскрипции голоса в текст

TwinMind - это умный инструмент, разработанный компанией ThirdEar AI, Inc. и "помогающий вам вспомнить все". Он может записывать и преобразовывать разговоры, встречи или лекции в текст в режиме реального времени, на более чем 100 языках, даже если ваш телефон находится в кармане, и...
5 месяцев назад
08.2K
Wispr Flow:用语音在任何应用中快速输入文字

Wispr Flow: используйте голос для быстрого ввода текста в любом приложении

Общее описание Wispr Flow - это инструмент для ввода текста голосом, помогающий пользователям быстро писать на компьютере. Это в 3 раза быстрее, чем печатать, позволяет пользователям вводить текст в любые приложения, такие как Word, Slack или G...
2 месяца назад
015K
Meeting:本地实时转录和生成会议纪要的开源客户端

Совещание: локальная расшифровка в реальном времени и генерация протоколов совещаний в клиенте с открытым исходным кодом

Общее представление Meeting Minutes (также известная как Meetily) - это бесплатный инструмент с открытым исходным кодом, разработанный компанией Zackriya Solutions и предназначенный для захвата аудиозаписей собраний в режиме реального времени, создания транскрибированного текста и автоматического извлечения...
6 месяцев назад
011.2K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: локальный PDF для создания голосовых подкастов инструментов с открытым исходным кодом

Всеобъемлющее введение Local-NotebookLM - это проект с открытым исходным кодом, целью которого является предоставление локально управляемых интеллектуальных инструментов для обработки документов и создания контента. Он вдохновлен Google NotebookLM, фокусируясь на помощи пользователям в PDF и других документов в различных ...
6 месяцев назад
09.6K
AssemblyAI:高精度语音转文字与音频智能分析平台

AssemblyAI: высокоточная платформа для анализа речи в текст и аудиоинтеллекта

Общее представление AssemblyAI - это платформа, ориентированная на технологии речевого ИИ, предоставляющая разработчикам и предприятиям эффективные инструменты для анализа речи в текст и аудио. Ее основной изюминкой является семейство моделей Universal, особенно недавно выпущенная модель Universal-2...
6 месяцев назад
09.2K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: модель с открытым исходным кодом для многоязычного высокоточного распознавания речи

Общее представление FireRedASR - это модель распознавания речи, разработанная командой Little Red Book FireRed с открытым исходным кодом и направленная на создание высокоточных решений для автоматического распознавания речи (ASR) с поддержкой нескольких языков. Проект размещен на GitHub для разработчиков и исследователей и предлагает...
6 месяцев назад
011.7K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain: преобразование речи в текст в реальном времени и оптимизация произносимых слов

Общее представление WhisperChain - это проект с открытым исходным кодом на основе ИИ, размещенный на GitHub и возглавляемый разработчиком Крисом Чоем. В основном он используется для преобразования речи в текст и автоматической оптимизации выражения с помощью технологий искусственного интеллекта, удаляя лишние...
6 месяцев назад
08K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: Видеоплеер, генерирующий субтитры в реальном времени с двуязычным переводом

Общее представление LLPlayer - это медиаплеер с открытым исходным кодом для изучающих иностранные языки, размещенный на GitHub и созданный разработчиком umlx5h. В него интегрирован целый ряд полезных функций, таких как отображение субтитров на двух языках, автогенерируемые AI субтитры, перевод в реальном времени и поиск слов...
2 месяца назад
015.5K
CapsWriter-Offline:PC端的语音输入和字幕转录工具

CapsWriter-Offline: инструмент для ввода речи и транскрипции субтитров для ПК

Общее представление CapsWriter-Offline - это инструмент голосового ввода и транскрипции субтитров для ПК, размещенный на GitHub и созданный разработчиком HaujetZhao. Он работает полностью автономно и не требует подключения к Интернету для преобразования речи в текст и аудиовизуальных...
6 месяцев назад
08.6K
Whisper Input:利用Groq免费且高速的语音转录文本服务

Whisper Input: бесплатный и высокоскоростной сервис транскрипции голоса в текст с помощью Groq.

Общее описание Whisper Input - это инструмент транскрипции голоса с открытым исходным кодом, который позволяет пользователям начинать запись голоса нажатием кнопки Option и заканчивать запись поднятием кнопки. Инструмент вызывает Groq Whisper Large V3 Turbo ...
6 месяцев назад
09.5K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora: извлечение субтитров аудиокниг и многоязычный перевод, транскрипция аудиокниг на несколько языков

Всеобъемлющее введение LiberSonora, что означает "свободный звук", - это мощный набор инструментов для создания аудиокниг с открытым исходным кодом и поддержкой искусственного интеллекта. Он поддерживает интеллектуальное извлечение субтитров, генерацию заголовков с помощью искусственного интеллекта, перевод на несколько языков и т. д. и способен выполнять пакетную автономную обработку с ускорением GPU.LiberSo...
7 месяцев назад
08.2K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: быстрое извлечение аудио- и видеоматериалов и создание структурированных заметок

Всеобъемлющее введение AudioNotes - это система преобразования аудио/видео в структурированные заметки, построенная на FunASR и Qwen2. Она может быстро извлекать аудио/видео контент и вызывать большую модель для создания структурированных заметок в формате Markdown, что удобно для...
7 месяцев назад
08.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: унифицированный API для интеграции известных технологий генерации речи, транскрипции речи и моделирования голоса

Общее представление Orate - это набор инструментов ИИ, ориентированный на генерацию и транскрипцию речи. Он предоставляет унифицированный API, который легко интегрируется с ведущими поставщиками ИИ, такими как OpenAI, ElevenLabs и AssemblyAI, чтобы помочь пользователям создавать принудительные...
7 месяцев назад
010.3K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: более компактный и быстрый многоязычный инструмент для преобразования речи в текст, чем Whisper-Large v3

Всеобъемлющее введение PengChengStarling (PengCheng Labs) - это многоязычный инструмент автоматического распознавания речи (ASR), способный преобразовывать речь на разных языках в соответствующий текст. Этот набор инструментов разработан на основе проекта icefall и обеспечивает полный процесс распознавания речи...
7 месяцев назад
08K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: инструмент преобразования речи в текст в реальном времени для потокового распознавания речи с низкой задержкой на основе Whisper

Общее представление RealtimeSTT - это эффективная библиотека преобразования речи в текст в реальном времени с низкой задержкой и расширенными возможностями обнаружения речевой активности и активации слов для пробуждения. Она была разработана Колей Бейгелем для поддержки приложений, которым требуется быстрая и точная передача речи в текст...
7 месяцев назад
09.4K
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成

Sherpa-ONNX: автономное распознавание и синтез речи с помощью ONNXRuntime

Общее представление sherpa-onnx - это проект с открытым исходным кодом, разработанный командой Next-gen Kaldi для обеспечения эффективного распознавания речи и синтеза речи в автономном режиме. Он поддерживает множество платформ, включая Android, iOS, Raspber...
7 месяцев назад
029.8K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: онлайн-платформы для генерации речи с помощью искусственного интеллекта и преобразования текста в речь (TTS)

Общее представление Acoust - это онлайн-платформа для генерации речи и преобразования текста в речь (TTS), которая использует новейшие технологии искусственного интеллекта для генерации реалистичной речи. Платформа также предоставляет мощные инструменты для редактирования видео, которые позволяют пользователям завершить создание видео без необходимости использования нескольких программ.Acou...
8 месяцев назад
07.4K
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音

Notta: инструмент для записи совещаний и расшифровки аудиозаписей с помощью искусственного интеллекта для автоматической расшифровки совещаний, интервью или записей

Общее описание Notta - это мощный инструмент для записи совещаний и расшифровки аудиозаписей с искусственным интеллектом, предназначенный для автоматического преобразования совещаний, интервью или аудиозаписей в текст с возможностью поиска. С помощью Notta пользователи могут легко транскрибировать, редактировать, обобщать и сотрудничать для повышения производительности.Notta поддерживает...
8 месяцев назад
010.2K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: автоматическое создание и перевод многоязычных субтитров для видео с помощью искусственного интеллекта

Общее представление AI no jimaku gumi (AI no subtitle group) - это мощный инструмент командной строки для обработки видео субтитров, предназначенный для автоматического извлечения, транскрипции и перевода видео субтитров. В инструмент интегрированы передовые технологии искусственного интеллекта, в том числе речевая технология Whisper...
8 месяцев назад
07.8K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: интеллектуальное редактирование видеоконтента в короткометражные фильмы, простое и точное извлечение/обрезание видеоклипов

Всеобъемлющее введение FunClip - это полностью открытый локализованный инструмент для автоматического редактирования видео, разработанный речевой лабораторией TONGYI Института Alibaba Dharma. В инструмент интегрирована промышленная модель распознавания речи Paraformer-Large, которая может точно идентифицировать речь в видео...
8 месяцев назад
012.4K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: автоматическое распознавание речи отдельно от диктора, обеспечивающее высокую точность временных меток на уровне слов

Общее введение BetterWhisperX - это оптимизированная версия проекта WhisperX, ориентированная на предоставление эффективных и точных услуг автоматического распознавания речи (ASR). Как улучшенное ответвление WhisperX, проект был разработан Федерико ...
8 месяцев назад
010K
Freed:AI医疗抄写助手,准确转录医生和患者对话,减少就诊记录文书工作

Freed: ассистент медицинской транскрипции с искусственным интеллектом, который точно расшифровывает разговоры между врачом и пациентом и сокращает объем бумажной работы по ведению документации.

Общее описание Freed - это ассистент медицинской транскрипции с искусственным интеллектом, предназначенный для медицинских работников. Он помогает врачам и другим медицинским работникам автоматизировать запись посещений пациентов, сократить объем бумажной работы и повысить эффективность труда благодаря передовым технологиям искусственного интеллекта.ИИ-транскрипция Freed...
8 месяцев назад
08.7K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

Voicenotes: голосовые заметки с искусственным интеллектом, запись и расшифровка голоса, интеллектуальное управление содержимым совещаний

Общее представление Voicenotes - это интеллектуальное приложение для голосовых заметок, которое помогает пользователям легко записывать и управлять голосовыми заметками и встречами. Приложение поддерживает транскрипцию голоса на более чем 100 языках. Пользователи просто говорят свои мысли, а Voicenotes автоматически транскрибирует их в текст...
8 месяцев назад
09.6K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: многофункциональный инструмент для перевода видео с открытым исходным кодом, транскрипция и перевод голоса на множество языков, установка Windows одним щелчком мыши

Общее представление Voice-Pro - это универсальный инструмент на базе Gradio WebUI, который поддерживает преобразование речи в текст, текст в речь, перевод в реальном времени, загрузку видео с YouTube и разделение человеческого голоса. В него интегрированы технологии Whisper, Faster-Wh...
9 месяцев назад
09.2K
Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换

Zamzar: Многофункциональный инструмент для конвертирования файлов в форматы, конвертирования видео | аудио | изображений | документов.

Общее представление Zamzar - это мощный онлайн-инструмент для конвертации файлов, поддерживающий более 1200 форматов. Будь то документы, изображения, видео, аудио или электронные книги, Zamzar может сделать это быстро и эффективно. Пользователям не нужно загружать программное обеспечение...
10 месяцев назад
011.8K
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear: программное обеспечение для транскрипции и перевода речи в реальном времени, работающее в автономном режиме

Общее описание Если вы пользуетесь MacBook, попробуйте AI Hear: вы можете записывать звук, преобразовывать местную речь в текст в реальном времени, переводить и, в конечном счете, экспортировать субтитры. С его помощью вы сможете прослушивать встречи в разных странах и аудиокниги на английском языке. AI Hear - это локальное программное обеспечение, которое позволяет одним нажатием кнопки в режиме реального времени...
10 месяцев назад
09.4K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate: решение для дубляжа видео с открытым исходным кодом, многократный дубляж, регулировка скорости и подражание оригинальному звуку

Общее описание SoniTranslate - это мощный и удобный инструмент для многоязычного дубляжа видео, предназначенный для перевода видео и синхронизации звука. Он использует передовые технологии распознавания речи и машинного перевода для перевода видеоконтента на несколько языков и синхронизации звука. ...
10 месяцев назад
017.2K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: Инструментарий для распознавания речи с открытым исходным кодом, разделение дикторов / распознавание диалоговой речи нескольких человек

Всеобъемлющее введение FunASR - это набор инструментов для распознавания речи с открытым исходным кодом, разработанный Институтом Дарма компании Alibaba для объединения академических исследований и промышленных приложений. Он поддерживает широкий спектр функций распознавания речи, включая распознавание речи (ASR), обнаружение голосовых точек (VAD), восстановление пунктуации, моделирование языка, говорение...
10 месяцев назад
016.6K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: инструмент преобразования речи в субтитры, легкий клиент со встроенными интерфейсами для Cutscene, Racer и Must-Cut

Всеобъемлющее введение AsrTools - это интеллектуальный инструмент преобразования речи в текст со встроенными интерфейсами от таких крупных игроков, как Cutscene, QuickScope, MustCut и т.д. Он не требует GPU или громоздкой конфигурации, а также поддерживает эффективную многопоточную пакетную обработку. Он основан на разработке PyQt5, имеет красивый и удобный интерфейс, способен выводить слова в форматах SRT и TXT...
11 месяцев назад
010.9K
Happy Scribe:音频转录和视频字幕平台|免费视频字幕编辑软件

Happy Scribe: Платформа для транскрибирования аудио и субтитрирования видео | Бесплатная программа для субтитрирования видео

Happy Scribe Общее описание Happy Scribe предоставляет услуги по автоматической и ручной транскрипции аудиозаписей для преобразования аудио в текст с высокой точностью и поддержкой множества языков и форматов. Он включает в себя интерактивный редактор, инструменты для совместной работы, несколько форматов экспорта, машинный перевод и другие функции...
11 месяцев назад
010.1K
Whisper GPGPU:运行在Windows的OpenAI Whisper|Whisperdesktop

Whisper GPGPU: OpenAI Whisper работает под Windows|Whisperdesktop

Общее представление Whisper - это проект с открытым исходным кодом на GitHub, разработанный компанией Const-me и направленный на высокопроизводительный вывод модели автоматического распознавания речи (ASR) Whisper от OpenAI с использованием GPGPU. Этот проект основан на лицензии MPL-2.0...
11 месяцев назад
015.7K
Buzz:开源离线音频转写翻译工具|IOS语音转录

Buzz: открытый источник автономной транскрипции аудио инструмент перевода | IOS транскрипции голоса

Buzz Общее представление Buzz - это проект с открытым исходным кодом, созданный chidiwilliams, который позволяет транскрибировать и переводить аудио в автономном режиме на персональных компьютерах. Проект опирается на технологию Whisper от OpenAI, которая позволяет пользователям не зависеть от подключения к интернету при работе с аудиотекстом...
11 месяцев назад
013.1K
Deepgram:高精度语音识别和合成解决方案服务API

Deepgram: сервисный API для решений по высокоточному распознаванию и синтезу речи

Общее описание Deepgram - компания, специализирующаяся на технологиях распознавания речи и обработки естественного языка, предлагающая мощные API Speech-to-Text и Text-to-Speech.Платформа использует передовой искусственный интеллект...
5 месяцев назад
010.1K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI: Изменение голоса|Перевод речи в текст|Перевод текста в речь|Аудиоредактор

Общее представление Murf AI - это мощный онлайн-инструмент для создания голоса искусственного интеллекта, который преобразует текст в практически реальную человеческую речь. Он предлагает до 120+ вариантов голоса искусственного интеллекта, поддерживает 20+ языков и подходит для различных ситуаций, таких как подкасты, видео, профессиональные презентации и т.д.Му...
11 месяцев назад
09.9K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: транскрипция видео на уровне слов, перевод субтитров и локализованный дубляж с открытым исходным кодом.

Общее описание VideoLingo - это универсальный инструмент для перевода и дубляжа видео, предназначенный для создания высококачественных субтитров уровня Netflix, исключающий необработанный машинный перевод и многострочные субтитры, а также добавляющий высококачественные закадровые голоса, что позволяет обмениваться глобальными знаниями, преодолевая языковые барьеры. По...
10 месяцев назад
09.4K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: портативное приложение для ведения голосового дневника с искусственным интеллектом и поддержкой преобразования речи в текст.

Общее представление ALog - это приложение для ведения голосового дневника на основе ИИ, призванное помочь пользователям записывать свою повседневную жизнь с помощью голоса. Оно разработано компанией duxins и размещено в открытом доступе на GitHub. Пользователи могут записывать дневниковые записи с помощью голосового ввода, а приложение автоматически преобразует голос в текст...
7 месяцев назад
09.1K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: универсальная платформа для обработки аудио/видео|генерация видео|AI-субтитров|извлечение звука|передача речи в текст

Всеобъемлющее введение Record Cafe - это универсальная платформа для обработки аудио/видео, предоставляющая услуги по созданию видеодиалогов AI, субтитров AI и преобразованию речи AI в текст. Функции включают запись экрана, редактирование видео, конвертирование GIF/аудио и т.д., а также поддерживают облачное хранение и обмен. Интерфейс интуитивно понятен и прост в использовании, а также поддерживает многоэкранную запись и многоязычный смарт...
9 месяцев назад
09.3K
CrisperWhisper:精确的逐字语音转录工具

CrisperWhisper: инструмент для точной стенографической расшифровки речи

Общее описание CrisperWhisper - это продвинутый инструмент распознавания речи, основанный на OpenAI Whisper и ориентированный на быструю, точную и пословную транскрипцию речи. Он обеспечивает точные временные метки на уровне слов, даже в случае заполнения речи и пауз...
8 месяцев назад
011.1K
Babelfish.ai:浏览器运行的语音实时转录与翻译应用

Babelfish.ai: приложение для транскрипции и перевода речи в реальном времени, запускаемое через браузер

Общие сведения Введение Babelfish.ai - это приложение для транскрипции и перевода в реальном времени, построенное на Huggingface Transformer.js и Supabase Realtime. Приложение может загружать большие модели в браузер и...
12 месяцев назад
08.6K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS: Free Online Text-to-Speech Tool|Audio Enhancement|Audio Clips

FreeTTS Общее описание FreeTTS - это бесплатный онлайновый инструмент преобразования текста в речь, который позволяет пользователям конвертировать текст в естественные голосовые файлы. Поддерживая множество языков и вариантов звучания, пользователи могут конвертировать текст в форматы MP3, WAV, OGG и ACC...
12 месяцев назад
010.5K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...
12 месяцев назад
09.2K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub: видеоредактор с искусственным интеллектом | дубляж | перевод видео | оцифровка фотографий

Общее описание Dupdub - это платформа для создания подкастов и видеопрезентаций, которая предлагает ряд инструментов искусственного интеллекта для поддержки творчества пользователей. Функции охватывают создание текста в видео, предлагая услуги искусственного интеллекта по озвучиванию и дублированию видео, а также редактирование видео, транскрипцию и субтитры. Dupdub также ...
1 год назад
09.5K
通义听悟:阿里通义音视频内容转录AI助手

Tongyi Слушать и понимать: ИИ-помощник Ali Tongyi для транскрибирования аудио- и видеоконтента

Всеобъемлющее представление Tongyi Listening and Understanding - это ИИ-помощник для работы, запущенный компанией Aliyun, который занимается расшифровкой и анализом аудио- и видеоконтента. Он опирается на мощные модели искусственного интеллекта AliCloud для транскрибирования аудио- и видеоконтента в текст в режиме реального времени, а также обеспечивает перевод, обобщение, позиционирование и другие функции. Tongyi Listening Woo поддерживает множество языков и сценариев...
1 год назад
010.6K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目

Insanely Fast Whisper: быстрая и эффективная транскрипция речи в текст с открытым исходным кодом

Всеобъемлющее представление insanely-fast-whisper - это аудиопередача, которая сочетает модель Whisper от OpenAI с различными техниками оптимизации (например, Transformers, Optimum, Flash Attention)...
7 месяцев назад
08.9K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: родной клиент для преобразования видео в субтитры, конвертирования многоязычных субтитров

Общее описание MemoAI - это мощный инструмент для перевода видео, предназначенный для преобразования видео- и аудиофайлов в текст, субтитры и заметки. Будь то видео с YouTube, подкаст или локальный файл, MemoAI с легкостью справится с этой задачей. Программа поддерживает более 90 языков, таких как китайский, английский, японский...
9 месяцев назад
010.5K
pyvideotrans:视频翻译配音工具

pyvideotrans: Инструмент для дубляжа видеопереводов

pyVideoTrans Общее представление pyvideotrans - это инструмент для дублирования видеопереводов. Пользователи могут переводить видеоконтент с одного языка на другой, а также добавлять к нему дубляж и субтитры. Он основан на openai-whisper offline...
1 год назад
010.7K