AI 음성 텍스트 변환

총 56개 기사

순서대로 정렬

Abogen: 여러 텍스트 형식을 오디오북으로 변환하는 도구

일반 소개 Abogen은 ePub, PDF 또는 일반 텍스트 파일을 고품질 오디오로 빠르게 변환하도록 설계된 오픈 소스 도구입니다. Kokoro-82M 모델을 사용하여 자연스럽고 부드러운 음성을 생성하고 오디오북 제작에 적합한 동시 자막 생성을 지원합니다....

11개월 전

078.8K

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...

11개월 전

0127.4K

온 디바이스 AI: 아이폰 네이티브 실행을 위한 AI 음성 녹음 및 채팅 도구

일반 소개 온디바이스 AI는 완전히 오프라인으로 실행되는 AI 앱으로, iOS, macOS, visionOS를 지원하는 Apple 기기용으로 설계되었으며, 연결할 필요 없이 로컬 대규모 언어 모델(LLM) 실행, 실시간 음성 전사, 문서 분석 등을 제공합니다....

11개월 전

076.6K

Vexa: 실시간 회의 트랜스크립션 및 지능형 지식 추출 도구

종합 소개 벡사는 기업과 개인에게 효율적인 회의 녹음과 지능형 지식 추출 서비스를 제공하도록 설계된 오픈 소스 실시간 회의 녹취 및 지식 관리 플랫폼입니다. API 기반 회의 로봇을 통해 구글 미트, 줌 등과 같은 플랫폼에 자동으로 연결됩니다...

12개월 전

0105.5K

실시간 음성 텍스트 변환을 위한 오픈 소스 도구

일반 소개 실시간 트랜스크립션-fastrtc는 음성을 실시간으로 텍스트로 변환하는 데 중점을 둔 오픈 소스 프로젝트입니다. FastRTC 기술을 사용하여 지연 시간이 짧은 오디오 스트림을 처리하고 로컬 Whisper 모델과 결합하여 효율적인 ...

1 년 전

068.3K

트랜스크립터: 오디오와 비디오를 텍스트로 변환하는 AI 스마트 전사 도구

일반 소개 트랜스크립터는 오디오와 비디오를 텍스트로 빠르게 변환하는 데 중점을 둔 AI 기반 전사 도구입니다. 최대 99%의 정확도로 100개 이상의 언어를 지원하며 회의, 인터뷰, 강의실 노트 등 다양한 시나리오에 적합합니다. 사용자는 파일을 업로드하고, 직접 ...

1 년 전

079.4K

Otter.ai: 실시간 음성 녹음 도구를 갖춘 지능형 회의 도우미

일반 설명 Otter.ai는 음성을 실시간으로 텍스트로 변환하고 회의 노트, 요약 및 실행 항목을 자동으로 생성하는 핵심 기능을 갖춘 AI 기반 회의 관리 및 음성 녹음 도구입니다. AI 회의 에이전트가 지능적으로 지원하여 자동으로 추가되는 ...

1 년 전

069.2K

TurboScribe: 오디오와 비디오를 텍스트로 빠르게 변환하는 온라인 도구

일반 설명 TurboScribe는 오디오와 비디오를 텍스트로 빠르게 변환하는 데 중점을 둔 AI 기반 전사 도구입니다. 98개 이상의 언어를 지원하며 정확도가 99.8%에 달해 음성 콘텐츠를 효율적으로 처리해야 하는 사용자에게 적합합니다. 사용자는 파일을 업로드하고, 텍스트 노트를 생성하고...

최신 AI 리소스 # AI 음성-텍스트 변환

1 년 전

088.1K

아쿠아 보이스: 정확한 텍스트 생성을 위한 애플리케이션 간 음성 입력

일반 소개 아쿠아 보이스는 사용자 음성을 서식 있는 텍스트로 빠르게 변환하는 데 중점을 둔 스마트 음성 기반 텍스트 생성 도구입니다. 2023년 핀란드 브라운과 잭 맥킨타이어가 만들었으며 미국에 본사를 두고 있습니다...

최신 AI 리소스 # AI 음성-텍스트 변환

1 년 전

0181.8K

돌핀: 아시아 언어를 위한 아시아 언어 인식 및 음성-텍스트 모델링

종합 소개 돌핀은 아시아 언어에 대한 음성 인식 및 언어 인식에 중점을 두고 DataoceanAI와 칭화대학교에서 개발한 오픈 소스 모델입니다. 동아시아, 남아시아, 동남아시아, 중동의 40개 언어와 22개 중국 방언을 지원합니다....

1 년 전

062.8K

트윈마인드: 무료 오프라인 음성-텍스트 변환 앱

에서 개발한 트윈마인드는 "모든 것을 기억할 수 있도록 도와주는" 스마트 도구입니다. 휴대전화를 주머니에 넣고 있는 상태에서도 대화, 회의 또는 강의를 100개 이상의 언어로 실시간으로 녹음하고 텍스트로 변환할 수 있습니다.

1 년 전

060.5K

Wispr Flow: 음성으로 모든 애플리케이션에서 텍스트를 빠르게 입력하세요.

일반 설명 Wispr Flow는 음성으로 텍스트를 입력할 수 있는 도구로, 사용자가 컴퓨터에서 빠르게 글을 쓸 수 있도록 도와줍니다. "타이핑보다 3배 빠른" 환경을 제공하여 사용자가 Word, Slack, G... 등 모든 애플리케이션에 텍스트를 입력할 수 있습니다.

최신 AI 리소스 # AI 음성-텍스트 변환

10개월 전

0128.1K

회의: 오픈 소스 클라이언트의 로컬 실시간 트랜스크립션 및 회의록 생성

일반 소개 회의록(일명 Meetily)은 Zackriya Solutions에서 개발한 무료 오픈 소스 AI 회의 보조 도구로, 회의 오디오를 실시간으로 캡처하고 텍스트로 변환된 텍스트를 생성하며 회의 내용을 자동으로 추출하는 데 중점을 두고 있습니다....

1 년 전

0107.8K

로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

종합 소개 로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 사용자가 PDF 및 기타 문서를 다양한 형태로 변환할 수 있도록 돕는 데 중점을 두고 있는 Google NotebookLM에서 영감을 받았습니다.

1 년 전

089.3K

AssemblyAI: 고정밀 음성-텍스트 및 오디오 인텔리전스 분석 플랫폼

일반 소개 AssemblyAI는 음성 AI 기술에 중점을 둔 플랫폼으로, 개발자와 기업에 효율적인 음성-텍스트 및 오디오 분석 도구를 제공합니다. 특히 새로 출시된 Universal-2를 비롯한 Universal 모델 제품군이 핵심입니다.

최신 AI 리소스 # AI 오픈 서비스 # AI 음성-텍스트 변환

1 년 전

071.1K

FireRedASR: 다국어 고정밀 음성 인식을 위한 오픈 소스 모델

일반 소개 FireRedASR은 고정밀, 다국어 지원 자동 음성 인식(ASR) 솔루션을 제공하는 데 중점을 둔 Little Red Book FireRed 팀이 개발하여 오픈소스로 공개한 음성 인식 모델입니다. 이 프로젝트는 개발자와 연구자를 위해 GitHub에서 호스팅되며 다음과 같은 기능을 제공합니다.

1 년 전

0101.9K

WhisperChain: 실시간 음성-텍스트 변환 및 음성 단어 최적화

일반 소개 위스퍼체인은 깃허브에서 호스팅되는 AI 기반 오픈소스 프로젝트로, 개발자 크리스 초이가 이끌고 있습니다. 주로 음성을 텍스트로 변환하고 AI 기술을 통해 표현을 자동으로 최적화하여 중복을 제거하는 데 사용됩니다....

1 년 전

057.9K

LLPlayer: 이중 언어 번역으로 실시간 자막을 생성하는 비디오 플레이어

일반 소개 LLPlayer는 언어 학습자를 위한 오픈 소스 미디어 플레이어로, GitHub에서 호스팅되며 개발자 umlx5h가 만들었습니다. 이중 언어 자막 표시, AI 자동 생성 자막, 실시간 번역 및 단어 검색 등 다양하고 유용한 기능이 통합되어 있습니다....

10개월 전

0217K

CapsWriter-Offline: PC용 음성 입력 및 자막 전사 도구

일반 소개 CapsWriter-Offline은 GitHub에서 호스팅되고 개발자 HaujetZhao가 만든 PC용 음성 입력 및 자막 전사 도구입니다. 완전히 오프라인으로 실행되며 음성-텍스트 및 시청각 텍스트 변환을 위해 인터넷 연결이 필요하지 않습니다.

1 년 전

068.3K

속삭임 입력: Groq을 사용한 무료 고속 음성-텍스트 변환 서비스입니다.

일반 설명 귓속말 입력은 사용자가 옵션 버튼을 눌러 음성 녹음을 시작하고 버튼을 들어 올려 녹음을 종료할 수 있는 오픈 소스 음성 녹음 도구입니다. 이 도구는 Groq Whisper 대형 V3 터보 ...

1 년 전

074.8K

리버소노라: 오디오북 자막 추출 및 다국어 번역, 여러 언어로 오디오북 전사

종합 소개 "자유로운 소리"라는 뜻의 LiberSonora는 강력한 AI 지원 오픈 소스 오디오북 툴셋입니다. 지능형 자막 추출, AI 타이틀 생성, 다국어 번역 등을 지원하며 GPU 가속을 통해 오프라인에서 일괄 처리가 가능합니다.

1 년 전

055.3K

AudioNotes: 오디오 및 비디오 콘텐츠를 빠르게 추출하고 구조화된 노트를 생성하세요.

종합 소개 AudioNotes는 FunASR과 Qwen2를 기반으로 구축된 오디오/비디오-구조화된 노트 시스템입니다. 오디오/비디오 콘텐츠를 빠르게 추출하고 빅 모델을 호출하여 구조화된 마크다운 노트를 생성할 수 있어 다음과 같은 경우에 편리합니다.

1 년 전

058.2K

Orate: 잘 알려진 음성 생성, 음성 전사 및 음성 모델링을 통합하기 위한 통합 API

일반 소개 Orate는 음성 생성 및 트랜스크립션에 중점을 둔 AI 툴킷입니다. OpenAI, ElevenLabs, AssemblyAI와 같은 주요 AI 제공업체와 원활하게 통합되는 통합 API를 제공하여 사용자가 강제...

1 년 전

065.4K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

펭청스타링: 위스퍼-Large v3보다 더 작고 빠른 다국어 음성-텍스트 변환 도구

종합 소개 펭청스타링(PengChengStarling, 펭청랩스)은 다양한 언어의 음성을 해당 텍스트로 변환할 수 있는 다국어 자동 음성 인식(ASR) 툴입니다. 이 툴킷은 아이스폴 프로젝트를 기반으로 개발되었으며 완전한 음성 인식 프로세스를 제공합니다...

1 년 전

061.7K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisper 기반의 저지연 스트리밍 음성 인식을 위한 실시간 음성-텍스트 변환 도구

일반 소개 RealtimeSTT는 고급 음성 활동 감지 및 웨이크 워드 활성화 기능을 갖춘 효율적이고 지연 시간이 짧은 실시간 음성-텍스트 라이브러리입니다. 빠르고 정확한 음성-텍스트 변환이 필요한 애플리케이션을 지원하기 위해 콜야 베이겔이 개발했습니다.

AI 뉴스 # AI 자바 오픈 소스 프로젝트 # AI 음성-텍스트 변환

1 년 전

090.6K

Sherpa-ONNX: ONNXRuntime을 사용한 오프라인 음성 인식 및 합성

일반 소개 sherpa-onnx는 효율적인 오프라인 음성 인식 및 음성 합성 솔루션을 제공하기 위해 차세대 칼디 팀에서 개발한 오픈 소스 프로젝트입니다. 안드로이드, iOS, 라즈베리 등 여러 플랫폼을 지원합니다.

1 년 전

0289.9K

Acoust: 온라인 AI 음성 생성 및 텍스트 음성 변환(TTS) 서비스 플랫폼

일반 소개 Acoust는 최신 AI 기술을 사용하여 사실적인 음성을 생성하는 온라인 AI 음성 생성 및 텍스트 음성 변환(TTS) 서비스 플랫폼입니다. 이 플랫폼은 또한 사용자가 여러 소프트웨어 없이도 비디오 제작을 완료할 수 있는 강력한 비디오 편집 도구를 제공합니다.Acou ...

최신 AI 리소스 # AI 텍스트 음성 변환 # AI 음성-텍스트 변환

1 년 전

055K

노타: 회의, 인터뷰 또는 녹취를 자동으로 전사하는 AI 회의 녹음 및 오디오 전사 도구

일반 설명 Notta는 사용자가 회의, 인터뷰 또는 녹음을 검색 가능한 텍스트로 자동 변환할 수 있도록 설계된 강력한 AI 회의 녹음 및 오디오 트랜스크립션 도구입니다. 노타를 사용하면 사용자는 쉽게 필사, 편집, 요약 및 협업하여 생산성을 높일 수 있습니다.노타는 다음을 지원합니다.

1 년 전

079.2K

AI 지마쿠 구미: AI의 도움으로 동영상에 대한 다국어 자막 자동 생성 및 번역

일반 소개 AI 자막 그룹은 자동화된 동영상 자막 추출, 전사 및 번역 기능을 지원하는 데 중점을 둔 강력한 명령줄 동영상 자막 처리 도구입니다. 이 도구는 위스퍼 스피치를 포함한 고급 AI 기술을 통합합니다...

1 년 전

065K

FunClip: 비디오 콘텐츠를 단편 영화로 지능적으로 편집하고 정확한 비디오 클립 추출/자르기를 쉽게 수행할 수 있습니다.

종합 소개 펀클립은 알리바바 달마 연구소의 통이 스피치 랩에서 개발한 완전 오픈 소스 현지화 자동 동영상 편집 도구입니다. 이 도구는 비디오의 음성을 정확하게 식별할 수 있는 산업 등급의 Paraformer-Large 음성 인식 모델을 통합합니다.

1 년 전

0114.4K

BetterWhisperX: 화자와 분리된 자동 음성 인식으로 매우 정확한 단어 수준의 타임스탬프 제공

일반 소개 BetterWhisperX는 효율적이고 정확한 자동 음성 인식(ASR) 서비스를 제공하는 데 초점을 맞춘 WhisperX 프로젝트의 최적화된 버전입니다. 이 프로젝트는 WhisperX의 개선된 파생물로서 Federico가 개발했습니다.

1 년 전

077.4K

프리드: 의사와 환자의 대화를 정확하게 전사하고 방문 서류 작업을 줄여주는 AI 의료 기록 도우미

일반 설명 Freed는 의료 전문가를 위해 설계된 AI 의료 트랜스크립션 도우미입니다. 의사와 기타 의료 종사자가 고급 AI 기술을 통해 환자 방문 기록을 자동화하고 서류 작업을 줄이며 업무 효율성을 개선할 수 있도록 도와줍니다.Freed의 AI 트랜스크립션 ...

최신 AI 리소스 # AI 음성-텍스트 변환

1 년 전

058.6K

음성 노트: AI 음성 메모, 음성 녹음 및 전사, 회의 콘텐츠의 지능적인 관리

일반 소개 Voicenotes는 사용자가 음성 메모와 회의를 쉽게 녹음하고 관리할 수 있도록 설계된 스마트 음성 메모 앱입니다. 이 앱은 100개 이상의 언어로 음성 녹음을 지원합니다. 사용자는 자신의 생각을 말하기만 하면 Voicenotes가 자동으로 텍스트로 변환해 줍니다.

최신 AI 리소스 # AI 노트 # AI 음성-텍스트 변환

1 년 전

067K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Voice-Pro: 오픈 소스 다기능 비디오 번역 도구, 음성 전사 및 여러 언어로의 번역, Windows 원클릭 설치

일반 소개 Voice-Pro는 음성-텍스트, 텍스트-음성, 실시간 번역, YouTube 동영상 다운로드 및 사람 음성 분리를 지원하는 Gradio WebUI 기반의 다목적 도구입니다. Whisper, Faster-Wh...를 통합합니다.

1 년 전

073.3K

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换

Zamzar: 다기능 온라인 파일 형식 변환 도구, 비디오 변환 | 오디오 변환 | 이미지 변환 | 문서 변환

일반 소개 Zamzar는 1200개 이상의 파일 형식을 지원하는 강력한 온라인 파일 변환 도구입니다. 문서, 사진, 동영상, 오디오, 전자책 등 어떤 형식이든 빠르고 효율적으로 변환할 수 있습니다. 사용자는 소프트웨어를 다운로드할 필요가 없습니다...

최신 AI 리소스 # AI 오픈 서비스 # AI 음성-텍스트 변환

1 년 전

080.2K

AI Hear: 기본적으로 오프라인에서 실행되는 실시간 음성 녹음 및 번역 소프트웨어

일반 설명 MacBook을 사용 중이라면 오디오를 녹음하고, 실시간 현지 음성을 텍스트로 변환하고, 번역하고, 자막을 내보낼 수 있는 AI Hear를 사용해 보세요. 국가 간 회의나 영어 오디오북을 들을 때 유용하게 사용할 수 있습니다. AI Hear는 로컬에서 실행되는 소프트웨어로, 클릭 한 번으로 실시간...

최신 AI 리소스 # AI 번역 # AI 음성-텍스트 변환

1 년 전

064.1K

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声

소니트랜슬레이트: 오픈 소스 비디오 번역 더빙 솔루션, 멀티플레이어 더빙, 속도 조정 및 원본 사운드 모방

일반 설명 소니트랜스레이트는 비디오 번역 및 동기화된 오디오를 위한 솔루션을 제공하도록 설계된 강력하고 사용자 친화적인 비디오 다국어 더빙 툴입니다. 고급 음성 인식 및 기계 번역 기술을 사용하여 비디오 콘텐츠를 여러 언어로 번역하고 오디오를 동기화합니다. 더 ...

1 년 전

0140.2K

FunASR: 오픈 소스 음성 인식 툴킷, 화자 분리/다자간 대화 음성 인식

종합 소개 FunASR은 학술 연구와 산업 응용 분야를 연결하기 위해 알리바바 다르모 아카데미에서 개발한 오픈 소스 음성 인식 툴킷입니다. 음성 인식(ASR), 음성 엔드포인트 감지(VAD), 문장 부호 복구, 언어 모델링, 말하기 등 다양한 음성 인식 기능을 지원합니다.

2 년 전

0159.9K

AsrTools: 음성-자막 변환 도구, 컷씬, 레이서 및 머스트 컷에 대한 인터페이스가 내장된 경량 클라이언트

포괄적인 소개 AsrTools는 Cutscene, QuickScope, MustCut 등과 같은 대형 업체의 인터페이스가 내장된 지능형 음성 텍스트 변환 도구입니다. GPU나 번거로운 구성이 필요하지 않으며 효율적인 멀티스레드 일괄 처리를 지원합니다. 파이큐트5 개발, 아름답고 사용자 친화적인 인터페이스를 기반으로 하며, SRT 및 TXT 형식의 단어를 출력할 수 있습니다....

2 년 전

078.1K

해피 스크라이브: 오디오 트랜스크립션 및 비디오 자막 플랫폼 | 무료 비디오 자막 소프트웨어

해피 스크라이브 일반 설명 해피 스크라이브는 여러 언어와 형식을 지원하고 높은 정확도로 오디오를 텍스트로 변환하는 자동 및 수동 오디오 전사 서비스를 제공합니다. 대화형 편집기, 협업 도구, 여러 내보내기 형식, 기계 번역 및 기타 기능이 포함되어 있습니다....

2 년 전

069.7K

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop

위스퍼 GPGPU: 윈도우에서 실행되는 OpenAI 위스퍼|위스퍼데스크톱

일반 소개 Whisper는 Const-me에서 개발한 GitHub 오픈 소스 프로젝트로, GPGPU를 사용하여 OpenAI의 Whisper 자동 음성 인식(ASR) 모델의 고성능 추론에 중점을 두고 있습니다. 이 프로젝트는 MPL-2.0 라이선스를 기반으로 합니다...

최신 AI 리소스 # AI 음성-텍스트 변환

2 년 전

0106.9K

버즈: 오픈 소스 오프라인 오디오 전사 번역 도구 | IOS 음성 전사

버즈 일반 소개 버즈는 개인용 컴퓨터에서 오디오를 오프라인으로 전사하고 번역할 수 있도록 해주는 오픈 소스 프로젝트로, chidiwilliams가 만들었습니다. 이 프로젝트는 사용자가 인터넷 연결에 의존하지 않고도 오디오 텍스트를 텍스트로 변환할 수 있는 OpenAI의 Whisper 기술을 사용합니다.

최신 AI 리소스 # AI 음성-텍스트 변환

2 년 전

0144.3K

딥그램: 고정밀 음성 인식 및 합성 솔루션을 위한 서비스 API

일반 설명 딥그램은 음성 인식 및 자연어 처리 기술을 전문으로 하는 회사로 강력한 음성 텍스트 변환 및 텍스트 음성 변환 API를 제공하며, 이 플랫폼은 고급 인공 지능을 활용하여 ...

최신 AI 리소스 # AI 오픈 서비스 # AI 음성-텍스트 변환

1 년 전

075.9K

Murf AI: 음성 체인저|음성 변환|음성 텍스트 변환|텍스트 음성 변환|오디오 편집기

일반 소개 Murf AI는 텍스트를 실제 사람의 음성에 가까운 음성으로 변환하는 강력한 온라인 인공 지능 음성 생성 도구입니다. 최대 120개 이상의 AI 음성 옵션을 제공하고 20개 이상의 언어를 지원하며 팟캐스트, 비디오, 전문 프레젠테이션 등 다양한 상황에 적합합니다....

최신 AI 리소스 # AI 텍스트 음성 변환 # AI 음성-텍스트 변환

2 년 전

057.5K

VideoLingo：视频转录单词级时间轴字幕，视频字幕翻译和本地化配音开源工具

VideoLingo: 동영상 트랜스크립션 단어 수준 타임라인 자막, 동영상 자막 번역 및 현지화된 더빙 오픈 소스 도구

일반 설명 VideoLingo는 원시 기계 번역과 여러 줄의 자막을 제거하고 고품질 음성 해설을 추가하여 언어 장벽을 넘어 글로벌 지식을 공유할 수 있도록 넷플릭스 수준의 고품질 자막을 생성하도록 설계된 원스톱 동영상 번역 및 현지화 더빙 도구입니다. By...

2 년 전

066.2K

ALog: 음성-텍스트 변환을 지원하는 휴대용 AI 음성 일기장 앱입니다.

개요 ALog는 사용자가 음성으로 일상을 기록할 수 있도록 설계된 AI 기반 음성 일기장 애플리케이션입니다. duxins가 개발했으며 GitHub에서 오픈소스입니다. 사용자는 음성 입력을 통해 일기 항목을 녹음할 수 있으며, 앱은 음성을 자동으로 텍스트로 변환합니다....

1 년 전

061.6K

레코드 카페: 원스톱 오디오/비디오 처리 플랫폼|비디오 생성|AI 자막|오디오 추출|음성 텍스트 변환

개요 레코드 카페는 원스톱 오디오/비디오 처리 플랫폼으로, AI 영상 대화, AI 자막, AI 음성 텍스트 변환 서비스를 제공합니다. 화면 녹화, 동영상 편집, GIF/오디오 변환 등의 기능을 제공하며, 클라우드 저장 및 공유를 지원합니다. 인터페이스는 직관적이고 사용하기 쉬우며 다중 화면 녹화 및 다국어 스마트 ...

1 년 전

067.3K

크리스퍼위스퍼: 정확한 축어체 음성 전사 도구

일반 설명 크리스퍼위스퍼는 빠르고 정확한 단어 단위 음성 녹취에 중점을 둔 OpenAI 위스퍼 기반의 고급 음성 인식 도구입니다. 음성 채우기 및 일시 정지 시에도 정확한 단어 수준의 타임스탬프를 제공합니다.

1 년 전

071.9K

Babelfish.ai: 브라우저에서 실행되는 실시간 음성 전사 및 번역 애플리케이션

일반 소개 Babelfish.ai는 허깅페이스 트랜스포머.js와 슈퍼베이스 리얼타임을 기반으로 구축된 실시간 전사 및 번역 애플리케이션입니다. 이 애플리케이션은 브라우저에서 대형 모델을 로드할 수 있으며...

2 년 전

053.4K

FreeTTS: 무료 온라인 텍스트 음성 변환 도구|오디오 향상|오디오 클립

FreeTTS 일반 설명 FreeTTS는 사용자가 텍스트를 자연스러운 음성 파일로 변환할 수 있는 무료 온라인 텍스트 음성 변환 도구입니다. 여러 언어와 사운드 옵션을 지원하여 텍스트를 MP3, WAV, OGG 및 ACC 형식으로 변환할 수 있습니다....

2 년 전

069.1K

간편한 음성 툴킷: 로컬 배포를 위한 AI 음성 툴킷

개요 Easy-Voice-Toolkit은 오픈 소스 음성 프로젝트에 기반한 다기능 툴킷으로 음성 인식, 음성 전사, 음성 변환, 데이터 세트 생성 및 모델 학습을 위한 다양한 자동화된 오디오 도구를 제공합니다. 사용자는 필요에 따라 이러한 도구를 선택적으로 사용할 수 있습니다...

2 년 전

064.2K

DupDub: AI 기반 동영상 편집기|더빙|동영상 번역|사진 디지타이저

일반 설명 Dupdub은 사용자의 창의성을 지원하는 다양한 AI 도구를 제공하는 팟캐스트 및 동영상 프레젠테이션 제작 플랫폼입니다. 텍스트에서 동영상 제작, AI 음성 및 동영상 더빙 서비스, 동영상 편집, 트랜스크립션 및 자막 제공 등의 기능을 제공합니다. Dupdub은 또한 ...

2 년 전

055.4K

통이 듣기 및 이해: 알리 통이 오디오 및 비디오 콘텐츠 전사 AI 비서

종합 소개 통이 듣기 및 이해는 알리윈에서 출시한 작업용 AI 비서로, 오디오 및 비디오 콘텐츠의 전사 및 분석에 중점을 두고 있습니다. 알리윈의 강력한 AI 모델을 사용하여 오디오 및 비디오 콘텐츠를 실시간으로 텍스트로 변환하고 번역, 요약, 위치 지정 및 기타 기능을 제공합니다. 통이 리스닝 우는 여러 언어와 시나리오를 지원합니다 ...

2 년 전

068.2K

엄청나게 빠른 속삭임: 음성을 텍스트로 빠르고 효율적으로 전사하는 오픈 소스 프로젝트

종합 소개 엄청나게 빠른 속삭임은 OpenAI의 속삭임 모델과 다양한 최적화 기술(예: 트랜스포머, 옵티멈, 플래시 어텐션)을 결합한 오디오 전송...

1 년 전

070K

Memo AI: 비디오 자막용 네이티브 클라이언트, 다국어 자막 변환

일반 설명 MemoAI는 비디오 및 오디오 파일을 텍스트, 자막, 메모로 변환하도록 설계된 강력한 비디오 번역 도구입니다. YouTube 동영상, 팟캐스트, 로컬 파일 등 어떤 파일이든 MemoAI로 손쉽게 처리할 수 있습니다. 중국어, 영어, 일본어 등 90개 이상의 언어를 지원합니다.

1 년 전

066.3K

파이비데오트랜스: 비디오 번역 더빙 도구

파이비디오트랜스 일반 소개 파이비디오트랜스는 동영상 번역 더빙 툴입니다. 사용자는 비디오 콘텐츠를 한 언어에서 다른 언어로 번역하고 비디오에 적절한 더빙과 자막을 추가할 수 있습니다. 오픈아이 위스퍼 오프라인을 기반으로 합니다...

2 년 전

083.6K

그게 아닙니다.