AI 음성 텍스트 변환

총 56개 기사
Kimi-Audio:开源音频处理与对话基础模型

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...
3 개월 전
01.1K
On Device AI:iPhone本地运行的AI语音转录与聊天工具

온 디바이스 AI: 아이폰 네이티브 실행을 위한 AI 음성 녹음 및 채팅 도구

일반 소개 온디바이스 AI는 완전히 오프라인으로 실행되는 AI 앱으로, iOS, macOS, visionOS를 지원하는 Apple 기기용으로 설계되었으며, 연결할 필요 없이 로컬 대규모 언어 모델(LLM) 실행, 실시간 음성 전사, 문서 분석 등을 제공합니다....
3 개월 전
01.2K
Vexa:实时会议转录与智能知识提取工具

Vexa: 실시간 회의 트랜스크립션 및 지능형 지식 추출 도구

종합 소개 벡사는 기업과 개인에게 효율적인 회의 녹음과 지능형 지식 추출 서비스를 제공하도록 설계된 오픈 소스 실시간 회의 녹취 및 지식 관리 플랫폼입니다. API 기반 회의 로봇을 통해 구글 미트, 줌 등과 같은 플랫폼에 자동으로 연결됩니다...
4개월 전
01.2K
Transkriptor:将音频和视频转为文字的AI智能转录工具

트랜스크립터: 오디오와 비디오를 텍스트로 변환하는 AI 스마트 전사 도구

일반 소개 트랜스크립터는 오디오와 비디오를 텍스트로 빠르게 변환하는 데 중점을 둔 AI 기반 전사 도구입니다. 최대 99%의 정확도로 100개 이상의 언어를 지원하며 회의, 인터뷰, 강의실 노트 등 다양한 시나리오에 적합합니다. 사용자는 파일을 업로드하고, 직접 ...
4개월 전
01.4K
Otter.ai:智能会议助手与实时语音转录工具

Otter.ai: 실시간 음성 녹음 도구를 갖춘 지능형 회의 도우미

일반 설명 Otter.ai는 음성을 실시간으로 텍스트로 변환하고 회의 노트, 요약 및 실행 항목을 자동으로 생성하는 핵심 기능을 갖춘 AI 기반 회의 관리 및 음성 녹음 도구입니다. AI 회의 에이전트가 지능적으로 지원하여 자동으로 추가되는 ...
4개월 전
01.1K
TurboScribe:快速将音频和视频转为文字的在线工具

TurboScribe: 오디오와 비디오를 텍스트로 빠르게 변환하는 온라인 도구

일반 설명 TurboScribe는 오디오와 비디오를 텍스트로 빠르게 변환하는 데 중점을 둔 AI 기반 전사 도구입니다. 98개 이상의 언어를 지원하며 정확도가 99.8%에 달해 음성 콘텐츠를 효율적으로 처리해야 하는 사용자에게 적합합니다. 사용자는 파일을 업로드하고, 텍스트 노트를 생성하고...
4개월 전
01.2K
Meeting:本地实时转录和生成会议纪要的开源客户端

회의: 오픈 소스 클라이언트의 로컬 실시간 트랜스크립션 및 회의록 생성

일반 소개 회의록(일명 Meetily)은 Zackriya Solutions에서 개발한 무료 오픈 소스 AI 회의 보조 도구로, 회의 오디오를 실시간으로 캡처하고 텍스트로 변환된 텍스트를 생성하며 회의 내용을 자동으로 추출하는 데 중점을 두고 있습니다....
5개월 전
01.4K
Local-NotebookLM:本地PDF生成语音播客的开源工具

로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

종합 소개 로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 사용자가 PDF 및 기타 문서를 다양한 형태로 변환할 수 있도록 돕는 데 중점을 두고 있는 Google NotebookLM에서 영감을 받았습니다.
5개월 전
01.1K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: 다국어 고정밀 음성 인식을 위한 오픈 소스 모델

일반 소개 FireRedASR은 고정밀, 다국어 지원 자동 음성 인식(ASR) 솔루션을 제공하는 데 중점을 둔 Little Red Book FireRed 팀이 개발하여 오픈소스로 공개한 음성 인식 모델입니다. 이 프로젝트는 개발자와 연구자를 위해 GitHub에서 호스팅되며 다음과 같은 기능을 제공합니다.
5개월 전
01.4K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: 이중 언어 번역으로 실시간 자막을 생성하는 비디오 플레이어

일반 소개 LLPlayer는 언어 학습자를 위한 오픈 소스 미디어 플레이어로, GitHub에서 호스팅되며 개발자 umlx5h가 만들었습니다. 이중 언어 자막 표시, AI 자동 생성 자막, 실시간 번역 및 단어 검색 등 다양하고 유용한 기능이 통합되어 있습니다....
2개월 전
02.5K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: 오디오 및 비디오 콘텐츠를 빠르게 추출하고 구조화된 노트를 생성하세요.

종합 소개 AudioNotes는 FunASR과 Qwen2를 기반으로 구축된 오디오/비디오-구조화된 노트 시스템입니다. 오디오/비디오 콘텐츠를 빠르게 추출하고 빅 모델을 호출하여 구조화된 마크다운 노트를 생성할 수 있어 다음과 같은 경우에 편리합니다.
6개월 전
01.4K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

펭청스타링: 위스퍼-Large v3보다 더 작고 빠른 다국어 음성-텍스트 변환 도구

종합 소개 펭청스타링(PengChengStarling, 펭청랩스)은 다양한 언어의 음성을 해당 텍스트로 변환할 수 있는 다국어 자동 음성 인식(ASR) 툴입니다. 이 툴킷은 아이스폴 프로젝트를 기반으로 개발되었으며 완전한 음성 인식 프로세스를 제공합니다...
6개월 전
01.5K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisper 기반의 저지연 스트리밍 음성 인식을 위한 실시간 음성-텍스트 변환 도구

일반 소개 RealtimeSTT는 고급 음성 활동 감지 및 웨이크 워드 활성화 기능을 갖춘 효율적이고 지연 시간이 짧은 실시간 음성-텍스트 라이브러리입니다. 빠르고 정확한 음성-텍스트 변환이 필요한 애플리케이션을 지원하기 위해 콜야 베이겔이 개발했습니다.
7개월 전
01.9K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: 온라인 AI 음성 생성 및 텍스트 음성 변환(TTS) 서비스 플랫폼

일반 소개 Acoust는 최신 AI 기술을 사용하여 사실적인 음성을 생성하는 온라인 AI 음성 생성 및 텍스트 음성 변환(TTS) 서비스 플랫폼입니다. 이 플랫폼은 또한 사용자가 여러 소프트웨어 없이도 비디오 제작을 완료할 수 있는 강력한 비디오 편집 도구를 제공합니다.Acou ...
7개월 전
01.5K
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音

노타: 회의, 인터뷰 또는 녹취를 자동으로 전사하는 AI 회의 녹음 및 오디오 전사 도구

일반 설명 Notta는 사용자가 회의, 인터뷰 또는 녹음을 검색 가능한 텍스트로 자동 변환할 수 있도록 설계된 강력한 AI 회의 녹음 및 오디오 트랜스크립션 도구입니다. 노타를 사용하면 사용자는 쉽게 필사, 편집, 요약 및 협업하여 생산성을 높일 수 있습니다.노타는 다음을 지원합니다.
7개월 전
02.1K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: 비디오 콘텐츠를 단편 영화로 지능적으로 편집하고 정확한 비디오 클립 추출/자르기를 쉽게 수행할 수 있습니다.

종합 소개 펀클립은 알리바바 달마 연구소의 통이 스피치 랩에서 개발한 완전 오픈 소스 현지화 자동 동영상 편집 도구입니다. 이 도구는 비디오의 음성을 정확하게 식별할 수 있는 산업 등급의 Paraformer-Large 음성 인식 모델을 통합합니다.
7개월 전
02K
Freed:AI医疗抄写助手,准确转录医生和患者对话,减少就诊记录文书工作

프리드: 의사와 환자의 대화를 정확하게 전사하고 방문 서류 작업을 줄여주는 AI 의료 기록 도우미

일반 설명 Freed는 의료 전문가를 위해 설계된 AI 의료 트랜스크립션 도우미입니다. 의사와 기타 의료 종사자가 고급 AI 기술을 통해 환자 방문 기록을 자동화하고 서류 작업을 줄이며 업무 효율성을 개선할 수 있도록 도와줍니다.Freed의 AI 트랜스크립션 ...
8개월 전
01.9K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

음성 노트: AI 음성 메모, 음성 녹음 및 전사, 회의 콘텐츠의 지능적인 관리

일반 소개 Voicenotes는 사용자가 음성 메모와 회의를 쉽게 녹음하고 관리할 수 있도록 설계된 스마트 음성 메모 앱입니다. 이 앱은 100개 이상의 언어로 음성 녹음을 지원합니다. 사용자는 자신의 생각을 말하기만 하면 Voicenotes가 자동으로 텍스트로 변환해 줍니다.
8개월 전
01.9K
Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换

Zamzar: 다기능 온라인 파일 형식 변환 도구, 비디오 변환 | 오디오 변환 | 이미지 변환 | 문서 변환

일반 소개 Zamzar는 1200개 이상의 파일 형식을 지원하는 강력한 온라인 파일 변환 도구입니다. 문서, 사진, 동영상, 오디오, 전자책 등 어떤 형식이든 빠르고 효율적으로 변환할 수 있습니다. 사용자는 소프트웨어를 다운로드할 필요가 없습니다...
9개월 전
03.2K
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear: 기본적으로 오프라인에서 실행되는 실시간 음성 녹음 및 번역 소프트웨어

일반 설명 MacBook을 사용 중이라면 오디오를 녹음하고, 실시간 현지 음성을 텍스트로 변환하고, 번역하고, 자막을 내보낼 수 있는 AI Hear를 사용해 보세요. 국가 간 회의나 영어 오디오북을 들을 때 유용하게 사용할 수 있습니다. AI Hear는 로컬에서 실행되는 소프트웨어로, 클릭 한 번으로 실시간...
9개월 전
02K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

소니트랜슬레이트: 오픈 소스 비디오 번역 더빙 솔루션, 멀티플레이어 더빙, 속도 조정 및 원본 사운드 모방

일반 설명 소니트랜스레이트는 비디오 번역 및 동기화된 오디오를 위한 솔루션을 제공하도록 설계된 강력하고 사용자 친화적인 비디오 다국어 더빙 툴입니다. 고급 음성 인식 및 기계 번역 기술을 사용하여 비디오 콘텐츠를 여러 언어로 번역하고 오디오를 동기화합니다. 더 ...
10개월 전
03.9K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: 오픈 소스 음성 인식 툴킷, 화자 분리/다자간 대화 음성 인식

종합 소개 FunASR은 학술 연구와 산업 응용 분야를 연결하기 위해 알리바바 다르모 아카데미에서 개발한 오픈 소스 음성 인식 툴킷입니다. 음성 인식(ASR), 음성 엔드포인트 감지(VAD), 문장 부호 복구, 언어 모델링, 말하기 등 다양한 음성 인식 기능을 지원합니다.
10개월 전
02.7K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: 음성-자막 변환 도구, 컷씬, 레이서 및 머스트 컷에 대한 인터페이스가 내장된 경량 클라이언트

포괄적인 소개 AsrTools는 Cutscene, QuickScope, MustCut 등과 같은 대형 업체의 인터페이스가 내장된 지능형 음성 텍스트 변환 도구입니다. GPU나 번거로운 구성이 필요하지 않으며 효율적인 멀티스레드 일괄 처리를 지원합니다. 파이큐트5 개발, 아름답고 사용자 친화적인 인터페이스를 기반으로 하며, SRT 및 TXT 형식의 단어를 출력할 수 있습니다....
10개월 전
02.7K
Happy Scribe:音频转录和视频字幕平台|免费视频字幕编辑软件

해피 스크라이브: 오디오 트랜스크립션 및 비디오 자막 플랫폼 | 무료 비디오 자막 소프트웨어

해피 스크라이브 일반 설명 해피 스크라이브는 여러 언어와 형식을 지원하고 높은 정확도로 오디오를 텍스트로 변환하는 자동 및 수동 오디오 전사 서비스를 제공합니다. 대화형 편집기, 협업 도구, 여러 내보내기 형식, 기계 번역 및 기타 기능이 포함되어 있습니다....
10개월 전
02.2K
Buzz:开源离线音频转写翻译工具|IOS语音转录

버즈: 오픈 소스 오프라인 오디오 전사 번역 도구 | IOS 음성 전사

버즈 일반 소개 버즈는 개인용 컴퓨터에서 오디오를 오프라인으로 전사하고 번역할 수 있도록 해주는 오픈 소스 프로젝트로, chidiwilliams가 만들었습니다. 이 프로젝트는 사용자가 인터넷 연결에 의존하지 않고도 오디오 텍스트를 텍스트로 변환할 수 있는 OpenAI의 Whisper 기술을 사용합니다.
10개월 전
02.4K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI: 음성 체인저|음성 변환|음성 텍스트 변환|텍스트 음성 변환|오디오 편집기

일반 소개 Murf AI는 텍스트를 실제 사람의 음성에 가까운 음성으로 변환하는 강력한 온라인 인공 지능 음성 생성 도구입니다. 최대 120개 이상의 AI 음성 옵션을 제공하고 20개 이상의 언어를 지원하며 팟캐스트, 비디오, 전문 프레젠테이션 등 다양한 상황에 적합합니다....
10개월 전
02.3K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: 동영상 트랜스크립션 단어 수준 타임라인 자막, 동영상 자막 번역 및 현지화된 더빙 오픈 소스 도구

일반 설명 VideoLingo는 원시 기계 번역과 여러 줄의 자막을 제거하고 고품질 음성 해설을 추가하여 언어 장벽을 넘어 글로벌 지식을 공유할 수 있도록 넷플릭스 수준의 고품질 자막을 생성하도록 설계된 원스톱 동영상 번역 및 현지화 더빙 도구입니다. By...
10개월 전
01.9K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: 음성-텍스트 변환을 지원하는 휴대용 AI 음성 일기장 앱입니다.

개요 ALog는 사용자가 음성으로 일상을 기록할 수 있도록 설계된 AI 기반 음성 일기장 애플리케이션입니다. duxins가 개발했으며 GitHub에서 오픈소스입니다. 사용자는 음성 입력을 통해 일기 항목을 녹음할 수 있으며, 앱은 음성을 자동으로 텍스트로 변환합니다....
7개월 전
02.3K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

레코드 카페: 원스톱 오디오/비디오 처리 플랫폼|비디오 생성|AI 자막|오디오 추출|음성 텍스트 변환

개요 레코드 카페는 원스톱 오디오/비디오 처리 플랫폼으로, AI 영상 대화, AI 자막, AI 음성 텍스트 변환 서비스를 제공합니다. 화면 녹화, 동영상 편집, GIF/오디오 변환 등의 기능을 제공하며, 클라우드 저장 및 공유를 지원합니다. 인터페이스는 직관적이고 사용하기 쉬우며 다중 화면 녹화 및 다국어 스마트 ...
8개월 전
02.1K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS: 무료 온라인 텍스트 음성 변환 도구|오디오 향상|오디오 클립

FreeTTS 일반 설명 FreeTTS는 사용자가 텍스트를 자연스러운 음성 파일로 변환할 수 있는 무료 온라인 텍스트 음성 변환 도구입니다. 여러 언어와 사운드 옵션을 지원하여 텍스트를 MP3, WAV, OGG 및 ACC 형식으로 변환할 수 있습니다....
11개월 전
02.8K
Easy Voice Toolkit:本地部署的AI语音工具箱

간편한 음성 툴킷: 로컬 배포를 위한 AI 음성 툴킷

개요 Easy-Voice-Toolkit은 오픈 소스 음성 프로젝트에 기반한 다기능 툴킷으로 음성 인식, 음성 전사, 음성 변환, 데이터 세트 생성 및 모델 학습을 위한 다양한 자동화된 오디오 도구를 제공합니다. 사용자는 필요에 따라 이러한 도구를 선택적으로 사용할 수 있습니다...
11개월 전
02K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub: AI 기반 동영상 편집기|더빙|동영상 번역|사진 디지타이저

일반 설명 Dupdub은 사용자의 창의성을 지원하는 다양한 AI 도구를 제공하는 팟캐스트 및 동영상 프레젠테이션 제작 플랫폼입니다. 텍스트에서 동영상 제작, AI 음성 및 동영상 더빙 서비스, 동영상 편집, 트랜스크립션 및 자막 제공 등의 기능을 제공합니다. Dupdub은 또한 ...
12개월 전
01.8K
通义听悟:阿里通义音视频内容转录AI助手

통이 듣기 및 이해: 알리 통이 오디오 및 비디오 콘텐츠 전사 AI 비서

종합 소개 통이 듣기 및 이해는 알리윈에서 출시한 작업용 AI 비서로, 오디오 및 비디오 콘텐츠의 전사 및 분석에 중점을 두고 있습니다. 알리윈의 강력한 AI 모델을 사용하여 오디오 및 비디오 콘텐츠를 실시간으로 텍스트로 변환하고 번역, 요약, 위치 지정 및 기타 기능을 제공합니다. 통이 리스닝 우는 여러 언어와 시나리오를 지원합니다 ...
11개월 전
01.8K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: 비디오 자막용 네이티브 클라이언트, 다국어 자막 변환

일반 설명 MemoAI는 비디오 및 오디오 파일을 텍스트, 자막, 메모로 변환하도록 설계된 강력한 비디오 번역 도구입니다. YouTube 동영상, 팟캐스트, 로컬 파일 등 어떤 파일이든 MemoAI로 손쉽게 처리할 수 있습니다. 중국어, 영어, 일본어 등 90개 이상의 언어를 지원합니다.
8개월 전
02.5K
pyvideotrans:视频翻译配音工具

파이비데오트랜스: 비디오 번역 더빙 도구

파이비디오트랜스 일반 소개 파이비디오트랜스는 동영상 번역 더빙 툴입니다. 사용자는 비디오 콘텐츠를 한 언어에서 다른 언어로 번역하고 비디오에 적절한 더빙과 자막을 추가할 수 있습니다. 오픈아이 위스퍼 오프라인을 기반으로 합니다...
1 년 전
02.2K