AI 음성 복제

총 41개 기사
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: 중국어와 영어 음성 합성을 위한 경량 모델

종합 소개 MegaTTS3는 고품질 중국어 및 영어 음성 생성에 중점을 두고 절강대학교와 협력하여 바이트댄스가 개발한 오픈 소스 음성 합성 도구입니다. 핵심 모델은 가볍고 효율적인 0.45억 개의 파라미터로 중국어와 영어 혼합 음성 생성 및 음성 복제를 지원합니다. 프로젝트는 ...에서 호스팅됩니다.
4개월 전
01.4K
PlayHT:生成超真实语音的AI工具

PlayHT: 초현실적인 음성을 생성하는 AI 도구

일반 소개 플레이에이치티는 사용자가 텍스트를 자연스럽고 사실적인 음성으로 빠르게 변환할 수 있도록 돕는 AI 음성 생성에 중점을 둔 효율적인 온라인 플랫폼입니다. 팟캐스트 제작, 교육 콘텐츠, 마케팅 홍보 등을 위해 60개 이상의 언어와 다양한 억양을 지원하는 600개 이상의 AI 음성을 제공합니다.
5개월 전
01.4K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: 음성을 인식하고 복제된 음성을 사용하여 통신하는 멀티모달 음성 상호작용 프레임워크 등 다양한 기능

종합 소개 Step-Audio는 프로덕션 환경에 즉시 사용 가능한 음성 이해 및 생성 기능을 제공하도록 설계된 오픈 소스 지능형 음성 인터랙션 프레임워크입니다. 이 프레임워크는 다국어 대화(예: 중국어, 영어, 일본어), 감정적 음성(예: 행복, 슬픔), 지역 방언(예: 광동어, 사천어 ...) 등을 지원합니다.
6개월 전
02.1K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

웨이트: 음성 모방 커버송 및 텍스트 음성 변환 저작 플랫폼

일반 소개 웨이트는 간단한 동작으로 음성 표지, 텍스트 음성 변환, 이미지, 음악, 동영상을 제작할 수 있는 AI를 활용한 창작 소셜 플랫폼입니다. 이 플랫폼은 사용자가 빠르게 창작을 시작하고 커뮤니티와 공유할 수 있도록 다양한 도구와 템플릿을 제공합니다.
6개월 전
02.6K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: 단 3초 만에 무료 온라인 음성 복제가 가능합니다!

일반 소개 AnyVoice는 초현실적인 음성 생성 및 음성 복제 서비스를 제공하는 고급 AI 음성 생성 플랫폼입니다. 이 플랫폼을 통해 사용자는 텍스트를 자연스러운 음성으로 변환하고 수백 개의 사전 설정된 음성 중에서 선택할 수 있습니다. 적합한 음성을 찾을 수 없다면...
6개월 전
02K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 고품질 음성 생성 및 복제를 위한 오픈 소스 텍스트 음성 변환 모델

일반 소개 Llasa-3B는 홍콩과학기술대학교 오디오 랩(HKUST Audio)에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 이 모델은 여러 언어를 지원할 뿐만 아니라 고품질 음성 생성을 제공하도록 세심하게 튜닝된 Llama 3.2B 아키텍처를 기반으로 합니다.
6개월 전
02.1K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: 엔드투엔드 AI 음성 복제 어시스턴트, 실시간 음성 대화 어시스턴트, Fish Speech 스핀오프 프로젝트

종합 소개 물고기 음성 파생 프로젝트 물고기 에이전트는 V0.1 3B 모델 아키텍처를 기반으로 개발된 혁신적인 엔드투엔드 AI 음성 복제 시스템입니다. 완전한 엔드투엔드 음성 복제 처리 시스템으로서, 가장 중요한 특징은 혁신적인 말없는 ...
7개월 전
02.1K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: 오디오/비디오 다국어 번역 합성 및 음성 복제 서비스

종합 소개 ViiTor AI는 고품질 비디오 번역, 음성 복제, AI 생성 아바타 비디오 및 음성 합성 서비스를 제공하는 데 중점을 둔 강력한 인공 지능 플랫폼입니다. 이 플랫폼은 여러 언어를 지원하며 사용자가 쉽게 다국어 콘텐츠를 제작할 수 있도록 돕는 것을 목표로 합니다.
8개월 전
02.9K
趣丸千音:语音克隆并结合口型同步,一键翻译视频为多语言!

펑키 마루치요: 음성 복제와 입 동기화 기능을 결합하여 클릭 한 번으로 동영상을 여러 언어로 번역할 수 있습니다!

종합 소개 펀마루 천개의 목소리는 사실적이고 자연스러운 음성 생성 솔루션을 제공하는 다국어 AI 음성 합성 플랫폼입니다. 사용자는 텍스트 콘텐츠를 전문가 수준의 오디오로 쉽게 변환할 수 있으며, 샘플 없이도 개인화된 요구 사항을 충족하는 전용 AI 음성(음성 클론) 생성을 지원합니다. 이 플랫폼은 비디오 번역 기능도 제공합니다...
8개월 전
02.1K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: 감정 제어 태그를 지원하는 3초 러쉬 음성 복제 오픈 소스 프로젝트로 Ali가 출시했습니다.

포괄적인 소개 CosyVoice는 추론, 훈련, 배포에 이르는 풀스택 기능을 제공하는 다국어 대규모 음성 생성 모델입니다. FunAudioLLM 팀에서 개발한 이 모델은 고급 자동 회귀 변환기와 ODE 기반 확산 모델을 통해 고품질 음성을 구현하는 것을 목표로 합니다.
6개월 전
03.8K
海螺AI视频生成器:文本或图像生成高质量视频,影视级镜头创作

Conch AI 동영상 생성기: 텍스트 또는 이미지로 고품질 동영상, 영화 및 TV급 영상을 제작할 수 있습니다.

일반 소개 Conch AI 동영상 생성기는 MiniMax에서 개발한 고급 AI 동영상 생성 도구입니다. 사용자는 간단한 텍스트 설명을 제공하거나 이미지를 업로드하기만 하면 Conch AI가 고품질의 동영상 콘텐츠를 빠르게 생성할 수 있습니다. 이 도구는 크리에이터, 마케터 및 스토리텔러가 널리 사용합니다.
8개월 전
02.3K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS(xTTS): 다국어 지원 및 음성 복제 기능을 갖춘 텍스트 음성 변환을 위한 딥러닝 툴킷입니다.

포괄적인 소개 Coqui TTS는 딥러닝 기술을 기반으로 하는 오픈 소스 고급 텍스트 음성 변환(TTS) 생성 툴킷입니다. 연구 및 프로덕션 환경 모두에서 테스트를 거쳤으며 여러 언어의 텍스트 음성 변환을 지원하는 풍부한 기능과 모델을 제공합니다.Coqui TTS...
6개월 전
02.1K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

모킹버드: 빠른 음성 복제 및 모델 학습, xtts v2 기반 텍스트 음성 변환

종합적인 소개 모킹버드는 AI 기술을 통해 빠른 음성 복제와 텍스트 음성 변환을 목표로 하는 오픈 소스 프로젝트입니다. 사용자는 5초 분량의 음성 샘플만 제공하면 모든 음성 콘텐츠를 생성할 수 있습니다. 이 프로젝트는 다양한 중국어 데이터 세트를 지원하며 Windows에서는 ...
8개월 전
02.3K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

음성 복제: 원클릭 설치 프로그램을 갖춘 Windows용 xtts_v2 기반의 다국어 샘플 없는 음성 복제 툴입니다.

일반 설명 Clone Voice는 오픈 소스 사운드 복제 도구로, 사용자가 모든 사운드 또는 개인 음성 녹음을 사용하여 음성을 복제할 수 있는 웹 기반 인터페이스를 제공합니다. 이 도구는 NVIDIA GPU가 없어도 쉽게 사용할 수 있으며, 사전 컴파일된 앱과 함께 사용할 수 있습니다.
10개월 전
02.3K
自得语音:智能语音合成平台|语音克隆

지이드 스피치: 지능형 음성 합성 플랫폼|음성 복제

종합 소개 지이드 보이스는 첨단 AI 기술을 활용한 음성 합성 플랫폼입니다. 사용자는 음성을 업로드하기만 하면 텍스트로 보완하여 사실적이고 감성적인 음성 클립을 생성할 수 있습니다. 이 플랫폼에는 빠른 캐릭터 커스터마이징, 클라우드 기반 음성 생성, 의인화된 음성 합성 등의 기능이 탑재되어 있습니다. 소프트웨어를 다운로드할 필요 없이...
10개월 전
02K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: 오픈 소스 제로 샘플 음성 복제 및 텍스트 음성 변환 도구

개요 VoiceCraft는 신경 코덱 언어 모델을 기반으로 하는 오픈 소스 음성 편집 및 제로 샘플 음성 합성 툴입니다. 기존 음성 시퀀스에 대한 삽입, 삭제 및 교체 작업을 가능하게 하는 혁신적인 코드화된 시퀀스 생성 방법을 사용하여 자연스럽고 일관된 편집 음성을 생성할 수 있습니다.
10개월 전
02.2K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: 지능형 음성 합성 및 음성 복제 플랫폼

종합 소개 Seaweed AI는 윤지성 AI 오픈 플랫폼으로 구동되는 온라인에서 텍스트를 음성으로 변환할 수 있는 지능형 더빙 제품입니다. 사용자는 스스로 음성 복제를 달성하고 다양한 성별, 억양 및 언어의 AI 발화자를 제공하고 텍스트를 입력 한 후 직접 음성을 더빙 할 수 있습니다. 짧은 더빙을 빠르게 할 수 있습니다.
10개월 전
02.1K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: 인공지능 음성 합성 플랫폼 | 음성 복제 | 딥페이크 오디오 탐지

일반 소개 Resemble AI는 기업용으로 설계된 인공지능 음성 합성 플랫폼입니다. 이 플랫폼은 미래의 정보 보안을 위해 최첨단 AI 음성 생성기 기술과 딥 위조 오디오 탐지 기능을 제공합니다. 음성 복제, 실시간 딥페이크 오디오 탐지, AI 워터마킹 기술 등의 기능을 제공합니다...
10개월 전
02K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

매직 보이스 워크샵: 전문 보이스오버 및 짧은 동영상 내레이션 제작 플랫폼 | 실제 인물 보이스오버 | 목소리 복제 | 원클릭으로 영화 만들기

종합 소개 매직보이스 워크샵은 소프트웨어 더빙, 실제 더빙, 사운드 라이브러리, 복제 서비스 등에 대한 정보를 제공하는 원스톱 단편 동영상 및 AI 더빙 플랫폼입니다. 이 플랫폼에는 오디오 관련 서비스 및 콘텐츠 제작을 위한 오디오 편집, AI 카피 생성, 비디오 편집 및 협업 도구가 통합되어 있습니다. 사용자가 오디오 편집기를 체험해 보세요...
10개월 전
01.7K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: 다국어 AI 음성 생성기, 혁신적인 인간 음성 합성 기술

일반 소개 Listnr은 자신의 목소리 복제를 포함하여 142개 이상의 언어로 1,000개 이상의 다양한 목소리로 음성 합성을 생성하는 생성 AI 엔진이 탑재된 텍스트 음성 변환 소프트웨어입니다. 이 플랫폼은 짧은 동영상, 유튜브에서 1백만 명 이상의 사용자에게 서비스를 제공하고 있습니다.
10개월 전
01.8K
度加:文案一键成片,急速克隆声音和剪辑精彩片段

Degree Plus: 클릭 한 번으로 영화에 카피라이팅, 사운드 복제 및 하이라이트 편집을 빠르게 진행하세요.

개요 두가 크리에이션 툴은 AI 기술을 통해 콘텐츠 제작의 문턱을 낮추고 제작의 효율성을 높이기 위해 바이두에서 출시한 AIGC(인공지능 콘텐츠 제작) 제작 플랫폼입니다. 이 플랫폼은 바이두의 다양한 AIGC 기능을 통합하여 영감에서 완성품까지 원스톱 창작 서비스를 제공합니다. Duga의 주요 ...
11개월 전
01.9K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: AI 생성 랩 음악 및 음성 복제 플랫폼 | 텍스트 음성 변환

일반 소개 우버덕 AI는 크리에이티브 에이전시, 음악 프로듀서, 프로그래머를 위해 노래와 말하는 목소리의 AI 합성을 제공하는 혁신적인 플랫폼입니다. 사용자는 다양한 음악 리듬을 선택하고, AI를 사용하여 가사를 생성하거나 직접 작사하고, 특정 사운드를 선택하여 궁극적으로 랩 노래를 만들 수 있습니다.
11개월 전
02.1K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: 혁신적인 음성 생성 및 음성 복제 도구

종합적인 소개 GPT-SoVITS는 오픈 소스 음성 변환 및 합성 도구로, GPT 모델과 SoVITS 보이스 체인저 기술을 결합한 것입니다. 이 도구는 샘플이 전혀 없거나 적은 상태에서 즉석에서 텍스트를 음성으로 변환하고 5초의 오디오 샘플만으로 음성 스타일 마이그레이션을 지원합니다. 그 기능에는 교차 언어가 포함됩니다 ...
11개월 전
02.2K
Fish Speech:快速且高精度使用少样本克隆中英文语音

물고기 음성: 몇 개의 샘플을 사용하여 영어와 중국어 음성을 빠르고 정확하게 복제합니다.

일반 소개 피쉬 스피치는 피쉬 오디오에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 합성 도구입니다. 이 도구는 VQ-GAN, Llama 및 VITS와 같은 최첨단 AI 기술을 기반으로 하며 텍스트를 사실적인 음성으로 변환할 수 있습니다.Fish S...
6개월 전
02.7K
ElevenLabs:高质量AI语音生成平台,文字配音和语音克隆工具

ElevenLabs: 고품질 AI 음성 생성 플랫폼, 텍스트 더빙 및 음성 복제 도구

일반 소개 ElevenLabs는 미국 뉴욕에 본사를 둔 스타트업으로, 인공 지능 음성 생성 분야를 전문으로 하는 회사입니다. 이 회사는 텍스트 생성 음성, 음성 생성 음성, 음성 복제 및 음성 인식을 위한 다양하고 강력한 서비스를 제공하며, ElevenLabs는 다음과 같은 분야에서 탁월합니다.
11개월 전
02.5K
Easy Voice Toolkit:本地部署的AI语音工具箱

간편한 음성 툴킷: 로컬 배포를 위한 AI 음성 툴킷

개요 Easy-Voice-Toolkit은 오픈 소스 음성 프로젝트에 기반한 다기능 툴킷으로 음성 인식, 음성 전사, 음성 변환, 데이터 세트 생성 및 모델 학습을 위한 다양한 자동화된 오디오 도구를 제공합니다. 사용자는 필요에 따라 이러한 도구를 선택적으로 사용할 수 있습니다...
11개월 전
02.3K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: 사진 한 장, 여러 무료 동영상 생성 도구로 디지털 사람의 음성 동영상을 생성하세요.

일반 설명 Vidnoz는 1분 이내에 AI 동영상을 빠르게 제작할 수 있는 무료 AI 동영상 생성 플랫폼입니다. 비용, 다운로드 또는 경험이 필요하지 않습니다. 이 플랫폼은 500개 이상의 AI 아바타, 470개 이상의 사실적인 AI 보이스오버, 500개 이상의 템플릿을 제공합니다. Vidnoz AI 동영상으로...
12개월 전
02.7K
Rask AI:视频多语言翻译与专业语音克隆,视频本地化工具

Rask AI: 전문 음성 복제를 통한 비디오 다국어 번역, 비디오 현지화 도구

일반 소개 Rask AI는 크리에이터, 교육자 및 글로벌 비즈니스에 신속한 오디오 및 비디오 제작 솔루션을 제공하도록 설계된 지능형 비디오 로컬라이제이션 플랫폼입니다. 이 플랫폼은 130개 이상의 언어로 비디오와 오디오를 자동 번역하여 사용자가 글로벌 시장으로 확장할 수 있도록 지원합니다. 특별한 기능에는 비디오...
12개월 전
02.7K
有道数字人:虚拟形象播报与实时交互平台|免费制作克隆数字人

아리가토우 디지털 휴먼: 가상 이미지 방송 및 실시간 상호작용 플랫폼|무료 클론 디지털 휴먼 제작

종합 소개 위챗 디지털 피플은 가상 이미지 방송과 실시간 대화형 서비스 제공에 중점을 둔 첨단 AI 기술이 통합된 플랫폼입니다. 이 플랫폼은 자체 개발한 음성 인식, 음성 합성, 다중 모드 인식 및 문서 Q&A 기술을 사용하여 사용자가 비디오 제작, 번역, 교육을 지원할 수 있도록 사실적인 디지털 인간 도플갱어를 만듭니다.
12개월 전
02.1K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice(MyShell): 더 적은 샘플로 여러 언어로 즉시 음성 복제하기

일반 소개 OpenVoice는 참조 화자의 음성을 복사하고 화자의 짧은 오디오 클립만을 사용하여 다국어 음성을 생성할 수 있는 다용도 인스턴트 음성 복제 방법입니다. OpenVoice는 톤을 복사하는 것 외에도 감정 표현을 포함한 음성 스타일을 세밀하게 제어할 수 있습니다.
9개월 전
02.2K