AI-Stimmenklonen

Insgesamt 41 Artikel
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: Ein leichtgewichtiges Modell zur Synthese von chinesischer und englischer Sprache

Umfassende Einführung MegaTTS3 ist ein Open-Source-Sprachsynthese-Tool, das von ByteDance in Zusammenarbeit mit der Zhejiang University entwickelt wurde und sich auf die Erzeugung hochwertiger chinesischer und englischer Sprache konzentriert. Sein Kernmodell besteht aus nur 0,45B Parametern, ist leichtgewichtig und effizient und unterstützt die Erzeugung gemischter chinesischer und englischer Sprache sowie das Klonen von Sprache. Das Projekt wird gehostet auf ...
vor 4 Monaten
01.3K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: ein multimodales Sprachinteraktionssystem, das u. a. Sprache erkennt und mit geklonter Sprache kommuniziert

Umfassende Einführung Step-Audio ist ein Open-Source-Framework für intelligente Sprachinteraktion, das entwickelt wurde, um sofort einsetzbare Sprachverstehens- und -erzeugungsfunktionen für Produktionsumgebungen bereitzustellen. Das Framework unterstützt mehrsprachige Konversationen (z.B. Chinesisch, Englisch, Japanisch), emotionale Sprache (z.B. glücklich, traurig), regionale Dialekte (z.B. Kantonesisch, Szechuan ...
vor 6 Monaten
02K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Weights: eine Plattform zur Erstellung von Cover-Songs und Text-to-Speech-Nachahmungen

Allgemeine Einführung Weights ist eine soziale Plattform für Kreativität mit KI, die es den Nutzern ermöglicht, mit einfachen Aktionen Sprachcover, Text-to-Speech, Bilder, Musik und Videos zu erstellen. Die Plattform bietet eine Fülle von Tools und Vorlagen, die den Nutzern helfen, schnell mit der Erstellung zu beginnen und mit der Community zu teilen, da...
vor 6 Monaten
02.3K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: Kostenloses Online-Stimmenklonen in nur 3 Sekunden!

Allgemeine Einführung AnyVoice ist eine fortschrittliche KI-Spracherzeugungsplattform, die ultrarealistische Spracherzeugung und das Klonen von Stimmen anbietet. Die Plattform ermöglicht es Benutzern, Text in natürliche Sprache umzuwandeln und aus Hunderten von voreingestellten Stimmen zu wählen. Wenn Sie nicht die richtige Stimme finden, können Sie einfach...
vor 6 Monaten
02K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: ein quelloffenes Text-zu-Sprache-Modell für hochwertige Spracherzeugung und Klonen

Allgemeine Einführung Llasa-3B ist ein Open-Source-Text-to-Speech-Modell (TTS), das vom Audio Lab der Hong Kong University of Science and Technology (HKUST Audio) entwickelt wurde. Das Modell basiert auf der Llama-3.2B-Architektur, die sorgfältig abgestimmt wurde, um eine qualitativ hochwertige Spracherzeugung zu bieten, die nicht nur mehrere...
vor 6 Monaten
01.8K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: End-to-End-KI-Stimmenklon-Assistent, Echtzeit-Sprachdialog-Assistent, Fish Speech-Spin-off-Projekt

Umfassende Einführung Fish Speech Derivative Project Fish Agent ist ein revolutionäres End-to-End-KI-Sprachklon-System, das auf der Grundlage der 3B-Modellarchitektur V0.1 entwickelt wurde. Als ein vollständig durchgängiges Sprachklon-Verarbeitungssystem ist sein wichtigstes Merkmal die Verwendung innovativer sprachloser...
vor 7 Monaten
02.1K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: Mehrsprachige Audio-/Video-Übersetzungssynthese und Sprachklon-Service

Umfassende Einführung ViiTor AI ist eine leistungsstarke Plattform für künstliche Intelligenz, die sich auf die Bereitstellung hochwertiger Videoübersetzung, das Klonen von Stimmen, KI-generierte Avatar-Videos und Sprachsynthese-Dienste konzentriert. Die Plattform unterstützt mehrere Sprachen und zielt darauf ab, den Benutzern die Erstellung mehrsprachiger Inhalte zu erleichtern...
vor 8 Monaten
02.7K
趣丸千音:语音克隆并结合口型同步,一键翻译视频为多语言!

Funky Maru Chiyo: Stimme klonen und mit Mundsynchronisation kombinieren, um Videos mit einem einzigen Klick in mehrere Sprachen zu übersetzen!

Umfassende Einführung Funmaru Thousand Voices ist eine mehrsprachige KI-Stimmensyntheseplattform, die realistische und natürliche Stimmerzeugungslösungen bietet. Benutzer können Textinhalte einfach in professionelle Audiodateien umwandeln und die Erstellung exklusiver KI-Stimmen (Stimmklone) aus Null-Samples unterstützen, um individuelle Anforderungen zu erfüllen. Die Plattform bietet auch Videoübersetzungsfunktionen, um die...
vor 8 Monaten
01.9K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: Open-Source-Projekt zum Klonen von 3-Sekunden-Stimmen von Ali mit Unterstützung für gefühlsgesteuerte Tags

Umfassende Einführung CosyVoice ist ein mehrsprachiges, groß angelegtes Spracherzeugungsmodell, das umfassende Funktionen von der Inferenz über das Training bis zur Bereitstellung bietet. Es wurde vom FunAudioLLM-Team entwickelt und zielt darauf ab, eine hohe Sprachqualität durch fortschrittliche autoregressive Transformatoren und ODE-basierte Diffusionsmodelle zu erreichen...
vor 6 Monaten
03.5K
海螺AI视频生成器:文本或图像生成高质量视频,影视级镜头创作

Conch AI-Videogenerator: Text oder Bild zur Erstellung von hochwertigem Video-, Film- und TV-Material

Allgemeine Einführung Conch AI Video Generator ist ein von MiniMax entwickeltes fortschrittliches Tool zur Erzeugung von AI-Videos. Benutzer müssen nur eine einfache Textbeschreibung eingeben oder Bilder hochladen, und Conch AI kann schnell hochwertige Videoinhalte erzeugen. Das Tool wird häufig von Kreativen, Vermarktern und...
vor 8 Monaten
02.1K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): ein Deep-Learning-Toolkit für die Text-zu-Sprache-Erzeugung mit mehrsprachiger Unterstützung und Funktionen zum Klonen von Stimmen

Umfassende Einführung Coqui TTS ist ein Open-Source-Toolkit zur Erzeugung von Text-to-Speech (TTS), das auf Deep-Learning-Techniken basiert. Es wurde sowohl in Forschungs- als auch in Produktionsumgebungen erprobt und bietet eine Vielzahl von Funktionen und Modellen, die die Umwandlung von Text in Sprache in mehreren Sprachen unterstützen....
vor 6 Monaten
02K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: Schnelles Klonen von Stimmen und Modelltraining, Text-to-Speech basierend auf xtts v2

Umfassende Einführung MockingBird ist ein Open-Source-Projekt, das darauf abzielt, schnelles Sprachklonen und Text-to-Speech durch KI-Technologie zu erreichen. Benutzer müssen nur 5 Sekunden Stimmproben zur Verfügung stellen, Sie können beliebige Sprachinhalte erzeugen. Das Projekt unterstützt eine Vielzahl von chinesischen Datensätzen, und in Windows ...
vor 8 Monaten
02.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: Mehrsprachiges, samplefreies Tool zum Klonen von Stimmen basierend auf xtts_v2 für Windows.

Allgemeine Beschreibung Clone Voice ist ein Open-Source-Tool zum Klonen von Klängen, das eine webbasierte Schnittstelle bietet, mit der Benutzer Stimmen klonen können, indem sie beliebige Klänge oder persönliche Sprachaufnahmen verwenden. Das Tool ist einfach zu bedienen, auch ohne NVIDIA GPU, und kann mit einer vorkompilierten App verwendet werden...
vor 10 Monaten
02.1K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

Retrieval-basierte Sprachumwandlung WebUI: Ein Rahmenwerk für Retrieval-basierte Sprachumwandlung | Simulation realer Gesangsstimmen

Comprehensive Introduction Retrieval based Voice Conversion WebUI ist ein einfach zu bedienendes VITS-basiertes Sprachkonvertierungs-Framework, das die Sprachkonvertierung zwischen beliebigen Sprechern ermöglicht, einschließlich Song-Covers und Stimmänderungen in Echtzeit. Es hat niedrige ...
vor 10 Monaten
02.1K
自得语音:智能语音合成平台|语音克隆

Zide Speech: Intelligente Sprachsynthese-Plattform|Sprachenklonen

Umfassende Einführung Zide Voice ist eine Sprachsyntheseplattform, die fortschrittliche KI-Technologie verwendet. Benutzer können einfach eine Stimme hochladen, die mit Text ergänzt werden kann, um realistische und emotionale Sprachclips zu erzeugen. Die Plattform verfügt über Funktionen wie schnelle Charakteranpassung, cloudbasierte Stimmerzeugung und anthropomorphe Stimmsynthese. Es besteht keine Notwendigkeit, Software herunterzuladen...
vor 10 Monaten
01.7K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: Open-Source-Null-Sample-Sprachklonierung und Text-to-Speech-Tool

Umfassende Einführung VoiceCraft ist ein Open-Source-Sprachbearbeitungs- und Null-Sample-Sprachsynthese-Tool, das auf dem neuronalen Codec-Sprachmodell basiert. Es verwendet eine innovative Methode zur Generierung kodierter Sequenzen, die das Einfügen, Löschen und Ersetzen bestehender Sprachsequenzen ermöglicht, um natürliche, kohärent bearbeitete Sprache zu erzeugen...
vor 10 Monaten
02K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: Plattform für intelligente Sprachsynthese und Stimmenklonen

Umfassende Einführung Seaweed AI ist ein intelligentes Synchronisationsprodukt, das Text online in Sprache umwandeln kann und auf der offenen Plattform Yun Zhisheng AI basiert. Benutzer können sich selbst helfen, um das Klonen von Stimmen zu erreichen, und KI-Sprecher verschiedener Geschlechter, Akzente und Sprachen zur Verfügung stellen, und die Stimme direkt nach der Texteingabe synchronisieren. Es kann schnell synchronisieren kurze...
vor 10 Monaten
02K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: Künstliche Intelligenz Sprachsynthese Plattform | Voice Cloning | Deep Fake Audio Detection

Umfassende Einführung Resemble AI ist eine Sprachsyntheseplattform mit künstlicher Intelligenz, die für Unternehmen entwickelt wurde. Die Plattform bietet eine hochmoderne KI-Stimmengeneratortechnologie und eine tiefgreifende Erkennung gefälschter Audiodaten für die zukünftige Informationssicherheit. Zu den Funktionen gehören das Klonen von Stimmen, die Erkennung gefälschter Audiodaten in Echtzeit, die KI-Wasserzeichen-Technologie...
vor 10 Monaten
02K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: Professionelle Plattform zur Erstellung von Voice-over und kurzen Videokommentaren | Real Person Voice-over | Clone Voice | One-Click into a Film

Umfassende Einführung Magic Voice Workshop ist eine Plattform für Kurzvideos und KI-Synchronisation mit Informationen über Software-Synchronisation, Real-Life-Synchronisation, Sound-Bibliotheken, Klon-Services und mehr. Die Plattform integriert Audiobearbeitung, KI-Kopiererstellung, Videobearbeitung und Kollaborationstools für audiorelevante Dienste und die Erstellung von Inhalten. Benutzer erleben den Audio-Editor...
vor 10 Monaten
01.6K
度加:文案一键成片,急速克隆声音和剪辑精彩片段

Degree Plus: Mit einem Klick in einen Film kopieren, Ton klonen und Highlights in Windeseile schneiden

Umfassende Einführung Das Duga Creation Tool ist eine von Baidu ins Leben gerufene AIGC (Artificial Intelligence Generated Content)-Erstellungsplattform, die darauf abzielt, die Schwelle der Inhaltserstellung zu senken und die Effizienz der Erstellung durch KI-Technologie zu verbessern. Die Plattform bündelt die vielfältigen AIGC-Fähigkeiten von Baidu, um einen One-Stop-Erstellungsservice von der Inspiration bis zum fertigen Produkt zu bieten. Dugas Haupt ...
vor 11 Monaten
01.8K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: KI-generierte Rap-Musik und Plattform zum Klonen von Stimmen | Text to Speech

Allgemeine Einführung Uberduck AI ist eine innovative Plattform, die KI-Synthese von Gesangs- und Sprechstimmen für Kreativagenturen, Musikproduzenten und Programmierer bietet. Die Nutzer können verschiedene musikalische Rhythmen auswählen, Texte mithilfe von KI generieren oder selbst schreiben, bestimmte Sounds auswählen und schließlich Rap-Songs erstellen...
vor 11 Monaten
02K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: Revolutionäre Werkzeuge zur Spracherzeugung und zum Klonen von Sprache

Umfassende Einführung GPT-SoVITS ist ein Open-Source-Sprachkonvertierungs- und -synthesewerkzeug, das das GPT-Modell und die SoVITS-Sprachwandlertechnologie kombiniert. Das Tool unterstützt die fliegende Text-zu-Sprache-Konvertierung mit null und wenigen Samples sowie die Migration von Sprachstilen mit nur 5 Sekunden Audio-Samples. Zu seinen Funktionen gehören sprachübergreifende ...
vor 11 Monaten
02.2K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

Umfassende Einführung Easy-Voice-Toolkit ist ein multifunktionales Toolkit, das auf dem Open Source Speech Project basiert und eine breite Palette von automatisierten Audiowerkzeugen für die Spracherkennung, Sprachtranskription, Sprachkonvertierung, Datensatzerstellung und Modelltraining bietet. Benutzer können diese Werkzeuge je nach Bedarf selektiv einsetzen...
vor 11 Monaten
02.1K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Generieren Sie digitale, menschlich sprechende Videos mit nur einem Foto, mehrere kostenlose Tools zur Videoerstellung

Allgemeine Beschreibung Vidnoz ist eine kostenlose Plattform zur Erstellung von KI-Videos, mit der Sie in weniger als 1 Minute KI-Videos erstellen können. Keine Kosten, Download oder Erfahrung erforderlich. Die Plattform bietet 500+ KI-Avatare, 470+ realistische KI-Sprachaufnahmen und 500+ Vorlagen. Mit Vidnoz AI Video...
vor 12 Monaten
02.4K
Rask AI:视频多语言翻译与专业语音克隆,视频本地化工具

Rask AI: Mehrsprachige Videoübersetzung mit professionellem Sprachklonen, Video-Lokalisierungstool

Allgemeine Einführung Rask AI ist eine intelligente Videolokalisierungsplattform, die schnelle Lösungen für die Audio- und Videoproduktion für Kreative, Lehrkräfte und globale Unternehmen bietet. Die Plattform unterstützt die automatische Übersetzung von Video- und Audiodateien in mehr als 130 Sprachen und hilft den Nutzern bei der Expansion in globale Märkte. Zu den besonderen Merkmalen gehören Video...
vor 12 Monaten
02.5K
有道数字人:虚拟形象播报与实时交互平台|免费制作克隆数字人

Arigatou Digital Human: Plattform für virtuelle Bildübertragung und Echtzeit-Interaktion - Kostenlose Erstellung von digitalen Klon-Menschen

Umfassende Einführung Wealth Digital People ist eine Plattform, die fortschrittliche KI-Technologie integriert und sich auf die Bereitstellung virtueller Bildübertragungen und interaktiver Echtzeitdienste konzentriert. Die Plattform nutzt selbst entwickelte Spracherkennung, Sprachsynthese, multimodale Wahrnehmung und Dokumenten-Q&A-Technologie, um realistische digitale menschliche Doppelgänger für Benutzer zu erstellen, die die Videoproduktion, die Übersetzung, den Unterricht...
vor 12 Monaten
01.9K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell): Sofortiges Klonen von Sprache in mehreren Sprachen mit weniger Samples

Allgemeine Einführung OpenVoice ist eine vielseitige Methode zum sofortigen Klonen von Sprache, die es Ihnen ermöglicht, die Stimme eines Referenzsprechers zu kopieren und mehrsprachige Sprache mit nur kurzen Audioclips des Sprechers zu erzeugen. Zusätzlich zum Kopieren von Tönen erlaubt OpenVoice eine feine Kontrolle über den Sprachstil, einschließlich...
vor 9 Monaten
02.1K