AI Text-to-Speech

Insgesamt 79 Artikel
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: Open-Source-Audioverarbeitung und Dialogbasis-Modell

Allgemeine Einführung Kimi-Audio ist ein Open-Source-Audiobasismodell, das von Moonshot AI entwickelt wurde und sich auf Audioverstehen, -erzeugung und -dialog konzentriert. Es unterstützt eine breite Palette von Audioverarbeitungsaufgaben wie Spracherkennung, Audio-Q&A und Sprach-Emotionserkennung. Das Modell wurde über 130 Mal getestet...
vor 3 Monaten
01.1K
Dia:生成超现实多人对话的文本转语音模型

Dia: ein Text-to-Speech-Modell zur Erzeugung hyperrealistischer Multiplayer-Dialoge

Allgemeine Einführung Dia ist ein Open-Source-Text-to-Speech (TTS)-Modell, das von Nari Labs entwickelt wurde und sich auf die Erzeugung von hyperrealistischem Dialog-Audio konzentriert. Es wandelt Text-Skripte in einem einzigen Prozess in realistische Multi-Charakter-Dialoge um, unterstützt Emotions- und Intonationskontrolle und generiert sogar nonverbale Repräsentationen...
vor 4 Monaten
0907
Vapi:帮助开发者快速构建低延时语音助手

Vapi: Unterstützung von Entwicklern bei der Entwicklung von Sprachassistenten mit niedriger Latenz

Umfassende Einführung Vapi ist eine Sprach-KI-Plattform für Entwickler. Sie ermöglicht es Anwendern, Sprach-KI-Assistenten in Minutenschnelle zu erstellen, zu testen und einzusetzen und löst damit das Problem der zeitaufwändigen und schwer skalierbaren Entwicklung herkömmlicher Sprachanwendungen.Vapi bietet komplette Tools und Infrastrukturen zur Unterstützung von Echtzeitgesprächen,...
vor 4 Monaten
01.1K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: eine grafische Text-zu-Sprache-Schnittstelle auf der Grundlage von Silizium-basierten Flow-APIs

Allgemeine Einführung Text2Voice ist ein Open-Source-Tool, das Text-to-Speech-Funktionalität auf der Grundlage einer Silizium-basierten Mobilitäts-API bietet, mit einer sauberen grafischen Benutzeroberfläche (GUI) als seine beste Eigenschaft. Es wurde vom Entwickler Sheldon Lee auf GitHub erstellt, um...
vor 4 Monaten
01.1K
集成多种先进语音合成服务的开源运营项目

Operatives Open-Source-Projekt, das mehrere fortschrittliche Sprachsynthesedienste integriert

Allgemeine Einführung Open-VoiceCanvas ist eine Open-Source-Plattform für Sprachsynthese, die vom ItusiAI-Team entwickelt wurde. Sie unterstützt mehr als 50 Sprachen, kann Text in natürliche Sprache umwandeln und durch Hochladen von Audiodaten personalisierte Stimmen klonen. Das Projekt integriert Ope...
vor 4 Monaten
01.3K
Paper to Podcast:把学术论文转换为多人对话播客

Paper to Podcast: Umwandlung akademischer Papiere in Podcasts mit Konversation für mehrere Personen

Allgemeine Einführung Paper to Podcast ist ein Open-Source-Tool, das darauf spezialisiert ist, akademische Forschungsarbeiten in lebendige und unterhaltsame Podcasts zu verwandeln. Es nutzt die Technologie der künstlichen Intelligenz, um ein PDF-formatiertes Papier in einen Dialog zwischen drei Charakteren - dem Moderator, dem Lernenden und dem Experten - zu verwandeln, um komplexe...
vor 4 Monaten
0934
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: Ein leichtgewichtiges Modell zur Synthese von chinesischer und englischer Sprache

Umfassende Einführung MegaTTS3 ist ein Open-Source-Sprachsynthese-Tool, das von ByteDance in Zusammenarbeit mit der Zhejiang University entwickelt wurde und sich auf die Erzeugung hochwertiger chinesischer und englischer Sprache konzentriert. Sein Kernmodell besteht aus nur 0,45B Parametern, ist leichtgewichtig und effizient und unterstützt die Erzeugung gemischter chinesischer und englischer Sprache sowie das Klonen von Sprache. Das Projekt wird gehostet auf ...
vor 4 Monaten
01.3K
Podcastle:快速创建高质量播客的AI工具

Podcastle: das KI-Tool zur schnellen Erstellung hochwertiger Podcasts

Allgemeine Einführung Podcastle ist eine KI-basierte Online-Plattform, die darauf spezialisiert ist, Nutzern bei der schnellen Erstellung und Bearbeitung hochwertiger Podcasts zu helfen. Sie integriert Aufnahme-, Bearbeitungs- und Veröffentlichungsfunktionen, und die Nutzer können dies alles über einen Browser erledigen, ohne dass sie spezielle Geräte oder komplexe Software benötigen. Die Plattform nutzt die ...
vor 4 Monaten
01K
猫与星:和孩子一起编写专属童话故事的听故事APP

Cat & Star: Eine App zum Zuhören von Geschichten, mit der Sie gemeinsam mit Ihrem Kind exklusive Märchen schreiben können

Allgemeine Einführung "Cat & Star" (maoyuxing.com) ist eine interaktive Plattform zur Erstellung von Geschichten für Kinder, die es Eltern und Kindern ermöglicht, über mobile Anwendungen gemeinsam personalisierte Märchen zu erstellen. Die Nutzer können Informationen wie den Namen des Kindes und seine Vorlieben eingeben, um einzigartige Märcheninhalte zu erstellen...
vor 6 Monaten
01.3K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: Eine einheitliche API für die Integration von bekannter Spracherzeugung, Sprachtranskription und Sprachmodellierung

Allgemeine Einführung Orate ist ein KI-Toolkit, das sich auf Spracherzeugung und Transkription konzentriert. Es bietet eine einheitliche API, die sich nahtlos mit führenden KI-Anbietern wie OpenAI, ElevenLabs und AssemblyAI integrieren lässt, um Nutzern zu helfen,...
vor 6 Monaten
01.8K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Weights: eine Plattform zur Erstellung von Cover-Songs und Text-to-Speech-Nachahmungen

Allgemeine Einführung Weights ist eine soziale Plattform für Kreativität mit KI, die es den Nutzern ermöglicht, mit einfachen Aktionen Sprachcover, Text-to-Speech, Bilder, Musik und Videos zu erstellen. Die Plattform bietet eine Fülle von Tools und Vorlagen, die den Nutzern helfen, schnell mit der Erstellung zu beginnen und mit der Community zu teilen, da...
vor 6 Monaten
02.3K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: Kostenloses Online-Stimmenklonen in nur 3 Sekunden!

Allgemeine Einführung AnyVoice ist eine fortschrittliche KI-Spracherzeugungsplattform, die ultrarealistische Spracherzeugung und das Klonen von Stimmen anbietet. Die Plattform ermöglicht es Benutzern, Text in natürliche Sprache umzuwandeln und aus Hunderten von voreingestellten Stimmen zu wählen. Wenn Sie nicht die richtige Stimme finden, können Sie einfach...
vor 6 Monaten
02K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDF in Podcasts von Open-Source-Tools konvertieren

Allgemeine Einführung Open NotebookLM ist ein Open-Source-Projekt, das entwickelt wurde, um jedes PDF-Dokument in einen Podcast zu konvertieren. Das Tool verwendet quelloffene Large Language Model (LLM)- und Text-to-Speech (TTS)-Modelle zur Verarbeitung von PDF-Inhalten, um natürliche Dialoge zu erzeugen, die für Audio-Podcasts geeignet sind...
vor 6 Monaten
01.6K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: ein quelloffenes Text-zu-Sprache-Modell für hochwertige Spracherzeugung und Klonen

Allgemeine Einführung Llasa-3B ist ein Open-Source-Text-to-Speech-Modell (TTS), das vom Audio Lab der Hong Kong University of Science and Technology (HKUST Audio) entwickelt wurde. Das Modell basiert auf der Llama-3.2B-Architektur, die sorgfältig abgestimmt wurde, um eine qualitativ hochwertige Spracherzeugung zu bieten, die nicht nur mehrere...
vor 6 Monaten
01.7K
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: Online-KI-Spracherzeugung und Text-to-Speech (TTS)-Dienstplattformen

Allgemeine Einführung Acoust ist eine Online-KI-Plattform für Spracherzeugung und Text-to-Speech (TTS), die die neueste KI-Technologie nutzt, um realistische Sprache zu erzeugen. Die Plattform bietet außerdem leistungsstarke Videobearbeitungstools, mit denen die Benutzer die Videoproduktion abschließen können, ohne dass sie mehrere Softwareprogramme...
vor 7 Monaten
01.4K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Allgemeine Einführung ebook2audiobook ist ein leistungsstarkes Open-Source-Tool zur Umwandlung von eBooks in Hörbücher. Es ist in der Lage, eBooks in mehreren Formaten in Hörbücher mit vollständigen Kapitelmarkierungen und Metadaten zu konvertieren. Das Tool verwendet Calibre für die Konvertierung von eBooks in Hörbücher mit...
vor 7 Monaten
02.4K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: Mehrsprachige Audio-/Video-Übersetzungssynthese und Sprachklon-Service

Umfassende Einführung ViiTor AI ist eine leistungsstarke Plattform für künstliche Intelligenz, die sich auf die Bereitstellung hochwertiger Videoübersetzung, das Klonen von Stimmen, KI-generierte Avatar-Videos und Sprachsynthese-Dienste konzentriert. Die Plattform unterstützt mehrere Sprachen und zielt darauf ab, den Benutzern die Erstellung mehrsprachiger Inhalte zu erleichtern...
vor 8 Monaten
02.5K
Wondercraft:专注广告配音、多人有声读物和播客的文本转音频工具

Wondercraft: Text-zu-Audio-Tool mit Schwerpunkt auf Werbesprechern, Multiplayer-Hörbüchern und Podcasts

Allgemeine Einführung Wondercraft ist eine revolutionäre, KI-gesteuerte Plattform zur Erstellung von Audio- und Videodateien, die Autoren von Inhalten eine Komplettlösung für die Audio- und Videoproduktion bietet. Dank fortschrittlicher KI-Technologie ist die Plattform in der Lage, Textinhalte in natürliche und flüssige Sprache umzuwandeln und unterstützt mehr als 20 Sprachen...
vor 8 Monaten
01.8K
NotebookLM Podcast:任何文档生成多语言个性化AI播客(付费)

NotebookLM Podcast: Erzeugen eines mehrsprachigen, personalisierten KI-Podcasts aus jedem Dokument (kostenpflichtig)

Allgemeine Beschreibung NotebookLM Podcast ist eine innovative Plattform, die die Technologie der künstlichen Intelligenz nutzt, um beliebige Textinhalte in dynamische, ansprechende Audio-Podcasts zu verwandeln. Egal, ob Sie Student, Pädagoge, Ersteller von Inhalten oder vielbeschäftigter Berufstätiger sind, NotebookLM...
vor 8 Monaten
01.6K
PlayAI:提供流畅、富有情感的语音对话和语音合成服务(英文)

PlayAI: reibungslose und emotionale Sprachdialoge und Sprachsynthesedienste (Englisch)

Allgemeine Einführung PlayAI ist eine KI-Plattform, die sich auf Spracherzeugung und Sprachklonen konzentriert. Sie bietet eine breite Palette von Sprachmodellen, die in der Lage sind, flüssige und emotionale Dialoge zu erzeugen. Benutzer können die Plattform nutzen, um personalisierte Sprachagenten zu erstellen, die das interaktive Erlebnis verbessern...
vor 9 Monaten
01.5K
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具

GizAI: All-in-One-KI-Assistent, der die wichtigsten generativen KI-Tools integriert und kommerzielle KI-Tools für jedermann kostenlos zur Verfügung stellt

Allgemeine Einführung GizAI ist eine One-Stop-Plattform mit integrierter KI-Generierung, Notizen und Cloud-Speicherfunktionen. Benutzer können Bilder, Videos, Audios, Texte, Charaktere, Geschichten und Spiele mit GizAI generieren, und können kollaborative Notizen und Cloud-Speicher auf der Plattform nehmen.GizAI bietet...
vor 8 Monaten
02.9K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: experimentelles Text-to-Speech-Modell, TTS implementiert mit einem reinen Sprachmodellierungsansatz

Umfassende Einführung OuteTTS ist ein experimentelles Text-to-Speech (TTS) Modell, das einen reinen Sprachmodellierungsansatz verwendet, um qualitativ hochwertige Sprache zu erzeugen. Im Gegensatz zu traditionellen TTS-Systemen benötigt OuteTTS keine externen Adapter oder komplexe Architekturen. Das Modell basiert auf der LLaMa-Architektur...
vor 6 Monaten
01.8K
PodLM:将对话、网页或长文本生成多语言音频播客(付费)

PodLM: Erzeugen von mehrsprachigen Audio-Podcasts von Dialogen, Webseiten oder langen Texten (kostenpflichtig)

Allgemeine Einführung PodLM ist eine hochmoderne KI-Podcast-Generierungsplattform, die Benutzern helfen soll, Text, Dokumente oder URL-Inhalte schnell in hochwertige Podcast-Audios zu konvertieren. Durch den Einsatz modernster KI-Technologie ist PodLM in der Lage, automatisch strukturierte und ansprechende Podcast-Skripte zu erstellen und...
vor 10 Monaten
02K
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate: Open-Source-Videoübersetzungs-Synchronisationslösung, Mehrfachsynchronisation, Geschwindigkeitsanpassung und Nachahmung des Originaltons

Allgemeine Beschreibung SoniTranslate ist ein leistungsstarkes und benutzerfreundliches Tool für die mehrsprachige Synchronisation von Videos, das eine Lösung für die Übersetzung von Videos und die Synchronisierung von Audio bietet. Es nutzt fortschrittliche Spracherkennungs- und maschinelle Übersetzungstechnologien, um Videoinhalte in mehrere Sprachen zu übersetzen und den Ton zu synchronisieren. Das ...
vor 10 Monaten
03.8K
逗哥配音:专注短视频解说、创作的智能配音神器

Teaser-Synchronisation: Intelligentes Synchronisationstool mit Schwerpunkt auf der Erstellung von kurzen Videokommentaren

Umfassende Einführung Tease Dubbing ist eine beliebte AI-Synchronisationssoftware mit über 5 Millionen Benutzern. Die Software verwendet eine fortschrittliche intelligente KI-Synchronisationstechnologie, um professionelle und realistische Synchronisationseffekte zu erzielen, die für kurze Videos, Werbeproduktionen, Bildung und Ausbildung und andere Szenarien geeignet sind. Teaser Dubbing ist verpflichtet, die Benutzer mit schnellen...
vor 10 Monaten
01.8K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

YouTube-Synchronisation: Übersetzen Sie YouTube-Videos in verschiedene Sprachen und synchronisieren Sie die Synchronisation in Echtzeit

Allgemeine Einführung YouTube Dubbing ist eine intelligente Synchronisationsplattform, die mehrsprachige Synchronisationsdienste für Videoersteller und -zuschauer anbietet. Mithilfe von KI-Technologie ist die Plattform in der Lage, YouTube-Videos automatisch zu übersetzen und zu synchronisieren, wobei mehrere Sprachen und Sprachstile unterstützt werden. Benutzer müssen nur die...
vor 10 Monaten
01.9K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: ein Schlüssel zur Erzeugung von Hörbüchern in natürlicher Klangqualität, Unterstützung für PDF, epub, docx und andere Formate

Umfassende Einführung QuickPiperAudiobook ist ein Open-Source-Projekt, das entwickelt wurde, um eine Vielzahl von Textformaten (z.B. epub, mobi, txt, PDF, HTML, etc.) in natürlich klingende Hörbücher durch einen einfachen Befehl zu konvertieren. Das Tool verwendet Pi...
vor 10 Monaten
01.5K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: Plattform für intelligente Sprachsynthese und Stimmenklonen

Umfassende Einführung Seaweed AI ist ein intelligentes Synchronisationsprodukt, das Text online in Sprache umwandeln kann und auf der offenen Plattform Yun Zhisheng AI basiert. Benutzer können sich selbst helfen, um das Klonen von Stimmen zu erreichen, und KI-Sprecher verschiedener Geschlechter, Akzente und Sprachen zur Verfügung stellen, und die Stimme direkt nach der Texteingabe synchronisieren. Es kann schnell synchronisieren kurze...
vor 10 Monaten
01.9K
Descript:一站式视频与播客编辑,简单如编辑文档

Descript: Video- und Podcast-Bearbeitung aus einer Hand, so einfach wie die Bearbeitung eines Dokuments

Descript Allgemeine Beschreibung Descript ist ein leistungsstarkes und dennoch einfach zu bedienendes Werkzeug zur Bearbeitung von Videos und Podcasts. Es verfügt über eine branchenführende Transkriptionsgenauigkeit und -geschwindigkeit, leistungsstarke Korrekturwerkzeuge sowie die Möglichkeit, Videos mit Hilfe von KI-Technologie in Text zu transkribieren und Videos durch Bearbeitung des Textes zu bearbeiten. Zusätzlich zu...
vor 10 Monaten
02.1K
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI: Sprachwandler|Sprache zu Text|Text zu Sprache|Audio Editor

Allgemeine Einführung Murf AI ist ein leistungsstarkes Online-Tool zur Erzeugung künstlicher Intelligenz, das Text in nahezu echte menschliche Sprache umwandelt. Es bietet bis zu 120+ KI-Stimmenoptionen, unterstützt mehr als 20 Sprachen und eignet sich für eine Vielzahl von Situationen wie Podcasts, Videos, professionelle Präsentationen usw...
vor 10 Monaten
02.3K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: Künstliche Intelligenz Sprachsynthese Plattform | Voice Cloning | Deep Fake Audio Detection

Umfassende Einführung Resemble AI ist eine Sprachsyntheseplattform mit künstlicher Intelligenz, die für Unternehmen entwickelt wurde. Die Plattform bietet eine hochmoderne KI-Stimmengeneratortechnologie und eine tiefgreifende Erkennung gefälschter Audiodaten für die zukünftige Informationssicherheit. Zu den Funktionen gehören das Klonen von Stimmen, die Erkennung gefälschter Audiodaten in Echtzeit, die KI-Wasserzeichen-Technologie...
vor 10 Monaten
02K
Ondoku:在线文本朗读工具|文本转语音|图片转语音朗读

Ondoku: Online Text Reader|Text to Speech|Image to Speech Reader

Ondoku Allgemeine Einführung Ondoku ist eine Online-Text-to-Speech-Software, die es den Nutzern ermöglicht, Textinhalte in das von der Website bereitgestellte Textfeld einzugeben. Die Software ist in der Lage, den Artikel entsprechend den Bedürfnissen des Nutzers in eine Sprachausgabe umzuwandeln, und unterstützt das Speichern der Stimme als Datei im MP3-Format. Dieser Dienst eignet sich sowohl zum sofortigen Anhören...
vor 10 Monaten
02K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: Professionelle Online-Audiobearbeitung, Hörbuchproduktion, Text-to-Speech, Begleitungsseparation

Allgemeine Einführung XAudioPro ist ein fortschrittliches Online-Audiobearbeitungs- und Transkodierungstool in Echtzeit, das sowohl professionell als auch portabel ist. Es unterstützt professionelle Audiobearbeitungsfunktionen wie Schneiden, Beschneiden, Kopieren, Löschen, Wiederherstellen und Amplitudenverstärkungssteuerung. Es bietet auch Entrauschungsdienste wie spektrale Subtraktion, Rauschunterdrückung, Tiefpass...
vor 10 Monaten
01.6K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: Stärkung der KI mit Emotionserkennung | Erkennung von Gefühlszuständen aus Lauten und Ausdrücken | Generierung von Sprache mit Gefühlszuständen

Allgemeine Einführung Hume AI ist ein KI-Unternehmen, das sich auf emotionale Intelligenz konzentriert und multimodale KI-Technologien entwickelt, die menschliche Emotionen verstehen und auf sie reagieren. Sein Vorzeigeprodukt, Empathic Voice Interface (EVI), ist in der Lage, die Emotionen eines Nutzers zu erkennen und darauf zu reagieren...
vor 10 Monaten
01.6K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: Professionelle Plattform zur Erstellung von Voice-over und kurzen Videokommentaren | Real Person Voice-over | Clone Voice | One-Click into a Film

Umfassende Einführung Magic Voice Workshop ist eine Plattform für Kurzvideos und KI-Synchronisation mit Informationen über Software-Synchronisation, Real-Life-Synchronisation, Sound-Bibliotheken, Klon-Services und mehr. Die Plattform integriert Audiobearbeitung, KI-Kopiererstellung, Videobearbeitung und Kollaborationstools für audiorelevante Dienste und die Erstellung von Inhalten. Benutzer erleben den Audio-Editor...
vor 10 Monaten
01.6K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: KI-generierte Rap-Musik und Plattform zum Klonen von Stimmen | Text to Speech

Allgemeine Einführung Uberduck AI ist eine innovative Plattform, die KI-Synthese von Gesangs- und Sprechstimmen für Kreativagenturen, Musikproduzenten und Programmierer bietet. Die Nutzer können verschiedene musikalische Rhythmen auswählen, Texte mithilfe von KI generieren oder selbst schreiben, bestimmte Sounds auswählen und schließlich Rap-Songs erstellen...
vor 11 Monaten
01.9K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: Audio-/Videoverarbeitungsplattform aus einer Hand|Videoerzeugung|AI Untertitel|Audioextraktion|Speech to Text

Umfassende Einführung Record Cafe ist eine Audio-/Videoverarbeitungsplattform aus einer Hand, die KI-Videodialoge, KI-Untertitel und KI-Sprache-zu-Text-Dienste anbietet. Zu den Funktionen gehören die Aufnahme von Bildschirmen, die Bearbeitung von Videos, die Konvertierung von GIF/Audio usw. und die Unterstützung von Cloud-Speicherung und -Sharing. Die Schnittstelle ist intuitiv und einfach zu bedienen, und es unterstützt auch Multi-Screen-Aufnahme und mehrsprachige intelligente...
vor 8 Monaten
02K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: schnelles und kontrollierbares mehrsprachiges (7000+ Sprachen unterstützt) Text-to-Speech-Tool

Allgemeine Einführung IMS Toucan ist ein modernes Text-to-Speech (TTS) Toolkit, das vom Institut für Maschinelle Sprachverarbeitung (IMS) an der Universität Stuttgart entwickelt wurde. Das Toolkit unterstützt mehr als 7000 Sprachen und ist schnell, kontrollierbar und hat geringe Anforderungen an die...
vor 6 Monaten
01.8K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: ein Spracherzeugungsmodell, das die Stimme eines echten Sprechers imitiert (ChatTTS-Beschleunigungspaket mit einem Klick)

Allgemeine Einführung ChatTTS ist ein generatives Sprachmodell, das für Dialogszenarien entwickelt wurde. Es erzeugt natürliche und ausdrucksstarke Sprache, unterstützt mehrere Sprachen und mehrere Sprecher und ist für interaktive Dialoge geeignet. Das Modell erreicht dies, indem es feinkörnige rhythmische Merkmale wie Lachen, Pausen und Zwischenrufe vorhersagt und steuert,...
vor 6 Monaten
02K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

Umfassende Einführung Easy-Voice-Toolkit ist ein multifunktionales Toolkit, das auf dem Open Source Speech Project basiert und eine breite Palette von automatisierten Audiowerkzeugen für die Spracherkennung, Sprachtranskription, Sprachkonvertierung, Datensatzerstellung und Modelltraining bietet. Benutzer können diese Werkzeuge je nach Bedarf selektiv einsetzen...
vor 11 Monaten
02K
DupDub:AI驱动的视频编辑器|配音|视频翻译|照片数字人

DupDub: KI-gesteuerter Video-Editor|Synchronisation|Video-Übersetzung|Foto-Digitalisierer

Allgemeine Beschreibung Dupdub ist eine seitenlastige Plattform zur Erstellung von Podcasts und Videopräsentationen, die eine Reihe von KI-Tools bietet, um die Kreativität der Nutzer zu unterstützen. Die Funktionen umfassen die Erstellung von Text zu Video, das Angebot von KI-Sprach- und Videosynchronisierungsdiensten sowie Videobearbeitung, Transkription und Untertitelung. Dupdub ist auch ...
vor 12 Monaten
01.8K
TTSMaker:免费的在线文本转语音工具

TTSMaker: kostenloses Online-Werkzeug für Text-to-Speech

Allgemeine Einführung TTSMaker ist ein kostenloses Online-Tool zur Umwandlung von Text in Sprache, das mehr als 100 Sprachen und 300 Sprachstile unterstützt. Benutzer können Text in natürliche und flüssige Sprache umwandeln und Audiodateien für die kommerzielle Nutzung herunterladen. Das Tool eignet sich für die Vertonung von Videos, Hörbüchern, Bildung und Ausbildung...
vor 12 Monaten
02.1K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Generieren Sie digitale, menschlich sprechende Videos mit nur einem Foto, mehrere kostenlose Tools zur Videoerstellung

Allgemeine Beschreibung Vidnoz ist eine kostenlose Plattform zur Erstellung von KI-Videos, mit der Sie in weniger als 1 Minute KI-Videos erstellen können. Keine Kosten, Download oder Erfahrung erforderlich. Die Plattform bietet 500+ KI-Avatare, 470+ realistische KI-Sprachaufnahmen und 500+ Vorlagen. Mit Vidnoz AI Video...
vor 12 Monaten
02.3K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: Native Client für Video zu Untertitel, Konvertierung mehrsprachiger Untertitel

Allgemeine Beschreibung MemoAI ist ein leistungsstarkes Videoübersetzungsprogramm, das Video- und Audiodateien in Text, Untertitel und Notizen umwandelt. Ob es sich um ein YouTube-Video, einen Podcast oder eine lokale Datei handelt, MemoAI kann es mit Leichtigkeit verarbeiten. Es unterstützt mehr als 90 Sprachen wie Chinesisch, Englisch, Japanisch...
vor 8 Monaten
02.4K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

Tencent Smart Shadow: Intelligentes Tool zur Videoerstellung | AI Digital Man, Anime Generation Kit

Umfassende Einführung Tencent Smart Shadow ist eine von Tencent ins Leben gerufene intelligente Online-Videoplattform, die durch leistungsstarke KI-Tools, die von Cloud-Diensten bereitgestellt werden, die Textsynchronisation, die digitale Übertragung von Menschen, die automatische Erkennung von Untertiteln und andere Funktionen unterstützt...
vor 1 Jahr
02.3K
音剪:喜马拉雅自然人声、多人旁白音频创作平台

Sound Clipping: Himalaya's natürliche menschliche Stimme, Plattform zur Erstellung von Audiodateien mit mehreren Sprechern

Umfassende Einführung Himalaya Audio Editor ist eine umfassende AI-Audioerstellungsplattform. Sie bietet leistungsstarke Funktionen, die den Benutzer bei der professionellen Podcast-Produktion, der Mehrspuraufnahme, der Audiobearbeitung und der Umwandlung von Text in Sprache unterstützen. Die Plattform enthält auch mehrere Optionen für professionelle Stimme, die den Benutzern helfen...
vor 1 Jahr
02.2K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: Generierung sprecherspezifischer Text-to-Speech-Modelle aus Eingabetext

Allgemeine Einführung Parler-TTS ist eine Open-Source-Text-to-Speech (TTS)-Modellbibliothek, die von Hugging Face entwickelt wurde, um hochwertige, natürlich klingende Sprache zu erzeugen. Das Modell ist in der Lage, Sprache auf der Grundlage von Eingabetext mit einem bestimmten Sprecherstil (z.B. Geschlecht, Tonhöhe, Sprechstil...
vor 6 Monaten
01.6K