Allgemeine Einführung
MiniMax Audio ist ein KI-Spracherzeugungstool von MiniMax, dessen Hauptfunktion die schnelle Umwandlung von Text in sehr ähnliche natürliche Sprache ist. Es basiert auf dem Modell Speech-02 mit einer Sprachsynthese-Ähnlichkeit von bis zu 99%, Klangqualität in Studioqualität und Unterstützung für über 30 Sprachen und mehrere Akzente. Benutzer können Text eingeben, Dateien oder Links hochladen, um auf einfache Weise Audio zu erzeugen, das sich für die Produktion von Hörbüchern, Podcasts und anderen Inhalten eignet.
Die nationale Version (hailuoai.com) und die internationale Version (minimax.io) haben einen ähnlichen Funktionsumfang, aber die internationale Version konzentriert sich mehr auf die Verarbeitung sehr langer Texte (bis zu 200.000 Zeichen) und bietet außerdem flexible Abonnementpläne. Mit einem täglichen Bonus von 4.000 Credits (etwa 5 Minuten Audiogenerierung) unterstützt die kostenpflichtige Version die kommerzielle Nutzung und mehr Funktionen und ist einfach zu bedienen, was sie bei Kreativen und Entwicklern beliebt macht.
Die nationale Version ist derzeit für eine begrenzte Zeit kostenlos und ohne Nutzungsbeschränkungen.
-
Conch Voice (inländische Version)
-
MiniMax Audio (internationale Version)
Funktionsliste
- Text-to-SpeechTexteingabe, schnelle Erzeugung natürlicher Sprache, Unterstützung mehrerer Sprachen und Töne.
- SprachklonenHochladen von 10 Sekunden Audio, um einen sehr ähnlichen Klang zu reproduzieren.
- Extra lange TextverarbeitungDie internationale Version unterstützt 200.000 Zeichen auf einmal, während die nationale Version auf 5.000 oder 10.000 Zeichen beschränkt ist.
- Unterstützung für Dokumente und LinksLaden Sie eine Datei hoch oder geben Sie eine URL ein, um Text zu extrahieren und Audio zu erzeugen.
- emotionale KontrolleEinstellen der Emotionen der Stimme, wie z.B. glücklich, ruhig (die kostenpflichtige Version unterstützt mehr Optionen).
- mehrsprachige AbdeckungMehr als 30 Sprachen werden unterstützt, die kostenlose Version ist auf 16 beschränkt.
- Verwaltung der GeschichteAnzeigen, Löschen oder Organisieren von generierten Datensätzen.
- API-Integration: Bereitstellung von Entwicklerschnittstellen zur Einbindung anderer Anwendungen.
Hilfe verwenden
MiniMax Audio erfordert keine Installation und funktioniert direkt über das Internet. Die nationalen und internationalen Versionen sind im Grunde das gleiche, hier ist eine detaillierte Anleitung.
Wie man anfängt
- Besuchen Sie die nationale Version unter https://hailuoai.com/audio oder die internationale Version unter https://www.minimax.io/audio.
- Klicken Sie auf "Anmelden", um sich zu registrieren oder melden Sie sich mit Ihrer E-Mail-Adresse an.
- Nach der Anmeldung gelangen Sie auf den Hauptbildschirm, der Texteingabefelder und Funktionsoptionen enthält.
Grundlegende Operationen zur Erzeugung von Sprache
- Eingabe: Geben Sie etwas in das Textfeld ein, z. B. "Willkommen bei MiniMax Audio".
- Sprache und Ton auswählenWählen Sie eine Sprache (z.B. "Chinesisch") und einen Ton (z.B. "Männliche Stimme - tief").
- Audio generierenKlicken Sie auf "Erzeugen" und hören Sie sich die MP3-Datei an oder laden Sie sie in wenigen Sekunden herunter.
- Ansicht VerbrauchDie internationale Version zeigt Credits (1 englisches Zeichen = 1 Punkt, 1 chinesisches Zeichen = 2 Punkte), was mit der nationalen Version übereinstimmt.
Verwendung von Dateien oder Links
- Hochladen von DateienKlicken Sie auf "Datei hochladen", unterstützen Sie TXT, PDF usw., und extrahieren Sie den Text automatisch.
- Link eingebenFügen Sie die URL der Webseite ein und klicken Sie auf "Laden", um den Inhalt abzurufen.
- Prozess der ErzeugungBestätigen Sie den Text und klicken Sie auf "Generieren", um den Ton herunterzuladen.
Funktion zum Klonen von Stimmen
- Vorbereitung der ProbenNehmen Sie mehr als 10 Sekunden klaren Ton auf und speichern Sie ihn als MP3 oder WAV.
- Hochladen und ErstellenUpload in der Option "Stimme klonen" und Klick auf "Stimme erstellen".
- Klonen von AnwendungenWählen Sie den neuen Ton und geben Sie den Text ein, um den Ton zu erzeugen.
- Beschreibung der EinschränkungenDie kostenlose Version ist auf 3 Klone beschränkt, die Starter-Version auf 10 Klone und die Standard-Version auf 100 Klone.
Textlänge und Abspann
- internationale Ausgabe200.000 Zeichen auf einmal, asynchrone Verarbeitung von langen Texten.
- nationale VersionHD-Modus: Der HD-Modus ist auf 5.000 Zeichen begrenzt, der Turbo-Modus auf 10.000 Zeichen.
- Kredite für die internationale VersionMit der kostenlosen Version erhalten Sie 4.000 Punkte pro Tag (etwa 5 Minuten Audio), mit der Starter-Version 100.000 Punkte pro Monat (etwa 2 Stunden) und mit der Standard-Version 1.000.000 Punkte (etwa 20 Stunden).
Abonnements und Aufladungen (Internationale Version)
- kostenlose VersionUngefähr 2,5 Stunden Audio pro Monat, begrenzt auf 16 Sprachen.
- Starter-Ausgabe$5/Monat, ca. 4,5 Stunden, schnellere Erstellung, unterstützt kommerzielle Nutzung.
- Standardausgabe$30/Monat für etwa 22,5 Stunden, mit einer höheren Obergrenze für das Klonen.
- Aufladen (Geld auf eine Karte)$30 pro 1 Million Punkte, $5 Minimum, ohne Abonnement.
API-Verwendung
- Holen Sie sich den Schlüssel: Bewerben Sie sich unter https://www.minimax.io/platform/document/T2AV2 oder auf der inländischen API-Seite, nachdem Sie sich angemeldet haben.
<API Key>
. - Anrufbeispiel::
curl -X POST https://api.minimax.io/audio \
-H "Authorization: Bearer <API Key>" \
-H "Content-Type: application/json" \
-d '{"text": "你好,这是测试", "language": "zh", "voice": "female_gentle"}'
- DateianschriftSiehe den obigen Link für die internationale Version und https://hailuoai.com/api für die nationale Version.
Anweisungen für den Gebrauch
- internationale Ausgabe: Quelle zu kennzeichnen (persönliche Nutzung), kommerzielle Nutzung erfordert ein Starter- oder Standard-Abonnement.
- OptimierungsempfehlungenAnpassen der Klangfarbe oder Segmenterzeugung bei schlechtem Ton.
Es ist einfach zu bedienen und kann in wenigen Minuten in Betrieb genommen werden und eignet sich für eine Vielzahl von Anforderungen.
Anwendungsszenario
- Produktion von Hörbüchern
Konvertieren Sie lange Texte in Audiodateien, um Hörbücher zu erstellen, die Sie weitergeben oder veröffentlichen können. - Podcast-Produktion
Geben Sie Skripte ein, um schnell Podcasts zu erstellen und Aufnahmezeit zu sparen. - Pädagogische Hilfsmittel
Konvertiert Kursmaterialien in Audiodateien, um sie leichter anhören zu können oder Sehbehinderten das Lernen zu erleichtern. - Spielvertonung
Verwenden Sie das Klonen von Stimmen, um einzigartige Stimmen für Ihre Charaktere zu erzeugen und das Erlebnis zu verbessern.
QA
- Was ist der Unterschied zwischen der nationalen und der internationalen Version?
Die internationale Version unterstützt 200.000 Zeichen für sehr lange Texte, während die nationale Version auf 5.000 oder 10.000 Zeichen begrenzt ist, aber für eine begrenzte Zeit kostenlos ist. - Wie lange ist die kostenlose internationale Version gültig?
4.000 Bonuspunkte pro Tag, etwa 5 Minuten Audio, bis zu 2,5 Stunden pro Monat. - Welche Sprachen werden unterstützt?
Mehr als 30 Arten, kostenlose Version beschränkt auf 16 Arten, wie Chinesisch, Englisch, etc. - Wie lang muss das Audiomaterial für das Klonen von Stimmen sein?
Mindestens 10 Sekunden klarer Ton. - Ist sie im Handel erhältlich?
Für internationale Ausgaben ist ein Starter- oder Standard-Abonnement erforderlich; inländische Ausgaben sind nicht ausdrücklich beschränkt.